sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[sdx-users] best practice - step one !


From: maisonneuve nico
Subject: [sdx-users] best practice - step one !
Date: Sun, 11 May 2003 13:25:02 +0000




From: Frédéric Glorieux <address@hidden>
Reply-To: address@hidden
To: <address@hidden>
Subject: RE : [sdx-users] Manque de Documentation
Date: Sun, 11 May 2003 10:13:54 +0200

> 1- qu'apport SDX de plus que Lucene en terme d'indexation et de
requête (à
> part thésaurus)

D'abord, un environnement,
 - accéder aux résultats directement en XML (XSP+taglib)
 - gestion des documents.
 - indexation en XSL avec des processus de pipeline

Sur l'indexation elle-même, les champs dates ont été étendus pour les
dates avant 1970. Certaines requêtes ont été affinées. Je laisse à
d'autres d'en préciser plus.

> lister les plus connues types/ procédures d'indexation possibles
> et de voir ce que SDX (en fait Lucene.. hmm) est capable

        Pour l'indexation, je comprends mal la question. Cocoon propose
par exemple une implantation de Lucene qui pour chaque nœud fait un
champ. Là, on peut peut-être parler d'une manière d'indexer. Pour SDX,
le document d'indexation (<sdx:document id=""><sdx:field ...) résulte
d'une transformation XSL. En conséquence, cela tient à une réflexion
documentaire. Définir le type d'indexation SDX me semble aussi difficile
que de classer toutes les présentations possibles d'un document XML.
        On peut tout au plus dégager quelques habitudes communes à
plusieurs applications, et des bonnes pratiques. Exemples de liste de
champs

default, word - champ plein texte par défaut d'indexation mot (type
google)

    des champs genre Dublin Core

title word - (pour recherche libre)
title field - (pour tri)
creators word - (auteurs chaînés)
creator field - (chaque auteur, pour tri ou "liens tarzan")

liens tarzan ??

subjects word - (tous les sujets chaînés, pour la recherche libre)
subject field - (chaque sujet, pour tri ou requête exacte)
date date - (création, il existe un champ sdx par défaut pour dernière
indexation)
abstract word - (recherche, et présentation de résultats brefs)
type field - (type de document)
language field -
geo field - (localisation géographique, parfois)


ha.. chouette j'ai déjà une réponse à une autre question que je me posais .. pourquoi dans XtoGen(application generant une aap SDX) ,pour un même champs , il y avait 2 champs créer : un field, un word

oui, oui ce côte "best practice" est justement le genre d'info que je recherche ! comme moi, je pense que pas mal de personnes ne sont dans le domaine documentaire et ce genre d'info, peut-être bidon pour vous, ne le sera pas pour nous

nico

_________________________________________________________________
MSN Search, le moteur de recherche qui pense comme vous ! http://search.msn.fr/worldwide.asp





reply via email to

[Prev in Thread] Current Thread [Next in Thread]