sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

RE : [sdx-users] FAQ et introduction au domaine de la RI


From: Frédéric Glorieux
Subject: RE : [sdx-users] FAQ et introduction au domaine de la RI
Date: Mon, 5 May 2003 16:31:14 +0200

C'est une excellente idée !

        Comment écrivez-vous votre rapport de stage? Pour ce qui nous
concerne du xml docbook serait directement utilisable.

        Pour la faq un <qandaset/> avec des divisons serait très bien.
Le problème à régler concernera les liens avec d'autres pages.
Il y a un choix à faire, soit avec des <olink/> (avec une base
d'entités), soit avec des <ulink/> relatifs, ce qui demande à fixer un
peu le plan de la doc. Martin aura certainement son idée sur la chose. 

        A chaud j'y verrais les divisions suivantes

1) Qu'est-ce que c'est ?
2) Qu'est-ce que ça n'est pas ?
3) Installation (war, jar, CVS; "supprimez votre répertoire work et
redémarrer tomcat")
4) Requêtes (plein-texte/SQL, plein-texte/xPath, simple/field/complex,
date)
5) Indexation (a priori/a posteriori)
6) DB:XML/SDX (si quelqu'un se collait à nous en faire marcher une
install...)
7) XSL (ce n'est pas le lieu mais bon, ce serait du service en français)

8) Divers (il faut toujours un tiroir à bordel, et j'ai déjà un truc à y
dire sur 

        Une autre page d'intérêt général serait une biblio-web
(<docbook:bibliography/>), avec des liens expliqués. Celle-là serait
référencée mais n'aurait pas à pointer, vous pourriez la commencer sans
attendre, et elle pourrait figurer directement dans votre rapport. J'y
vois déjà les divisions suivantes

1) liens SDX (download, docs, listes...)
2) XSL (doc, listes, exemples...)
3) Cocoon (un guide en français de leur doc peut être bien utile)
4) Lucene (en particulier la syntaxe de requête)
5) Les références que vous trouveriez sur la "RI"

        Je ne suis pas sûr de bien comprendre votre concept de "RI", par
contre je rencontre souvent le besoin de préciser ces notions sur la
modélisation de l'information (et donc de sa recherche)

table       (SQL une table, Lucene champs non répétables, Excel ...)
champs      (champs Lucene répétable, XML plat, vCard, marc ...) 
arbre       (XML/xPath, système de fichiers ...)
relationnel (SQL tables croisées)
texte       (brut, xsl:contains(., 'mot'); regexp; indexé (parseur);)
spatial     (coordonnées et figures d'inclusion)

Avec Lucene, SDX combine champs et texte. Le relationnel n-n est
simulable mais pas optimal. Le hiérarchique pose des problèmes (voir
autres mails), et pour le spatial...







reply via email to

[Prev in Thread] Current Thread [Next in Thread]