sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

RE : RE : [sdx-users] indexation et controle de l'ind ex par un lexique


From: Rasik Pandey
Subject: RE : RE : [sdx-users] indexation et controle de l'ind ex par un lexique ou un thésaurus
Date: Tue, 13 May 2003 19:29:50 +0200

Bonjour,

> d'après ce que j'ai lu sur l'implémentation du thésaurus dans
> SDX, il est 
> possible d'étendre les données indexées ou la requete avec 
> des mots du 
> thésaurus.

>>Oui. Une documentation plus complète sera d'ailleurs disponible d'ici
une ou deux semaines.

> Est-il possible de contrôler les mots indexés en les limitant à ceux
> présents dans un lexique ou un  thésaurus.. ceci afin de 
> garder une certain 
> qualité de l'index.. ? (en fait c'est l'inverse d'une stop-list, une 
> allow-list)

>>Non, SDX ne fait pas ça lui-même, mais c'est relativement facile à
faire.

>>N'oubliez pas que lors de l'indexation, vous avez un langage de
programmation (XSLT, Java) à votre disposition. Par exemple, si vous
avez >>un thésaurus en XML, vous pouvez très bien le charger lors de
l'indexation (<xsl:variable name="th" select="document('thesaurus.xml')/
>>*"/> et "chercher" à l'intérieur du thésaurus vos mots.

>>Si vous êtes inquiet des performances et que vous l'avez à quelque
part sur un serveur, vous pouvez également y accéder par des
>>extensions Java en XSLT ou en faisant une transformation en Java (au
lieu de XSLT) dans votre pipeline d'indexation.


Voyez fr.gouv.culture.sdx.pipeline.FieldExpansionTransformation.java,
les méthodes startElement(), characters(), endElement(), et
expandField() pour des idées!


A bientôt,

Rasik



_______________________________________________
sdx-users mailing list
address@hidden http://mail.nongnu.org/mailman/listinfo/sdx-users





reply via email to

[Prev in Thread] Current Thread [Next in Thread]