sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

RE : [sdx-users] indexation et controle de l'index pa r un lexique ou u


From: Martin Sevigny
Subject: RE : [sdx-users] indexation et controle de l'index pa r un lexique ou un thésaurus
Date: Mon, 12 May 2003 07:14:11 +0200

Bonjour,

> d'après ce que j'ai lu sur l'implémentation du thésaurus dans 
> SDX, il est 
> possible d'étendre les données indexées ou la requete avec 
> des mots du 
> thésaurus.

Oui. Une documentation plus complète sera d'ailleurs disponible d'ici
une ou deux semaines.

> Est-il possible de contrôler les mots indexés en les limitant à ceux 
> présents dans un lexique ou un  thésaurus.. ceci afin de 
> garder une certain 
> qualité de l'index.. ? (en fait c'est l'inverse d'une stop-list, une 
> allow-list)

Non, SDX ne fait pas ça lui-même, mais c'est relativement facile à
faire.

N'oubliez pas que lors de l'indexation, vous avez un langage de
programmation (XSLT, Java) à votre disposition. Par exemple, si vous
avez un thésaurus en XML, vous pouvez très bien le charger lors de
l'indexation (<xsl:variable name="th"
select="document('thesaurus.xml')/*"/> et "chercher" à l'intérieur du
thésaurus vos mots.

Si vous êtes inquiet des performances et que vous l'avez à quelque part
sur un serveur, vous pouvez également y accéder par des extensions Java
en XSLT ou en faisant une transformation en Java (au lieu de XSLT) dans
votre pipeline d'indexation.

A bientôt,

Martin Sévigny





reply via email to

[Prev in Thread] Current Thread [Next in Thread]