sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-developers] SDX et les TermVectors de Lucene


From: Pierrick Brihaye
Subject: Re: [sdx-developers] SDX et les TermVectors de Lucene
Date: Mon, 12 Jul 2004 09:20:33 +0200
User-agent: Mozilla/5.0 (Windows; U; Win98; fr-FR; rv:1.6) Gecko/20040113

Salut,

Martin Sevigny a écrit :

Lucene permet de stocker, pour un champ, les "TermVector".  Voir
http://www.mail-archive.com/address@hidden/msg06590.html
par exemple.

Ou, par exemple :
http://jakarta.apache.org/lucene/docs/fileformats.html

Term Vectors. For each field in each document, the term vector (sometimes 
called document vector) is stored. A term vector consists of the term text, 
term frequency and term position.

Pour ce faire, il faudrait ajouter un paramètre aux champs pour indiquer
qu'on veut les TermVector. Je propose:

<sdx:field name="toto" sotreTermVector="true|false"...>

Si c'est "storeTermVector", ça me va...

Par ailleurs, on pourrait hériter cette propriété de <sdx:fieldList/> ou
<sdx:documentBase/>, qui fixeraient ainsi une valeur par défaut qui
pourrait ensuite être modifiée aux niveaus plus bas. Mais je me demande
si ça vaut vraiment la peine, je crois que c'est une réflexion à mener
au niveau du champ, ce n'est pas très global.

Gros dilemne ici. A priori, le scope est effectivement le champ mais je me demande si un utilisateur ne voudra pas tirer le bénéfice sur toute son appli (ou, plus précisément, partout où on peut avoir une fieldList).

M'enfin. Au niveau du champ, ça serait déjà pas mal. Attendons le testcase qui nous fera changer d'avis ?

A+

--
Pierrick Brihaye, informaticien
Service régional de l'Inventaire
DRAC Bretagne
mailto:address@hidden
+33 (0)2 99 29 67 78




reply via email to

[Prev in Thread] Current Thread [Next in Thread]