sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

RE : [sdx-users] indexation et Lucene


From: Martin Sevigny
Subject: RE : [sdx-users] indexation et Lucene
Date: Wed, 7 May 2003 07:53:09 +0200

Bonjour,

> > les termes dans les 
> > différents champs ne sont pas tous mis dans un dictionnaire 
> global de 
> > l'index mais à chaque champs correspond un dictionnaire 
> propre. C'est ca ?
> 
> Non :
> 
> Issu de http://jakarta.apache.org/lucene/docs/fileformats.html
> 
> > Term dictionary. A dictionary containing all of the terms 
> used in all of the indexed fields of all of the documents. 
> The dictionary also contains the number of documents which 
> contain the term, and pointers to the term's frequency and 
> proximity data.
> 
> Il faut ajouter que ce dictionnaire est associé à un 
> "segment". Si vous 
> avez N segments, vous avez N dictionnaires. Si vous n'en voulez plus 
> qu'un... fusionnez les segments ou, mieux, laissez SDX le faire :-)

On peut le voir comme cela, mais c'est une vision très "programmeur"!
SDX (et aussi Lucene, très facilement) vous expose le contenu des
différents de manière indépendante (seuls les termes d'un champ dans une
liste, pas tous les termes de tous les champs). Voir sdx:terms.

Martin Sévigny





reply via email to

[Prev in Thread] Current Thread [Next in Thread]