sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[sdx-developers] RE : Métadonnées systèmes


From: Martin Sévigny
Subject: [sdx-developers] RE : Métadonnées systèmes
Date: Thu, 13 Jun 2002 08:52:29 +0200

Bonjour,

> >Si on postule que ce format est le cœur de SDX, alors nous
> n'avons pas
> >besoin d'autre moteur de recherche que Lucene car celui-ci
> le fait très
> >bien.
>
> La réponse est claire et pertinente. Dans ce cas, getFields
> n'a pas sa place dans indexableDocument... ou alors, on
> réserve ces documents à Lucene.

Le commentaire est juste et pertinent. On pourrait le reformuler en
disant que "IndexableDocument" signifie "un document indexable selon
l'approche SDX/Lucene", mais ça ne change pas le problème de fond.

> OK. Je vois. Là encore on touche à un postulat de SDX (en
> tout cas, ça l'était pour moi) : l'unité atomique n'est plus
> forcément le document. C'est intéressant, mais jusqu'où ça va
> nous mener ? :-))

C'est effectivement une bonne question. Je résumerais ainsi ma position.

A) Les développements _prévus_ pour SDX 2 ne remettent pas en cause les
postulats de base de SDX, notamment le fait que l'utilisation de la
structure se fait a priori, que la recherche se fait dans une collection
de champs, que le document XML est l'unité documentaire, que les
résultats sont linéaires, etc.

B) La nouvelle architecture de SDX essaie d'être plus souple, notamment
dans le but d'anticiper les évolutions futures.

L'articulation des classes des package sdx.documentbase et sdx.document
réflète ces deux points. En particulier le package sdx.documentbase, où
l'interface DocumentBase, implantée par la seule classe
LuceneDocumentBase, est définie de façon un peu arbitraire, sans savoir
exactement ce que pourraient être d'autres types d'outils de recherche.

Personnellement, je suis à l'aise avec cette position, mais ça ne me
gène pas non plus d'implanter l'approche de Pierrick où cette généralité
n'est pas définie par une classe spécifique mais plutôt par une seule
classe qui utilise un gestionnaire d'index de recherche spécifique (à
Lucene par exemple). J'ai vaguement l'impression que les deux approches
sont équivalentes en intérêt.

Je précise aussi que toutes les classes reliées aux requêtes de
recherche et à leurs résultats ont été placés dans un package propre à
Lucene. Si jamais on pense que ces classes sont plus génériques (par
exemple les résultats...) il faudra les mettre ailleurs.

A bientôt,

Martin Sévigny




reply via email to

[Prev in Thread] Current Thread [Next in Thread]