sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[sdx-developers] RE : documentbase


From: Martin Sévigny
Subject: [sdx-developers] RE : documentbase
Date: Mon, 10 Jun 2002 19:33:30 +0200

Bonjour,

> 1) elle délègue le stockage du document au repository ad hoc

Ad hoc? C'est-à-dire? En fait, lorsqu'on indexe (ajoute...), on doit
dire à la DB quel repository utiliser.

> Pour moi, cet index interne pourrait s'appeler "métadonnées 
> système". On 
> pourrait y trouver le timestamp de l'ajout, de la modif, de la 
> suppression (?), de la dernière indexation... Pour cette dernière 
> métadonnée, ça serait très pratique pour organiser une 
> (ré)indexation en 
> tâche de fond...

C'est l'idée générale.

> Là où ça change c'est, sur le stockage de l'index et sur le 
> stockage des 
> métadonnées système qui sont dépendants des architectures 
> sous-jacentes.
> 
> Aussi, je me demande on ne ferait carrément pas mieux de 
> concevoir une 
> interface SearchIndexManager avec une classe LuceneSearchIndexManager.

Je ne comprends pas. C'est déjà le cas avec Database et LuceneDatabase,
non? Si tu veux stocker des métadonnées en MySQL, alors tu développes
une classe MySQLDatabase qui implante Database. Ensuite on permet de
configurer (dans app.xconf) quel type de gestionnaire de métadonnées
utiliser. Ce n'est pas suffisant?

Je ne sais pas si tu veux unifier la recherche documentaire effectuée
avec Lucene avec la gestion de métadonnées gérée par l'interface
Database, mais pour moi ça ne devrait pas. Dans le deuxième cas, on n'a
pas besoin d'analyses de mots, de champs word, etc.

> Du coup, la DocumentBase rédeviendrait générique et on n'aurait plus 
> besoin de l'interface et de la classe abstraite.

SDX est un outil de recherche, et la DocumentBase est justement ce lieu
qui est cherchable. Pour l'instant, le seul moteur de recherche est
Lucene, mais éventuellement il y en aura d'autres. D'où l'idée de
l'interface et de la classe abstraite.

Par exemple, il sera assez facile d'ajouter une classe XMLDBDocumentBase
qui fera des recherches Xpath dans un entrepôt de type XMLDB. Un jour
qu'il y aura un bon moteur XMLQuery, on l'implante, etc. Et SDX peut
donc intégrer différents moteurs de recherche, l'élément commun étant
justement cette interface DocumentBase.

Est-ce que ça justifie correctement l'interface et la classe abstraite?

> Je crois franchement qu'un tel redéploiement est stratégique et opère 
> une avancée notable par rapport à SDX 1. Ca permet, pour ceux que ça 
> intréssarait, davoir ses documents sur un filesystem, ses métadonnées 
> dans MySql et son index sur un répertoire Lucene.

L'architecture actuelle est justement prévue pour cela. Je ne comprends
pas ce qui manque (à part des trucs à implanter).

A bientôt,

Martin Sévigny




reply via email to

[Prev in Thread] Current Thread [Next in Thread]