Re: [sdx-developers] LuceneDocumentBase

sdx-developers

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-developers] LuceneDocumentBase

From:	Pierrick Brihaye
Subject:	Re: [sdx-developers] LuceneDocumentBase
Date:	Tue, 19 Nov 2002 12:38:08 +0100
User-agent:	Mozilla/5.0 (Windows; U; Win98; fr-FR; rv:1.0.1) Gecko/20020823 Netscape/7.0

Salut,

Je reviens sur un point qui me paraît important...

Pierrick Brihaye a écrit:

2) la gestion des repository et des connections qui, à mon avis, devrait
être sous la responsabilité des classes appelantes

Pourquoi ne l'ai-je pas fait alors qu'il suffisait de faire uncouper/coller sur :

1) le code d'attribution de la connection
2) le code de fin de connection (clauses finally)

?

Pour une raison simple : en l'état actuel des choses, SDX postule quedocuments et documents attachés se trouvent dans le *même* repository.Cette approche me gêne car :

1) si on met du XML dans une BD, il est plus difficile d'y mettre desimages, voire carrément impossible si on utilise des BD XML (en l'étatactuel de leurs fonctionnalités).2) mes images on vocation à être centralisées, pas mes documents. c'estbizarre, mais c'est comme ça.3) SDX doit être générique et répondre aux besoins des utilisateurs,mêmes les besoins les plus farfelus. Sur ce point, vous pouvez comptersur moi :-)

Il me semble donc très souhaitable que l'on *puisse* balancer lesdocuments attachés dans un autre repository que celui où se trouvent lesdocuments (mais par défaut, on peut postuler qu'on les met dans le mêmerepository). On n'aurait donc pas *une* connection, mais plusieurs. Etlà, pour que ça soit performant, il faudrait utiliser un pool. Et, dansCocoon 2, je ne sais pas (encore) faire :-)

Ces documents attachés posent également un autre problème : le lien eststocké dans l'entrée du/des document propriétaire dans le lookupIndex.

C'est là où ça va poser un problème : comment stocker N id, repository,(base de données), (application), (framework) dans un index Lucene quine suporte pas la hiérarchie comme je l'ai expliqué dans mes messagesprécédents ?


Deux solutions à vue de nez :

1) solution simple on utilise un truc du genre chemin inversé :attacheddocid/attachedocrepository[/attacheddocdb] etc...

2) on n'utilise plus le lookupIndex pour stocker les dépendances. A laplace, on crée un *troisième* index (Lucene pour le moment). Dans cetindex, on stocke :


doc1id, doc1repository, [doc1database], [doc1application], [doc1framework]

et

doc2id, doc2repository, [doc2database], [doc2application], [doc2framework]

Mieux, on ajoute un *type* de relation : pour les documents attachés, çapourrait être "attacheddocument".

Et là, on rejoint une problématique évoquée par Martin : le découpagedes gros documents en parties plus petites. Il suffirait dans ce casd'utiliser un type de relation "ispartof" ou similaire...

Je tiens à préciser que cette approche qui vise a déporter les relationsvers un index dédié ainsi qu'à typer ces relations semble avoir fait sespreuves au MCC dans une application réalisé pour l'Inventaire ;-)). Lefait que cette application tourne sous Access ne remet pas le concept encause IMHO.


A bientôt,

--
Pierrick Brihaye, informaticien
Service régional de l'Inventaire
DRAC Bretagne
mailto:address@hidden

[Prev in Thread]

Current Thread

[Next in Thread]

[sdx-developers] LuceneDocumentBase, Pierrick Brihaye, 2002/11/16
- Re: [sdx-developers] LuceneDocumentBase, Pierrick Brihaye <=
  - RE : [sdx-developers] LuceneDocumentBase, Martin Sevigny, 2002/11/19

Prev by Date: Re: [sdx-developers] RE : Inclusion/exclusion des classes JDBC
Next by Date: RE : [sdx-developers] LuceneDocumentBase
Previous by thread: [sdx-developers] LuceneDocumentBase
Next by thread: RE : [sdx-developers] LuceneDocumentBase
Index(es):
- Date
- Thread