sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-developers] Une base de documents sans entrepot?


From: Martin Sevigny
Subject: Re: [sdx-developers] Une base de documents sans entrepot?
Date: Fri, 16 Jul 2004 13:57:46 +0200
User-agent: Mozilla Thunderbird 0.6 (Windows/20040502)

Salut,

Ah, je vois ce que tu veux dire dire. Pour moi ce n'est pas une dépendance, c'est un "scope", il n'est pas visible pour les autres...


Joli :-) Bon, ben... dans ce cas, je préférerais le scope inverse :-)

Scope inverse?

Non, pas du tout, j'ai peut-être oublié de dire un point important, mais si on n'a pas d'entrepôt, alors il ne faut pas demander à SDX d'aller chercher le document!


... et Candide de poser 2 questions :

1) A quoi ça sert alors ?

;-)

Deux cas de figure:

1) On a une application avec plus d'un million de documents indexés dans SDX, mais on n'a jamais besoin de retourner dans l'entrepôt, de revoir les documents, car toute l'info est dans des champs SDX. Inutile de dire que les documents sont très simples...

2) On aura une autre application où cette fois on a besoin de retrouver les documents, mais qui sont en fait des enregistrements dans une base de données relationnelle. Il y en aurau autour de 8 millions dès le départ. Ici, seul l'ID est nécessaire pour construire le document, et on ne veut pas stocker du XML car c'est inutile. Donc pas besoin de passer par un entrepôt.

Dans les deux cas, le plus simple (actuellement) est de prendre un entrepôt URL et de ne pas s'en servir. Mais ça fait tout de même un lookup de très gros pour rien, avec tout ce que ça entraîne...

Je me plaçais dans un cas de figure plus particulier où un "document" (i.e. un truc qu'on veut indexer et donc rechercher) serait un montage plus complexe : enregistrement de BD, images dont on extraierait les vecteurs "significatifs", document dont l'URL varie en temps réel... Bref, un truc qui introduit toute la variabilité possible dans la notion même de document.

Intéressant, mais même pour cela pourquoi ne pas utiliser un entrepôt spécifique? Il reçoit un ID et à lui de reconstituer le XML nécessaire pour SDX...?

Martin Sévigny





reply via email to

[Prev in Thread] Current Thread [Next in Thread]