sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[sdx-users] entrepôts URL


From: Emmanuel Bégué
Subject: [sdx-users] entrepôts URL
Date: Tue, 4 Mar 2003 11:16:25 +0100

Bonjour,

Merci de ces nouvelles informations.

Je réponds à la question des entrepôts URLs. J'ai bien noté ce que
vous décrivez dans votre message (ci-dessous) mais cela me pose
quand même les trois problèmes suivants:

a) je ne parviens pas à "voir" l'url effectivement stockée dans
l'entrepôt url; le seul test pour savoir si j'ai correctement
renseigné l'attribut "base" est de faire un sdx:includeDocument
et de voir si ça marche ou pas, ce qui est peu pratique lorsqu'on
indexe sur quatre machines différentes, deux OS différents, et une
arborescence de fichiers différente

b) indexant sur plusieurs machines, je commets inévitablement des
erreurs (la principale étant d'oublier de modifier application.xconf
avant de lancer l'indexation): pouvoir revenir sur l'entrepôt url
après coup serait donc un "plus" important

c) une façon d'indexer plus rapidement consiste à copier le nombre
de fichiers correspondant _exactement_ à maxBatch dans un répertoire
spécial, et d'indexer ce répertoire, ce qui optimise assez fortement
la durée d'optimisation des index; mais si on fait ça on perd
l'information sur l'url; cette information étant structurée
(base/yy/mm/dd/file) elle serait très facile à reconstruire après
coup si c'était possible (c'est d'ailleurs ce que je fais dans la
xsl d'affichage, mais en me privant des fonctions includeDocument
que sont le highlight, etc)

Voilà, tels sont mes problèmes... ;-)

Cordialement,
EB



> -----Message d'origine-----
> De la part de Martin Sevigny
> Envoyé : mardi 4 mars 2003 11:00


> Votre exemple (modifier les URL) et ce que vous nous avez déjà dit sur
> le fait que vous n'utilisiez pas d'entrepôt (en fait vous n'en avez pas
> besoin) m'incitent à répéter une particularité intéressante des
> entrepôts URLs.
>
> SDX ne stocke pas nécessairement l'URL complète (absolue) des documents,
> il peut aussi stocker l'URL relative à une certaine base. Si, par
> exemple, vos documents sont tous situés à quelque part sous
> http://www.monserveur.com/mesdocuments/ (ou file:///usr/local/docs/,
> c'est pareil), vous pouvez déclarer un entrepôt URL ainsi:
>
> <sdx:repository type="URL"
> base="http://www.monserveur.com/mesdocuments/";>
>   <sdx:database type="HSQL"/>
> </sdx:repository>
>
> Dans ce cas, lorsqu'on ajoute à cet entrepôt, par exemple, un document
> dont l'URL est http://www.monserveur.com/mesdocuments/doc1.xml, alors
> SDX mettra dans son "lookup" la valeur "doc1.xml". Ainsi, si un jour
> vous déplacez vos documents dans
> http://www.monserveur.com/mesnouveauxdocuments/, vous n'aurez pas besoin
> de réindexer, vous aurez juste à:
>
> - modifier le application.xconf pour mettre
> base="http://www.monserveur.com/mesnouveauxdocuments/";
> - reconfigurer votre application (interface d'admnistration) ou
> redémarrer Tomcat/SDX
>
> Evidemment, cela suppose que sous votre URL de base, les documents
> restent organisé de la même façon. Donc si par "modifier les URLs" vous
> pensez à ce genre de manipulations (par exemple déplacer vos 20000
> fichiers XML ailleurs sur votre disque), vous pouvez peut-être
> bénéficier des entrepôts SDX ;-)
>
> Si c'est autre chose, peut-être que quelqu'un d'autre va bénéficier de
> ces explications...
>
> A bientôt,
>
> Martin Sévigny
>
>
>
> _______________________________________________
> sdx-users mailing list
> address@hidden
> http://mail.nongnu.org/mailman/listinfo/sdx-users
>





reply via email to

[Prev in Thread] Current Thread [Next in Thread]