sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-developers] documentbase


From: Frédéric Glorieux
Subject: Re: [sdx-developers] documentbase
Date: Tue, 11 Jun 2002 13:10:16 +0200

    Bien que je ne puisse y contribuer, je voulais d'abord souligner
l'intérêt formateur de vos discussions sur le partage conceptuel des métodes
entres bases et dépôts. De plus, je souhaitais attirer l'attention sur une
remarque de Pierrick à propos de l'arborescence "conf" d'une application,
qui pour un auteur d'application, permet de plus facilement concrétiser vos
conclusions.

<< A ce propos, dans l'appli sdxworld, j'ai :
sdx
- sdxworld
-- conf
--- dbs
---- apps
----- documents
------_lucene
------- doc
----- sdx-repo-index
----- sdx-search-index
--- users
-- css
-- documents
-- xsl
>>

    Si je crois comprendre, à chaque base correspond un "sdx-search-index" -
OK. On pourrait brancher un index mysql (j'ai cru en voir tourner un en
PHP), par contre, je vois mal ce que contiendrais ce répertoire en cas de
recherche Xpath (ou Xquery).

    On trouve aussi un "sdx-repo-index". Je le suppose utile pour une
correspondance "sdxdocid-repository" auquel je rattache cette remarque de
Pierrick
    << Pour moi, cet index interne pourrait s'appeler "métadonnées système".
On
pourrait y trouver le timestamp de l'ajout, de la modif, de la
suppression (?), de la dernière indexation... Pour cette dernière
métadonnée, ça serait très pratique pour organiser une (ré)indexation en
tâche de fond... >>
    L'utilisateur pourra-t-il avoir accès à ces champs ? Pourrait-il s'en
définir pour lui ? Pour une application édition/diffusion, les méta-données
(last-user, log des modifs ...) n'ont logiquement pas grand chose à voir
avec l'indexation du document lui-même. J'ai peur de poursuivre dans ce
sens, car il me faudrait alors de l'info de config comme pour
<sdx:userDocumentBase/>... mais évitant l'inflation, votre sagacité saura
arrêter une solution.

    Dans le dépôt fichier, on trouve encore un index Lucene, je le suppose
nécessaire pour le rendre aussi intelligent qu'un SQL ou Lucene. On a a déjà
beaucoup parlé, ce "FSR" risque de décevoir l'utilisateur qui espérait un
bidule ou on met ses fichiers à la main comme on veut, et puis sdx s'occupe
de réindexer dès que ça change. Aussi je me pose 2 questions
    Ne vaudrait-il pas mieux un "repository" Lucene par défaut ? (Les
fichiers attachés seraient supportés lorsque Lucene stockera du binaire).
    Un dépôt URL aura-t-il des robots d'exploration par défaut (HTML:<a
href=""/>, XML:<xlink/>, file://:*.xml), et des robots de mise-à-jour (ex:
check links each day and index if changes) ?

    SDX ne touchera pas tout de suite le "cliqueur", mais qu'au moins le
"baliseur" soit bien servi.




reply via email to

[Prev in Thread] Current Thread [Next in Thread]