[sdx-users] Qu'est ce que SDX ?

sdx-users

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[sdx-users] Qu'est ce que SDX ?

From:	Pierrick Brihaye
Subject:	[sdx-users] Qu'est ce que SDX ?
Date:	Tue, 04 Mar 2003 15:31:45 +0100
User-agent:	Mozilla/5.0 (Windows; U; Win98; fr-FR; rv:1.0.1) Gecko/20020823 Netscape/7.0

Bonjour,

Pour celles et ceux que ça intéresse, voici mes réflexions actuelles surla nature de SDX et donc sur les possiblités d'amélioration et, surtout,sur son positionnement par rapport à d'autres logiciels.

J'espère qu'elle seront matière à débat et ce, d'autant plus que toutn'est pas encore bien clair de mon côté...


Voilà :

1) SDX permet de stocker/mettre à disposition des documents dans desentrepôts (repositories)2) SDX permet de stocker des documents d'indexation dans des jeuxd'index (documentbase). Une mise à disposition de ces documentsd'indexation est possible si on repasse le document dans la XSLd'indexation... mais ce n'est pas très orthodoxe :-)3) SDX permet de stocker/mettre à disposition des documents de résumédans des index pour la présentation de résultats (champs "brief" desdocuments d'indexation). En l'état actuel des choses, ce point estétroitement associé au point 2) à cause/grâce à l'architecture Lucenesous-jacente...4) SDX permet de mettre à disposition des documents préalablement mis enforme grâce aux XSL. Etant donné le mécanisme actuel, on ne peut passtocker ce type de documents : ils sont générés dynamiquement grâce à lasitemap.5) SDX permet de stocker/mettre à disposition des relations entredocuments, qu'ils soient XML ou non. Pour l'instant, seuls trois typesde relations sont possibles : documents originaux, documents attachés etsous-documents.

Mettons tout cela à plat en introduisant un concept générique pour les 4premiers points : les *vues*. Voici ce que ça donne :

1) des vues sur les documents *natifs*. En termes de finalités, çapermet le stockage.2) des vues sur les documents *d'indexation*. En termes de finalités, çapermet l'interrogation.

3) des vues sur des *résumés*. Finalités évidentes.
4) des vues de *diffusion*. Finalités évidentes également.

Réordonnons tout cela :

1) vue native
2) vue cherchable
3) vue de résumés
4) vue de diffusion

Pour le point 1), une XML:DB sait faire ça très bien. SDX apporte toutde même un plus : il sait stocker des documents non-XML.

Pour le point 2), une XML:DB sait aussi le faire mais SDX introduitbeacoup plus de souplesse car une XML:DB postule que l'indexation doitse faire à partir de la structure du document. SDX permet de définir ceque l'on veut, que se soit à partir du document... ou non ! En revanche,pour l'instant, on perd la structure (document à 2,5 dimensions).

Pour le point 3) une XML:DB sait aussi le faire... à condition de poserla bonne requête, ce qui n'est pas forcément pratique en XPath. A vraidire, c'est même très coton ! A noter, que comme on est étroitement liéau point 2), on n'a pas énormément de structure. Dommage !

Pour le point 4), c'est Cocoon qui prend cela en charge. Une XML:DBcomme eXist (http://exist.sourceforge.net/) propose un cadre Cocoon trèssympathique pour gérer ça.

En résumé, SDX va généralement au-delà de ce qui existe (jeu de mots).Il peut arriver qu'il soit en retrait.


Voyons comment on peut améliorer les choses :

1) vue native : bien que l'architecture actuelle soit déjà trèsgénérique, il faudrait pouvoir proposer plus de repositories ; je penseà des repostories CVS ou XML:DB comme le font certains éditeurs XML...du commerce.

2) vue cherchable : il faudrait pouvoir garder de la structure et,idéalement pouvoir stocker les documents dans des entrepôts tout à faitcomparables à ceux qui viennent d'être évoqués, Lucene n'en étant qu'unparmi d'autres.


3) vue de résumés : voir le point 2... qui nous ramène au point 1 :-)

4) vue de diffusion : il faudrait pouvoir générer une vue *statique* desdocuments et... les stocker dans des repositories. Encore une fois, onen revient... au point 1).


Moralité :

- SDX permet de stocker ces vues sur différentes architectures. Plus ily en aura de disponibles, mieux cela sera. Mais ça, on le savait déjà...

- SDX est un système de gestions de vues sur différents types documents,chaque type disposant d'une finalité précise :

1) stockage
2) recherche
3) résumés
4) présentation

- SDX se démarque des autres produits dans le sens où chaque vue estpotentiellement indépendante des autres. Essayez un peu de faire unerecherche SGDB sur un champ qui n'existe pas dans vos données d'originepour voir :-)

Ceci dit, on a selon moi quelques faiblesses de design et ceci, selondeux angles d'attaque :


Premièrement, l'aspect écriture/lecture.

1) vue native : pas de problème réel.

2) vue cherchable : pas de lecture possible nativement. Facile à faireavec une petite manipulation dans la sitemap. Intérêt limité à vrai dire...3) vue de résultats : on a évidemment une possibilité delecture/écriture même s'il faut jongler à cause l'étroite imbricationavec le point précédent. Il faudrait clairement séparer les 2 logiques.4) vues de diffusion : ici manque la possibilité de les écrire, ce quirevient à dire qu'on pourrait les définir *statiquement*. Pas sicomplexe non plus... si on utilise un entrepôt et des relations ad hoc.


Deuxièmement, l'aspect statique/dynamique

1) vue native : les entrepôts URL proposent, par définition, unerésolution dynamique des documents (pour le meilleur et pour le pire),les autres entrepôts sont, toujours par définition, statiques. Bien :-)2) vue cherchable : statique, par définition. Il paraît inconcevable degénérer dynamiquement ces vues en mémoire. Mais bon, pourquoi pas ?C'est ce que fait eXist dans ses recherches de *contenu* (vs. destructure) après tout...3) vues de résultats : statiques dans le sens où elles sont générées aumoment de l'indexation, dynamiques dans le sens où c'est Lucene qui lesfournit à l'exécution des requêtes. IMHO, on peut améliorer...4) vues de diffusion : voir ci-dessus ; on en revient au débatlecture/écriture.

Bien sûr, certaines vues sont intrinsèquement statiques alors qued'autres (moins) sont intrinsèquement dynamiques. J'ai abordé cetteproblématique pour faire de jolis schémas bien symétriques :-)

Voilà où j'en suis. Je suis preneur de tout autre type de vue... et detout commentaire en général.


A bientôt,

--
Pierrick Brihaye, informaticien
Service régional de l'Inventaire
DRAC Bretagne
mailto:address@hidden

[Prev in Thread]

Current Thread

[Next in Thread]

[sdx-users] Qu'est ce que SDX ?, Pierrick Brihaye <=
- RE : [sdx-users] Qu'est ce que SDX ?, Frédéric Glorieux, 2003/03/04
  - Re: RE : [sdx-users] Qu'est ce que SDX ?, Pierrick Brihaye, 2003/03/05
- RE : [sdx-users] Qu'est ce que SDX ?, Martin Sevigny, 2003/03/05
  - Re: RE : [sdx-users] Qu'est ce que SDX ?, Pierrick Brihaye, 2003/03/05
    - RE : RE : [sdx-users] Qu'est ce que SDX ?, Martin Sevigny, 2003/03/05
    - Re: RE : RE : [sdx-users] Qu'est ce que SDX ?, Pierrick Brihaye, 2003/03/05

Prev by Date: RE: RE : RE : [sdx-users] Panier de recherche
Next by Date: RE : [sdx-users] pb avec recherche linéaire (si pr emiers champs laissés vides)
Previous by thread: RE : RE : [sdx-users] titi ET (toto OU tata)
Next by thread: RE : [sdx-users] Qu'est ce que SDX ?
Index(es):
- Date
- Thread