sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-users] z39.50


From: Frédéric Glorieux
Subject: Re: [sdx-users] z39.50
Date: Tue, 05 Jul 2005 01:03:48 +0200
User-agent: Mozilla Thunderbird 1.0 (Windows/20041206)


Bonjour,

Je suis actuellement stagiaire au CNRS et je travaille sur une
interface commune pour la recherche de documents bibliothécaires dans
différentes bases, et notamment avec le protocole z39.50. Mon maître
de stage s'est orienté vers SDX.

Bon choix, votre maître de stage est une personne éclairée :o)

Je découvre peu à peu son principe et
fonctionnement, en particulier l'indexation des fichiers XML dans les
entrepôts.

L'entrepôt est une notion fluide, par contre, pour XML, c'est incontournable, à un moment ou un autre du process pour entrer dans SDX.

J'ai vu dans la documentation qu'il était écrit : "le
serveur pourra être responsable d'autres tâches, comme par exemple
servir d'interface pour des requêtes faites selon différents
protocoles, tels que Z39.50" mais je ne comprends pas bien le
principe. Est-il question d'une connexion à la base z39.50 et d'une
interrogation de celle-ci (et dans ce cas, à quel niveau se fait cette
connexion - classe Java ?...) ? Par ailleurs j'ai vu qu'il était
possible de créer de nouveaux entrepôts. Est-il possible de créer un
entrepôt z39.50 ? Et est-ce que cela a un intérêt ?

Je ne suis pas connaisseur z39.50, mais si j'avais ce genre de chose à faire, je commencerai par savoir importer les enregistrements d'une base vers des fichiers XML.

Autrement dit, il vous faut un "XMLiseur" de z39.50, qui n'est pas natif dans SDX. Cette requête laisse croire que le problème n'est pas neuf <http://www.google.com/search?q=Z39.50+xml>. Il faut se demander la tête du XML que l'on veut gérer, pour les transformations (xsl) de publication ou d'indexation. Vous penchez vers quelque chose comme Dublin Core <http://dublincore.org/documents/dces/>, MODS <http://www.loc.gov/standards/mods/>, marcxml <http://www.loc.gov/standards/marcxml/>, biblioml <http://www.biblioml.org/dtds/biblioml_030/html/index.html> ?

Au début, je commencerai par moissonner une centaine d'enregistrements déposés statiquement en fichiers, me permettant de monter une application dans le genre de sdxtest. Un seul entrepôt, et une seule base cherchable (au sens SDX) suffisent (c'est testé jusqu'à 12 milions de documents).

La base est une unité sémantique, elle définit un modèle de recherche (division des champs). On ouvre une autre base quand une collection est considérée comme n'étant plus homogène (exemple : une base pour les notices d'oeuvres, une base pour les autorités auteurs)

Les entrepôts sont plus des unités physiques, elle permettent d'agréger une base SQL, des fichiers, avec des URLs distantes (dès lors que l'on sait faire répondre du XML).

Pour le moissonnage de vos serveur z39.50, il faudra je suppose une logique spécifique pour aller les interroger régulièrement. Peut-être pouvez vous trouver de l'inspiration dans les classes SDX dédiées à OAI <http://www.openarchives.org/OAI/openarchivesprotocol.html> ? Si vos serveurs z39.50 savait répondre comme des entrepôts OAI, il y aurait de quoi faire que SDX sache les interroger, et les indexer.

--
Frédéric Glorieux ("AJLSM", <http://ajlsm.com>)





reply via email to

[Prev in Thread] Current Thread [Next in Thread]