Re: [sdx-users] z39.50

sdx-users

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-users] z39.50

From:	Frédéric Glorieux
Subject:	Re: [sdx-users] z39.50
Date:	Tue, 05 Jul 2005 01:03:48 +0200
User-agent:	Mozilla Thunderbird 1.0 (Windows/20041206)

Bonjour,

Je suis actuellement stagiaire au CNRS et je travaille sur une
interface commune pour la recherche de documents bibliothécaires dans
différentes bases, et notamment avec le protocole z39.50. Mon maître
de stage s'est orienté vers SDX.


Bon choix, votre maître de stage est une personne éclairée :o)

Je découvre peu à peu son principe et
fonctionnement, en particulier l'indexation des fichiers XML dans les

entrepôts.

L'entrepôt est une notion fluide, par contre, pour XML, c'estincontournable, à un moment ou un autre du process pour entrer dans SDX.

J'ai vu dans la documentation qu'il était écrit : "le
serveur pourra être responsable d'autres tâches, comme par exemple
servir d'interface pour des requêtes faites selon différents
protocoles, tels que Z39.50" mais je ne comprends pas bien le
principe. Est-il question d'une connexion à la base z39.50 et d'une
interrogation de celle-ci (et dans ce cas, à quel niveau se fait cette
connexion - classe Java ?...) ? Par ailleurs j'ai vu qu'il était
possible de créer de nouveaux entrepôts. Est-il possible de créer un
entrepôt z39.50 ? Et est-ce que cela a un intérêt ?

Je ne suis pas connaisseur z39.50, mais si j'avais ce genre de chose àfaire, je commencerai par savoir importer les enregistrements d'une basevers des fichiers XML.

Autrement dit, il vous faut un "XMLiseur" de z39.50, qui n'est pas natifdans SDX. Cette requête laisse croire que le problème n'est pas neuf<http://www.google.com/search?q=Z39.50+xml>. Il faut se demander la têtedu XML que l'on veut gérer, pour les transformations (xsl) depublication ou d'indexation. Vous penchez vers quelque chose commeDublin Core <http://dublincore.org/documents/dces/>, MODS<http://www.loc.gov/standards/mods/>, marcxml<http://www.loc.gov/standards/marcxml/>, biblioml<http://www.biblioml.org/dtds/biblioml_030/html/index.html> ?

Au début, je commencerai par moissonner une centaine d'enregistrementsdéposés statiquement en fichiers, me permettant de monter uneapplication dans le genre de sdxtest. Un seul entrepôt, et une seulebase cherchable (au sens SDX) suffisent (c'est testé jusqu'à 12 milionsde documents).

La base est une unité sémantique, elle définit un modèle de recherche(division des champs). On ouvre une autre base quand une collection estconsidérée comme n'étant plus homogène (exemple : une base pour lesnotices d'oeuvres, une base pour les autorités auteurs)

Les entrepôts sont plus des unités physiques, elle permettent d'agrégerune base SQL, des fichiers, avec des URLs distantes (dès lors que l'onsait faire répondre du XML).

Pour le moissonnage de vos serveur z39.50, il faudra je suppose unelogique spécifique pour aller les interroger régulièrement. Peut-êtrepouvez vous trouver de l'inspiration dans les classes SDX dédiées à OAI<http://www.openarchives.org/OAI/openarchivesprotocol.html> ? Si vosserveurs z39.50 savait répondre comme des entrepôts OAI, il y aurait dequoi faire que SDX sache les interroger, et les indexer.


--
Frédéric Glorieux ("AJLSM", <http://ajlsm.com>)

[Prev in Thread]

Current Thread

[Next in Thread]

[sdx-users] z39.50, Alexandre Huet, 2005/07/04
- Re: [sdx-users] z39.50, Frédéric Glorieux <=
  - Re: [sdx-users] z39.50, Alexandre Huet, 2005/07/05
    - Re: [sdx-users] z39.50, Frédéric Glorieux, 2005/07/05
    - Re: [sdx-users] z39.50, Michel Bottin, 2005/07/05
    - Re: [sdx-users] z39.50, Alexandre Huet, 2005/07/13

Prev by Date: Re: [sdx-users] pb de subset (exclude et include)
Next by Date: Re: [sdx-users] z39.50
Previous by thread: [sdx-users] z39.50
Next by thread: Re: [sdx-users] z39.50
Index(es):
- Date
- Thread