[Top][All Lists]
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
RE : [sdx-developers] Re: [sdx-users] existe-t-il des applicationspubliq
From: |
Rasik Pandey |
Subject: |
RE : [sdx-developers] Re: [sdx-users] existe-t-il des applicationspubliques SDX utilisantlethesaurus |
Date: |
Thu, 17 Jun 2004 10:54:07 +0200 |
Bonjour,
> Je tiens à élargir cette question un peu:
> Le thésaurus qui est implémenté dans SDX charge tout le
> thésaurus en
> mémoire. Le thésaurus est présent comme fichier XML,
> ce qui est pratique pour des thésaurus de taille modeste.
On lit le fichier XML, et on le découpe pour avoir des sdx:concepts qui
pourraient aussi avoir des enfants (sous-documents "sdx:concept") qu'on indexe
dans une base de documents/thesaurus (LuceneThesaurus).
> Mais ...
> supposons par exemple que l'on désire indexer et limiter
> certains champs par
> un thésaurus comme le AAT, voire pire: un AAT qui est
> traduite en 6 langues. Ou un thésaurus de taille plutôt limité,
> mais avec
> des traductions en 10 langues, dont les équivalences peuvent
> être formulé comme 'inexacte, simple-multiple, partielle', etc.
> Donc:
> Supposons qu'on voudrait utiliser système alternatif de
> stockage et gestion
> de thésaurus.
> Serait il possible de renouer ce thésaurus de façon
> suffisamment profonde
> avec SDX?
Oui sans probleme du coté indexation, du coté recherche, il y a du travail à
faire:
Une échange entre moi et Pierrick la semaine derniere:
-----------------------------------------------------
Pierrick:
> Par ailleurs, je me demande qans quelles mesure ont ne pourrait as
> ajouter ses propres relations, celles de Wordnet par exemple ;-
> )
>
> Vos idées ?
Rasik:
Rien ne t'empêche à les créer mais il faut les ajouter également à ton
sdx:fieldList dans ton application.xconf. Dans les méthodes spécifiques de
SDXThesaurus.search (String term), il faudrait ajouter un moyen dynamique de
interroger ces nouveaux champs( Vois LuceneThesaurus.search())...
--------------------------------------------------------
> Si on crée des classes qui se conforment à
> public interface Thesaurus / public interface SDXThesaurus
>
> sans que SDX devrait savoir comment ces classes implémentent
> ces méthodes
> (donc, d'où viennent les termes, les relations ...) ...
Un SDXThesaurus et qu'une base de documents (qui gerer les sous-documents).
Est-ce une base de document n'est pas assez pour gerer ton cas? Le
taglib/logicsheet traite un "SDXThesaurus" comme une base de documents.
> Quelles seraient les modifications à faire dans (un futur) SDX?
> Ca ne
> devrait pas avoir un formidable impacte, oui?
Il suffit de créer/surcharger SDXThesaurus pour le faire tourner avec SDX. On
pourrait aussi rendre le code de SDX plus generique car il me semble que tes
besoins sont assez generique.
> Et, si certaines braves utilisateurs et développeurs y
> apporteraitent
> volontiers leurs petits efforts?
Donnez-nous plus de détails...
A bientôt,
Rasik