sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[sdx-users] Thesaurus


From: Emmanuel Bégué
Subject: [sdx-users] Thesaurus
Date: Fri, 11 Mar 2005 01:51:03 +0100

Bonjour,

La question du jour: comment construire un thesaurus?

Plus précisément, est-ce que le recours à la notion de
"concept" décrite ici
http://www.nongnu.org/sdx/docs/html/doc-sdx2/fr/reference/actions/thesaurus.
html
et qui ressemble plutôt à un identifiant unique, est
obligatoire, ou est-ce qu'on peut écrire un
thesaurus simplement hiérarchique?

Plus précisément encore, supposons qu'on cherche à
écrire un thesaurus de lemmatisation du français (à
partir des bases disponibles sur lexique.org p. ex.)

On veut par exemple que lorsqu'on cherche la forme
conjuguée d'un verbe, l'application cherche toutes
les formes conjuguées de ce verbe; c'est à dire que,
à partir de la forme conjuguée cherchée, l'application
remonte au lemme (dans le cas d'un verbe, l'infinitif)
et "redescend" vers toutes les autres formes conjuguées
de ce verbe, pour les inclure dans la recherche.

C'est exactement le fonctionnement qui est décrit ici:
http://www.nongnu.org/sdx/docs/html/doc-sdx2/fr/indexation/thesaurus.html
(mais on ne montre hélas pas le thesaurus correspondant).

Pour obtenir cela, quelle doit être la forme du
thesaurus? Doit-on construire une relation "est le
lemme de" ou bien "a pour lemme", ou bien les deux?

Autrement dit, doit-on lister:
- chaque terme de bas niveau et en regard le terme de
  niveau supérieur auquel il appartient
- ou bien chaque terme de niveau supérieur et pour
  chacun, tous les termes de bas niveau qui en dépendent
- ou les deux?

Un exemple serait très intéressant, par exemple qui
correspondrait à la relation
        Patrimoine => Architecture => Eglise
qui est décrite dans le lien ci-dessus.

Cdt,
EB


PS: bien sûr, par rapport à ce qui a été dit mardi, ce
thesaurus une fois construit sera à la disposition de
qui veut et/ou de l'ADNX.





reply via email to

[Prev in Thread] Current Thread [Next in Thread]