sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[sdx-users] Ressemblance?


From: Emmanuel Bégué
Subject: [sdx-users] Ressemblance?
Date: Mon, 10 Mar 2003 23:20:22 +0100

Bonjour,

On étudie la possibilité de construire une solution documentaire
globale autour de SDX; apparemment il remplit la plupart des
critères, surtout grâce aux fonctions de thesaurus.

La fonction de panier de recherche sera également un plus, le
cas échéant, mais quoi qu'il en soit elle ne sera pas
spécialement difficile à développer à l'extérieur de SDX si
nécessaire.

Par contre, la brique manquante est l'enrichissement manuel
des documents avant l'indexation, justement pour associer aux
documents des mots-clé du thesaurus.

SDX n'a certainement pas vocation à être un éditeur XML (et
il en existe d'excellents gratuits); en revanche, on attend du
système futur (à l'instar du système documentaire actuel) d'être
capable, pour chaque nouveau document, d'effectuer une proposition
de sur-indexation à partir d'une analyse statistique du corpus
existant; en d'autres termes, le système doit pouvoir suggérer
les mots du thesaurus qui conviendraient pour un document non-
indexé, à partir des documents présents dans l'index (et qui ont
fait l'objet d'une sur-indexation manuelle).

Peut-on envisager une fonction similaire dans SDX?

Une façon de l'implémenter pourrait être de rechercher dans
le corpus les documents qui "ressemblent" le plus au document
en cours; si par exemple il existait un "coefficient de
ressemblance" (c) il suffirait de rechercher 10 premiers documents
du corpus dont le coefficient de ressemblance est supérieur
à c=telle valeur, et d'extraire les mots-clé des documents
trouvés pour les suggérer pour le document en cours. (Il s'agit
bien de suggérer: le documentaliste choisit de retenir la
suggestion ou non).

=> quelles sont vos réactions?

En vous remerciant,
Cordialement,
EB





reply via email to

[Prev in Thread] Current Thread [Next in Thread]