sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [sdx-users] quelques questions sur l'analyseur


From: Pierrick Brihaye
Subject: Re: [sdx-users] quelques questions sur l'analyseur
Date: Mon, 17 Jan 2005 07:46:43 +0100
User-agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; fr-FR; rv:1.7) Gecko/20040608

Salut,

Martin Sevigny a écrit :

l'appauvrissement en minuscules, rôle principal de l'analyseur français de SDX, est très mal compris voire perçu par les utilisateurs.

Intéressant. Mais:

- en quoi les utilisateurs sont-ils conscients de cela ? Comment le
savent-ils ?

Ca n'apparaît effectivement pas lors d'une SimpleQuery puisque le processus d'analyse de la requête est masqué. Le cas de figure par excellence est lorsqu'on offre des listes de termes indexés. La perte des diacritiques est visuellement (et intellectuellement) gênante.

- dans la configuration de l'analyseur, si on met keepAccents="true"
alors les accents sont conservés

Oui. Pas de pb de ce côté là : un index "conservateur" sera toujours mieux compris... mais donnera moins de résultats car il est par définition plus sélectif.

IMHO, tout cela serait bien mieux assumé si l'appauvrissement se faisait en majuscules où l'on accepte facilement de perdre accents, cédilles et diacritiques de tous acabits.

En France! Mais pas dans tous les pays d'expression française. Je
connais des endroits où écrire "Ecole" est une faute d'orthographe!

Wow ! Conservateurs :-)

Notons que la "gêne" est susceptible de se produire dans d'autres langues : l'allemand met une majuscule aux substantifs, le turc a 2 lettres "i" en minuscules... Bref, on stocke des fautes d'orthographe dans les index.

A+

p.b.






reply via email to

[Prev in Thread] Current Thread [Next in Thread]