|
From: | Pierrick Brihaye |
Subject: | Re: [sdx-users] quelques questions sur l'analyseur |
Date: | Mon, 17 Jan 2005 07:46:43 +0100 |
User-agent: | Mozilla/5.0 (Windows; U; Windows NT 5.1; fr-FR; rv:1.7) Gecko/20040608 |
Salut, Martin Sevigny a écrit :
l'appauvrissement en minuscules, rôle principal de l'analyseur français de SDX, est très mal compris voire perçu par les utilisateurs.Intéressant. Mais: - en quoi les utilisateurs sont-ils conscients de cela ? Comment le savent-ils ?
Ca n'apparaît effectivement pas lors d'une SimpleQuery puisque le processus d'analyse de la requête est masqué. Le cas de figure par excellence est lorsqu'on offre des listes de termes indexés. La perte des diacritiques est visuellement (et intellectuellement) gênante.
- dans la configuration de l'analyseur, si on met keepAccents="true" alors les accents sont conservés
Oui. Pas de pb de ce côté là : un index "conservateur" sera toujours mieux compris... mais donnera moins de résultats car il est par définition plus sélectif.
IMHO, tout cela serait bien mieux assumé si l'appauvrissement se faisait en majuscules où l'on accepte facilement de perdre accents, cédilles et diacritiques de tous acabits.En France! Mais pas dans tous les pays d'expression française. Je connais des endroits où écrire "Ecole" est une faute d'orthographe!
Wow ! Conservateurs :-)Notons que la "gêne" est susceptible de se produire dans d'autres langues : l'allemand met une majuscule aux substantifs, le turc a 2 lettres "i" en minuscules... Bref, on stocke des fautes d'orthographe dans les index.
A+ p.b.
[Prev in Thread] | Current Thread | [Next in Thread] |