sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: RE : RE : [sdx-developers] Intégration à SD X2.2 de la recherche des


From: Pierrick Brihaye
Subject: Re: RE : RE : [sdx-developers] Intégration à SD X2.2 de la recherche des chiffres/nombres dans le texte ?
Date: Thu, 22 Apr 2004 17:39:45 +0200
User-agent: Mozilla/5.0 (Windows; U; Win98; fr-FR; rv:1.0.2) Gecko/20030208 Netscape/7.02

Re,

Rasik Pandey a écrit:

Moi, je suis près à m'investir sur le Tokenizer "universel"
dont j'ai
parlé". Je suis même près à la mettre en licence Apache :-)


:)

L'idée est de plus en plus claire pour moi. Un bon exemple des fonctionnalités à brancher est visible sur ce site :

http://www.fileformat.info/info/unicode/char/0645/index.htm

Les "Unicode Data" et les "Java Properties" me sembleraient d'excellents critères à prendre en compte... ou pas.

Avec, derrière, une config XML, on peut assez vite se monter un jar comprenant pas mal de fichiers de configuration "standards"... ou pas (je vote d'ailleurs pour le PierreDittgenTokenizer.xml :-)

En parlant des contributions, propositions, etc... ça vaut le coup de suivre le "Thread" 
"incorrect OO in lucene source" de la liste lucene-dev au moins pour solliciter des avis 
pour ces interfaces.

Tu as raison.

A+

--
Pierrick Brihaye, informaticien
Service régional de l'Inventaire
DRAC Bretagne
mailto:address@hidden
+33 (0)2 99 29 67 78





reply via email to

[Prev in Thread] Current Thread [Next in Thread]