[Top][All Lists]
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
Re: [sdx-developers] Index hiérarchiques avec Lucene
From: |
Frédéric Glorieux |
Subject: |
Re: [sdx-developers] Index hiérarchiques avec Lucene |
Date: |
Mon, 08 Dec 2003 16:17:17 +0100 |
User-agent: |
Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.5) Gecko/20030916 |
Pierrick Brihaye wrote:
Salut,
Je ne sais si vous avez lu (et anlysé) ce post :
http://nagoya.apache.org/eyebrowse/address@hidden&msgNo=4638
Mais il y a là de quoi résoudre un problème qui me préoccupe depuis un
bon bout de temps ;-)
A+
Je ne suis pas sûr de tout comprendre. Avec ce genre de hack on pourrait
indexer en sections nativement dans Lucene ? Mais est-ce que ça ne fait
pas très mal à nos sous-documents ? Pierrick je suppose que tu vas te
faire une joie d'implanter ça sur le coran ?
Le problème maintenant c'est d'aller informer l'analyseur sur ce qui est
section ou paragraphe. Rendu là, je vois que l'espace de nom SDX
pourrait avoir sections, paras, titres (?), et si on relie ça au désir
légitime d'avoir un support OAI/DC plus naturel ? Je ne veux pas pousser
la roue trop loin mais je vois venir des idées qui me plaisent.
--
Frédéric Glorieux
AJLSM, ingénieur documentaire
<address@hidden>
tel +33 (0)1 49 54 22 22
fax +33 (0)1 49 54 21 80
EUMEDIS - Strabon - WP7 - formation/training
Maison des Sciences de l'Homme
54 Boulevard Raspail
75006 PARIS