sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

RE : RE : RE : [sdx-users] l'affectation d'un analyseur lucenedynamiquem


From: Martin Sevigny
Subject: RE : RE : RE : [sdx-users] l'affectation d'un analyseur lucenedynamiquement
Date: Mon, 25 Aug 2003 19:26:21 +0200

Bonjour,

> Ce que je voulais dire par dynamiquement, c'est la possibilité de
> détecter la langue d'un attribut du champ et pas uniquement 
> de xconf ce
> qui permettrai d'imaginer des documents ayant des champs répétés
> multilingues... Pour la recherche c'est une autre affaire, 

J'avais bien compris, mais justement, la recherche ce n'est pas une
autre affaire. Un principe de base de ce type d'outils de recherche est
d'appliquer les mêmes règles d'analyse lors de l'indexation et lors de
la requête. On peut en diverger un peu, mais à quelque part je ne crois
pas qu'on peut réfléchir au problème sans tenir compte de la recherche.

> "documentaire" mais je pense qu'il y a encore du chemin à faire pour
> avoir une idée limpide du multilinguisme dans SDX.

?

> C'est déjà un bon contournement, j'essayerai d'une manière 
> explicite. Si
> tu as une idée sur "la manière transparente" de créer des champs
> différents par SDX, je suis preneur.

Une idée? Il s'agit de le coder comme ça, c'est très facile dans le Java
derrière.

> > Mais que fait-on après? Si un utilisateur, dans une page où 
> la langue
> > est "fr", effectue la requête ci-dessus, que devrait-il se passer?
> 
> L'analyseur fr devrait être choisi sauf précision particulière par
> l'utilisateur (combo de langue). Ce serait trop beau que SDX puisse
> détecter la langue du texte libre dans une requête.

En fait, même s'il pouvait le détecter, il peut y avoir _plusieurs_
langues...

> Oui dans le cas de ton exemple de requête, je suis d'accord mais que
> fait SDX dans le cas d'une requête libre encore plus large d'un simple
> champ qui interrogerait plusieurs bases de documents?

Je ne sais pas. J'étais resté dans un contexte d'une seule base, mais
c'est vrai que ça peut être encore plus compliqué!

> Si je cherche en fr comment:(français patrimoine architecture),
> j'attends deux niveaux de résultats :
> - Les documents qui répondent à ma requête dans la langue choisie par
> ordre de pertinence
> - Les documents qui répondent à ma requête dans d'autres langues par
> ordre de pertinence! Avec l'usage pertinent des fonctionnalités
> thésaurus, on devrait y arriver, non ? , c'est un terrain encore non
> découvert.

Je comprends ton besoin, mais il peut y avoir beaucoup de stratégies
pour y arriver, dont plusieurs ne passent pas par tes champs dynamiques.

> Faut-il identifier des "use cases" du multilingue au niveau des :
> - champs (même champ répété ayant des valeurs dans n langues),
> - documents (même document répété et interprété ainsi dans n 
> différentes
> langues = "traductions"),
> - ou bases de documents (même structure de base de document mais avec
> des documents de langue différente respectivement dans chaque 
> base = Je
> pense à parcours d'images)?

Et surtout des cas mixtes parmi ces possibilités.

Si on a le loisir de mettre les documents dans des bases différentes, ça
peut effectivement simplifier le problème, mais ce n'est pas toujours
possible ou souhaitable.

A bientôt,

Martin Sévigny





reply via email to

[Prev in Thread] Current Thread [Next in Thread]