sdx-developers
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

RE : [sdx-developers] RE : Gestion de la mémoire


From: Martin Sevigny
Subject: RE : [sdx-developers] RE : Gestion de la mémoire
Date: Sun, 19 Jan 2003 15:51:48 +0100

Bonjour,

> C'est logique, le tableau a été construit *avant*. Pour 
> afficher les 20 premiers résultats, il a fallu autant de 
> temps et de ressources que si tu avais affiché les 20 derniers.

Ben non, justement. Dans Lucene, un ensemble de 10000 résultats ou de 20
résultats prennent strictement les mêmes ressources. Idem pour SDX sans
tri.

Lucene n'a pas besoin de connaître les 10000 documents pour savoir que
les 20 premiers sont les plus pertinents. C'est la raison.

> Oui, c'est souhaitable (et comparable au LIMIT de SQL). Une 
> autre idée à creuser est la possibilité (récente) de définir 
> soi même son score. Pour moi, on a là un mécanisme qui, sans 
> l'être réellement, ressemble furieusement à un tri.

Oui, c'est maintenant dans Lucene, alors il faudrait l'interfacer dans
SDX.

> Pour prendre un exemple, mon appli est déterministe quant au 
> tri : je serais très intéressé de le hard-coder dans la 
> structure des index. Ceci ne doit bien sûr pas empêcher des 
> tris personnalisés... protégés :-)

Il y a eu des messages récemment sur les listes Lucene à ce sujet.
Effectivement, c'est possible (si je me rappelle bien) de trier
efficacement selon ce principe.

A bientôt,

Martin Sévigny





reply via email to

[Prev in Thread] Current Thread [Next in Thread]