[Top][All Lists]
[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
RE : [sdx-developers] Re: RE : [sdx-users] Analyseur arabe
From: |
Rasik Pandey |
Subject: |
RE : [sdx-developers] Re: RE : [sdx-users] Analyseur arabe |
Date: |
Tue, 18 Nov 2003 10:59:26 +0100 |
Salut,
>
>Je pense donc que le highlighter ne devrait pas travailler avec les
>offsets de *tokens* mais avec les offset du texte, la "String
>text" qui
>est passée dans l'argument de la méthode, i.e.
>
>endOffset = 0;
>while ((token = stream.next()) != null) {
> startOffset = endOffset++;
> endOffset = endOffset + token.termText().length;
> ...
>}
>
>... ou similaire.
>
>Est-ce que mon analyse est bonne ?
>
Ça marche déjà dans la manière que tu décris, non?
public final class Token {
String termText; // the text of the
term
int startOffset; // start in source
text!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
int endOffset; // end in source
text!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
String type = "word"; // lexical type
private int positionIncrement = 1;
/** Constructs a Token with the given term text, and start & end
offsets.
The type defaults to "word." */
public Token(String text, int start, int end) {
termText = text;
startOffset = start;
endOffset = end;
}
.....
Rasik