sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

RE: [sdx-users] indexation de pages HTML


From: Emmanuel Bégué
Subject: RE: [sdx-users] indexation de pages HTML
Date: Tue, 30 Sep 2003 18:48:38 +0200

Bonjour,

Ca n'a peut être pas de rapport en l'espèce, mais j'avais
rencontré le problème d'un html contenant des balises
propriétaires, qui est refusé par Tidy en standard (rejet
pur et simple du traitement); si le html à "tidyifier" contient
des balises propriétaires celles-ci doivent en principe être
déclarées dans un fichier de configuration.

Il y a peut-être un moyen de désactiver ce comportement par
défaut, mais je ne l'ai pas trouvé: en attendant, on doit au
préalable faire l'inventaire des balises propriétaires du
corpus à indexer.

Cdt,
EB

> -----Message d'origine-----
> De : address@hidden
> [mailto:address@hidden
> De la part de Pierrick Brihaye
> Envoyé : mardi 30 septembre 2003 17:14
> À : address@hidden
> Objet : Re: [sdx-users] indexation de pages HTML
>
>
> Bonjour,
>
> marjorie burghart a écrit:
>
> > Où ai-je loupé quelque chose ??
>
> Rien dans les logs ?
>
> Pour info, le HTML est nettoyé avec JTidy. Votre HTML va peut-être
> au-delà de ce qu'il peut faire ?
>
> A bientôt,
>
> --
> Pierrick Brihaye, informaticien
> Service régional de l'Inventaire
> DRAC Bretagne
> mailto:address@hidden
>
>
>
> _______________________________________________
> sdx-users mailing list
> address@hidden
> http://mail.nongnu.org/mailman/listinfo/sdx-users
>





reply via email to

[Prev in Thread] Current Thread [Next in Thread]