sdx-users
[Top][All Lists]
Advanced

[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[sdx-users] RE : UTF-8


From: Martin Sévigny
Subject: [sdx-users] RE : UTF-8
Date: Fri, 12 Jul 2002 11:28:02 +0200

Bonjour,

> Mais il ne me semble pas négatif de forcer le passage à 
> Unicode le plus 
> tôt possible en documentation.

Oui, mais ça a un impact aussi sur l'encodage des données de formulaires
envoyées par le navigateur Web, et je ne sais pas si les navigateurs /
plates-formes ont tous les même comportement...

> De toutes façons ça n'a pas l'air de perturber les autres bases qui 
> étant probablement en ISO Latin 1 sont parfaitement compatibles avec 
> l'Unicode dont il constitue la première ligne du plan de base BMP.

Ca n'a rien à voir avec le contenu des bases, qui sont en XML, et en XML
il ne peut pas y avoir ambiguité sur le jeu de caractères, qui est soit
déclaré explicitement soit UTF-8 | UTF-16 s'il n'est pas déclaré.

Ce qu'on discute concerne l'interaction entre le serveur Web et le
client, dans les deux sens.

Je viens de me rappeler où ça a un impact : la machine virtuelle Java
est démarrée avec un encodage par défaut. Sans paramètre
java.lang.encoding explicite, c'est l'encodage de la machine qui est
considéré. Les Linux français récents sont en UTF-8, les Windows et
anciens Linux plutôt en ISO-8859-1.

Lorsqu' un client Web envoie les données d'un formulaire (par exemple
une recherche) au serveur, il l'encode en fonction de l'encodage de la
page HTML (je n'ai pas fait le tour de tous les navigateurs, mais il
semble que ce soit le cas le plus fréquent).

MAIS, le serveur (Tomcat en l'occurrence, ou son équivalent) décode les
données en fonction de l'encodage de Java!! Donc un changement
systématique du cocoon.properties tel que suggéré doit s'accompagner du
démarrage de Tomcat/Java avec le même encodage...

Cette limite, comme je le mentionnais préalablement, ne semble pas
totalement effacée aves les environnements Cocoon/Tomcat, mais je n'ai
pas terminé l'étude ce cet aspect...

A bientôt,

Martin Sévigny




reply via email to

[Prev in Thread] Current Thread [Next in Thread]