2004-03-05

Problème de charset avec Google

Google a du mal avec la table de caractères (charset) utilisée pour coder le texte de mon site ; il s'agit de la table iso-8859-15, aussi connue sous le nom latin-9 ou latin-0.

En fait Google l'analyse comme de l'iso-8859-1, un autre charset qui est heureusement assez similaire, ce qui me permet d'avoir tout de même des résultats de recherche pertinants vis-à-vis de mon site. Mais dès qu'un mot contient des caractères propres à l'iso-8859-15 on ne pourra guère les trouver via Google.

Pour effectuer des tests, j'ai placé sur mon site une phrase cachée contenant ces caractères spécifiques, suivi d'un mot long permettant de la trouver facilement à l'aide d'un moteur de recherche.

J'avais envoyé un courriel au webmaster de Google mi-novembre, mais je n'avais pas vu d'évolution. Il y a peu, Yahoo a lancé son propre moteur de recherche. Je me suis donc empressé d'effectuer le test de l'iso-8859-15 dessus. Et oooh, aucun soucis, Yahoo gère sans problème ce charset. Par curiosité, j'ai aussi effectué un test sur MSN Search. Et là aussi, MSN gère mon charset sans aucun problème.

Montrer que la concurrence fait mieux, c'est en général un argument plus marquant que celui qui consiste à demander une amélioration uniquement par principe. J'ai donc envoyé un deuxième courriel mi-février, cette fois-ci à l'équipe « Search Quality », avec des captures d'écran à l'appui. Je viens de recevoir un message de confirmation indiquant que ma demande a été prise en compte. Ça sent un peu le message automatique, mais j'espère que les choses bougeront un peu plus cette fois :)