Malgré un risque connu d’envahissement par des vagues de (…)
La ministre de la Défense Michèle Alliot-Marie a (…)
On savait déjà que les abonnés de Wanadoo avaient des surprises puisque l’utilitaire d’installation de Wanadoo ADSL bloquait certaines modifications de la configuration (en particulier l’adresse email).
Voici maintenant que je découvre que Wanadoo ne respecte pas les standards pour les codes d’erreur : vous savez l’erreur 404 (ou d’autres) que vous découvrez parfois parce qu’une page n’existe plus.
Lorsqu’une page de Wanadoo (et cela concerne aussi les sites personnels hébergés par ce FAI) disparaît ou est déplacée, la page qui apparaît ne respecte pas les standards.
Vous êtes bien redirigés vers une page d’erreur. Un être humain verra donc que la page n’existe plus puisque c’est marqué sur cette page.
Mais, sur Internet, il n’y a pas que des internautes humains : il y a aussi des robots d’indexation qui récupère le contenu des pages afin de mettre à jour les réponses des moteurs de recherche. Le plus connu d’entre eux, Googlebot, passe ainsi environ toutes les 6 à 8 semaines sur toutes les pages de son historique, ajoutant les nouvelles pages, supprimant celles qui ont disparu et modifiant celles qui ont été mises à jour.
Pour la recherche des pages disparues, il se base sur deux éléments : – le code erreur renvoyé par le serveur : — 301 : document déplacé de façon permanente, — 302 : document déplacé de façon temporaire, — 404, page inexistante. – le fichier robots.txt qui peut indiquer au robot le déplacement ou la suppression de ces pages.
Le problème est que, si Wanadoo affiche bien une page d’erreur compréhensible par les internautes humains, cette page ne comprend pas les codes standards d’erreur, et les robots d’indexation ne peuvent comprendre que la page a disparu.
Vous allez me dire où est le problème ? Avec de plus en plus de pages sur Internet (plusieurs milliards : 8 058 044 651 aujourd’hui), le seul moyen fiable de trouver une information est d’aller la chercher dans les moteurs de recherche. Et le plus connu, le plus utilisé est Google.
La conclusion provisoire est que, pour l’instant, Google n’est pas fiable pour ce qui concerne les pages hébergées par Wanadoo.
Wanadoo a été contacté afin de pouvoir répondre à cet article. Je n’ai pas eu de réponse pour l’instant.