Document sans titre

Par défaut, les éditeurs HTML comme Dreamweaver nomment les pages web "Untitled document" en anglais, ou "Document sans titre" pour les versions françaises.

Le titre (TITLE) est pourtant primordial pour un site web : c'est sa carte de visite. Sans lui, le visiteur n'a que peu de repères sur les pages, il lui est difficile de mettre un site en favoris. Pire, le site est extrêmement mal référencé sur les moteurs de recherche.

Il est intéressant de voir le nombre de ces pages sans titres sur le moteur numéro 1, Google. Ce dernier n'affiche pas moins de 5 millions de réponses pour une recherche de "Untitled document" !!

Dans le même ordre d'idée, plus de 500000 sites (pages) francophones sont nommées "Document sans titre".

Cette grave erreur de conception web peut être compréhensible pour les sites personnels ou amateurs; en revanche lorsqu'il s'agit de sites professionnels, institutionnels, commerciaux ou grand public, cela devient bien plus inquiétant... La plupart du temps, ce genre de problème est dû à des sites construits à l'aide de cadres (frames).

Parmi les réponses les plus intéressantes de Google France (je ne me suis limité qu'aux premières pages) on retrouve :

  • www.environnement.gouv.fr : le site gouvernemental de l'Environnement. Fort heureusement, cette page est redirigée et on arrive sur une page avec un titre renseigné !
  • www.inforpnl.com : un institut de formation sur la Programmation Neuro Linguistique
  • www.jeanvigo.com : un cinéma à Bordeaux
  • www.univ-lille1.fr/physique : UFR de Physique de l'université de Lille
  • www.cezanne.com : le célèbre peintre, heureusement redirigé sur une autre page.
  • www.lancaster-beauty.com : instituts de beauté Lancaster à Monaco
  • www.cicerone.fr : logiciel de gestion automobile
  • www.imca-provence.com : centre de formation (ne s'affiche que sur Internet Explorer)
  • www.entrelec.com : grand distributeur électrique (ne s'affiche que sur Internet Explorer)
  • www.lectramini.com : logiciels éducatifs
  • www.airborne-museum.org : musée sur l'aviation
  • www.abialis.com : produits de beauté
  • www.robertclergerie.com : grande marque de chaussures à Paris

Etc etc... La liste est longue mais je vous invite à la compléter par vos découvertes intéressantes !

J'espère que tous ces sites professionnels n'ont pas pour vocation de trouver un grand nombre de clients par internet...

EDIT : ah ben tiens, je remarque que Totalement Crétin [fr] a eu la même idée que moi... y'en a vraiment qui s'ennuyent ! :)

Trackbacks

Aucun trackback pour le moment.

Les trackbacks pour ce billet sont fermés.

Evaluez ce billet

Commentaires

Le mardi 8 juin 2004 à 06:57, par Laurent Denis :: site :: #

>Pire, le site est extrêmement mal référencé sur les moteurs de recherche.
En théorie, oui. En pratique, non, et il faut être réaliste : les moteurs de recherche traitent avant tout depuis leur naissance avec des pages codées n'importe comment. Ils se sont développés d'abord en fonction de celles-ci, et commencent à peine vaguement à exploiter les atouts d'un code standard et significatif.
Pour reprendre deux de tes exemples :
- Le ministère de l'environnement arrive en première place sur google pour le mot Environnement.
- www.inforpnl.com est présent dans les 30 premiers sites sur 6000 résultats pour "Programmation Neuro Linguistique".
Dire qu'une page bien codée aide au référencement, c'est juste. Dire qu'on peut se contenter de bien coder (au sens large) pour être bien référencé aussi, je crois. Mais il est faux de dire qu'un mauvais codage entraîne un mauvais référencement...

Le mardi 8 juin 2004 à 09:59, par Yeca :: site :: #

Marrant, on en causait il y a qq temps sur fxp : www.flashexpress.net/foru...

Le mardi 8 juin 2004 à 10:51, par Raphael Goetter :: site :: #

@Yeca > bah tu me feras un résumé, il faut être inscrit pour lire... et je ne m'aventure pas sur les forums flash :D

Le mardi 8 juin 2004 à 12:15, par Ldo :: site :: #

>www.inforpnl.com est présent dans les 30 premiers sites sur 6000 résultats pour "Programmation Neuro Linguistique".

ce qui est particulièrement nul !
quand on voit qu'un site perso skynet se place 2ème ...
il suffierai probablement a inforpnl de placer les termes "Programmation Neuro Linguistique" dans leur title pour etre premier
(le prochain premier sur "Programmation Neuro Linguistique" risque fort d'etre ce blog d'ailleur lool)
----
pour le ministère de l'environnement, c'est simple, la première page ne contient aucun texte, pas de body, google est donc obligé de se référer au nom de domaine et aux textes de lien, et donc avec le mot 'environnement' dans l'url, et 2000 liens qui doivent contenir pour beaucoup le terme 'environnement', c'est ce qu'on appelle un Google Bombing, autrement dit, leur première position n'est que pur hazard

Le mardi 8 juin 2004 à 12:19, par Ldo :: site :: #

je revient sur un truc : "autrement dit, leur première position n'est que pur hazard"
bien sur, ils ont pû developper une politique de lien. mais en tout cas, je ne reconait le travail d'aucun grand référenceur, un vrai référenceur aurait au moins placer un texte sur l'index, histoire d'assurer le travail et d'"ecraser" les autres prétendants à la requette.
si demain Google change sa ligne de conduite sur les lien et diminu l'effet google-bombing, ca va leur faire tout drole au ministère ... :D

Le mardi 8 juin 2004 à 17:02, par David Anseaume :: site :: #

Un autre cas : www.france-telecom.com (jusqu'a hier, le titre c'etait : Tapez ici le titre de votre site ) apparement, cela à été corrigé

Le mardi 8 juin 2004 à 17:18, par Raphael Goetter :: site :: #

@ David Anseaume > C'est toujours le cas, mais l'url est redirigée : www.google.fr/search?hl=f... (cf le 6ème de la liste)

Le mercredi 11 août 2004 à 11:47, par Pierre :: site :: #

Bonjour,

Je viens de découvrir vos commentaires sur mon site web : www.inforpnl.com ! Je vous apporte quelques éléments qui ne justifient en rien mon incompétence mais qui peuvent éclairer le débat.
La version en ligne qui ne contient pas de titre est en fait une version uploadée un peu trop rapidement, la version précédente avait été travaillée pour être dans les premiers sites référencés. Un gros loupé de ma part et grace à vous je viens de le corriger. Merci.
Je m'occupe également de www.pnl.fr qui est mieux placé et j'ai une question à vous poser. Comment se fait il que le site placé en premier soit "moins bon" en terme de travail sur les balises meta et la cohérence des mots clés et qu'il arrive en tête lorsqu'on tape le mot "pnl" sur Google ?

Vos éclaircissements m'aideraient beaucoup !!

Pierre

pierre@NOSPAMpnl.fr

Le mercredi 11 août 2004 à 11:52, par Raphael Goetter :: site :: #

@Pierre > Je conçois que ce n'est pas la meilleure façon d'apprendre les "coquilles" de sont site et j'espère ne pas vous avoir froissé en la détectant.
Pour ce qui est du positionnement sur Google, sachez pour commencer que les balises meta ne sont tout simplement pas prises en compte (sauf title) et que cela ne sert strictement à rien d'accumuler les keywords et les descriptions.
Google se base avant tout sur le contenu pertinent, la sémantique de la page et des liens populaires vers votre site... mais il est difficile de résumer en quelques lignes le fonctionnement alambiqué de Google ;-)

Le mercredi 11 août 2004 à 21:56, par Laurent Denis :: #

Sibelius, "Google se base avant tout sur la sémantique de la page" ? Voilà est qui est très politiquement correct, mais passablement hasardeux pour un moteur qui s'est construit en référençant un Web essentiellement non-sémantique ;)

Peut-être peut-on dire en revanche que le google du futur se basera sur la sémantique ( www.ftrain.com/google_tak... ).

Le mercredi 11 août 2004 à 22:42, par Raphael Goetter :: site :: #

@Laurent > Rââ, encore de la lecture en anglishe ! Je viens à peine de finir mes Eric Meyer et j'attaque à l'instant celui de Zeldman que voilà un nouveau truc à déchiffrer ! Pfff faut être motivé parfois !! :-)
Google s'est effectivement construit sur un web non sémantique, mais est-il faux de dire que son algorithme prend de plus en plus compte de la structure des documents ?
Ce billet m'avait marqué il y'a quelques temps :
standblog.org/blog/2004/0...

Le jeudi 12 août 2004 à 07:08, par Laurent Denis :: #

@Raphael > Le billet de Tristan parlait des bénéfices induits de l'accessibilité d'un document, non de sa sémantique HTML.

Voir la page "Conseils aux Webmasters" de Google (en français ;) ) :
www.google.com/webmasters...

La seule mention du codage concerne l'accessibilité et non la sémantique des éléments :
- les titles et alt des images (google les exploite et déconseille les "textes en images" en général car il est "aveugle");
- les javascript et DHTML obstructifs.

Quant à l'algorithme de Google, c'est une devinette permanente sur laquelle il est risqué de faire des hypothèses, tant sur (1) son fonctionnement actuel que sur (2) son évolution.

Exemple pour (1) : il est généralement admis qu'il exploite le poids sémantique spécifique des <h1>. Mais rien n'est sûr pour les autres niveaux de titrage...

Exemple sur (2): Récemment encore, Google exploitait effectivement un îlot RDF de metadonnées DC inclus dans un document HTML (voir les copies d'écran de members.home.nl/mackelenb... )
Mais aujourd'hui, ce n'est plus le cas : comparer la capture d'écran ci-dessus avec www.google.com/search?q=D...

Dans quel sens évolue Google ?

Le jeudi 12 août 2004 à 11:09, par Raphael Goetter :: site :: #

@Laurent > oui tu as raison de le préciser : je fais souvent l'amalgame entre l'Accessibilité et la Sémantique, qui me semblent souvent tellement indissociables ;)

Le jeudi 12 août 2004 à 12:40, par Laurent Denis :: #

Indissociables ? Une page peut respecter la sémantique des éléments HTML et être totalement inaccessible, une autre peut être très accessible tout en utilisant divers éléments à tort et à travers...

Certes, certains éléments HTML à forte valeur sémantique sont exploités par les outils d'accessibilité (les titres pour la navigation, les listes pour les liens non adjacents, summary, th...). Et il existe des éléments spécifiquement orientés vers l'accessibilité (label). Mais ces deux domaines ne coïncident pas, loin de là ;)

Ajouter un commentaire

Les commentaires pour ce billet sont fermés.