Je lisais l'autre jour une très bonne note de Laurent Bazet sur le référencement d'un blog dans les moteurs de recherche. Il y mettait en lumière les raisons pour lesquelles les blogs sont autant aimés des moteurs de recherche. Cependant, je ne crois pas pour autant que Typepad (configuration par défaut) soit la "killer application" pour figurer aux premières places des moteurs. Et ce pour au moins 3 raisons :
La gestion des titres de pages et des posts
S’il y a un critère essentiel dans le contenu d’une page, c’est bien le titre de la page. Parfait, Typepad place la balise TITLE juste au début de la balise HEAD. Cependant, la proéminence (ratio entre position du mot clé et la position des autres mots du texte) est malmenée. En effet, le nom du blog est toujours placé avant le titre du post (il vaut mieux alors ne pas avoir un nom de blog trop long). Un blog avec un menu gauche provoque le même phénomène.
Même constat pour les balises Hi
Un des critères semblant également essentiel dans les algorithmes des moteurs de recherche est l’indice de densité du mot clé ou de l’expression de recherche. Et, quand on ajoute le contenu généré par le post lui-même, les menus, les archives, je pense que l’on est loin d’atteindre les 2 à 5% de densité recommandé.
La gestion des attributs des images
Après le téléchargement d'une image, Typepad renomme le nom de fichier en retirant les "-". Il place également le nom de l'image ainsi corrigé dans les balises TITLE et ALT.
L'importance des noms d'images pour le référencement est déjà très discutable, ce ne serait au mieux qu'un critère secondaire dans l'algorithme d'un moteur de recherche. L'utilité pour le référencement de la balise TITLE d'une image est tout aussi discutable. Quant à la balise ALT, de toute façon Typepad impose une édition du code html du message pour que cela ait un intérêt. Un exemple : mon post du 11/12/04 sur les agents conversationnels. Je prépare l’image agents-conversationnels.gif. L’upload provoque le renommage de l’image en agentsconversationnels.gif, idem pour les balises TITLE et ALT. Autant dire que pour le référencement, le mot « agentsconversationnels » n’a que peu d’intérêt…
Les noms de fichiers et de répertoires
Il y aussi à redire sur les noms de fichiers et de répertoire. Leur importance pour le référencement me semble bien essentielle, pour autant Typepad limite (ce qui est somme toute logique) le nombre de caractères. Au mieux, 2 mots entiers apparaissent dans le nom de fichier.
L’utilisation des underscores « _ » à la place des tirets « - » est également criticable. C’est un débat de longue date dans le milieu du référencement, mais j’ai toujours pensé / vérifié que le « - » était mieux compris par les outils de recherche en tant que séparateur.
Et enfin, la gestion de l’accentuation par Typepad… Essayez de créer une catégorie « Référencement » et un post « Référencement » dans la même catégorie. Vous obtiendrez alors une jolie url du type …/rfrencement/rfrencement.html. Autant dire que l’intérêt pour le positionnement est complétement nul. Logique, pas d'accent dans les URL.
Je rappelle tout de même que le titre de la page (balise TITLE dans le HEAD) et la quantité et la qualité des liens entrants (avec le lien textuel qui va bien) me semble les critères les plus importants dans une optique de bon positionnement.
Posté par Stéphane DEGOR
La gestion des titres de pages et des posts
S’il y a un critère essentiel dans le contenu d’une page, c’est bien le titre de la page. Parfait, Typepad place la balise TITLE juste au début de la balise HEAD. Cependant, la proéminence (ratio entre position du mot clé et la position des autres mots du texte) est malmenée. En effet, le nom du blog est toujours placé avant le titre du post (il vaut mieux alors ne pas avoir un nom de blog trop long). Un blog avec un menu gauche provoque le même phénomène.
Même constat pour les balises Hi
, très prisées des algorithmes des moteurs. Je précise avant de continuer que ce qui important, c’est le numéro i de la balise Hi et non sa redéfinition par feuille de style. Le titre du blog est en H1, le descriptif du blog en H2, de même que les intitulés des sous-menus (« auteur », « liens »…) et… la date du post. Le titre du post ne se retrouve qu’avec une balise H3…Un des critères semblant également essentiel dans les algorithmes des moteurs de recherche est l’indice de densité du mot clé ou de l’expression de recherche. Et, quand on ajoute le contenu généré par le post lui-même, les menus, les archives, je pense que l’on est loin d’atteindre les 2 à 5% de densité recommandé.
La gestion des attributs des images
Après le téléchargement d'une image, Typepad renomme le nom de fichier en retirant les "-". Il place également le nom de l'image ainsi corrigé dans les balises TITLE et ALT.
L'importance des noms d'images pour le référencement est déjà très discutable, ce ne serait au mieux qu'un critère secondaire dans l'algorithme d'un moteur de recherche. L'utilité pour le référencement de la balise TITLE d'une image est tout aussi discutable. Quant à la balise ALT, de toute façon Typepad impose une édition du code html du message pour que cela ait un intérêt. Un exemple : mon post du 11/12/04 sur les agents conversationnels. Je prépare l’image agents-conversationnels.gif. L’upload provoque le renommage de l’image en agentsconversationnels.gif, idem pour les balises TITLE et ALT. Autant dire que pour le référencement, le mot « agentsconversationnels » n’a que peu d’intérêt…
Les noms de fichiers et de répertoires
Il y aussi à redire sur les noms de fichiers et de répertoire. Leur importance pour le référencement me semble bien essentielle, pour autant Typepad limite (ce qui est somme toute logique) le nombre de caractères. Au mieux, 2 mots entiers apparaissent dans le nom de fichier.
L’utilisation des underscores « _ » à la place des tirets « - » est également criticable. C’est un débat de longue date dans le milieu du référencement, mais j’ai toujours pensé / vérifié que le « - » était mieux compris par les outils de recherche en tant que séparateur.
Et enfin, la gestion de l’accentuation par Typepad… Essayez de créer une catégorie « Référencement » et un post « Référencement » dans la même catégorie. Vous obtiendrez alors une jolie url du type …/rfrencement/rfrencement.html. Autant dire que l’intérêt pour le positionnement est complétement nul. Logique, pas d'accent dans les URL.
Je rappelle tout de même que le titre de la page (balise TITLE dans le HEAD) et la quantité et la qualité des liens entrants (avec le lien textuel qui va bien) me semble les critères les plus importants dans une optique de bon positionnement.
Posté par Stéphane DEGOR
Un effet remarquable de la structure des blogs en analysant les requêtes de recherche qui amènent des visiteurs sur mon blog.
Google mélange le contenu des posts contenus dans la page principale du blog. En effet, les différents posts sont contenues à l'intérieur de balises de paragraphes (p) à l'intérieur d'une balise (div). Aucune balise ne vient distinguer les posts.
Par exemple, si on effectue la recherche suivante sur les mots-clés RFID et Languedoc : Recherche sous Google
Mon blog apparait en 6ème position sur 561 trouvés (je n'ai pas le temps de chercher un exemple plus frappant mais je pense que l'on peut facilement s'amuser avec ce petit jeu).
L'article où je cite le RFID concerne mon compte-rendu des journées de l'IDATE et Languedoc est une de mes catégories.
Devant le nombre croissant voire exponentiel de blogs, Google ne risque t il
pas à terme de proposer des liens peu pertinents ? Gageons que la R&D de ce dernier doit plancher sur le sujet pour préconiser auprès des fournisseurs de plateforme blogs des balises qui permmettront à la Google Dance de s'effectuer de manière plus pertinente.
Tout celà n'a pas lieu d'être si le blogger ne veut pas perdre son âme (GoogleBomb Anne Imbert par exemple) ...
PS : en attendant, bienvenue aux égarés du Web sur mon blog ...
Rédigé par : Sylvain | 20 décembre 2004 à 19:43
Sur de nombreux Blogs, la requete site: sur google montre que celui-ci met un grand de pages en "page similaire". Toutes les pages ainsi traitées ne sont pas accessibles directement par la recherche. C'est donc un gros problème pour référencement des blogs.
Rédigé par : Phristo | 25 décembre 2004 à 23:05
On peut également lister plusiers freins au référencement des blogs :
- la géolocalisation, dans le cas de Typepad je suis hébergé en californie. C'est facheux pour un blog s'adressant aux français.
- la taille - gigantesque - qu'atteignent les pages de catégorie
- les images et fichiers ne sont pas stockées sur mon DNS
- la structure des pages qui n'est pas toujours optimisée et rendue confuse en raison de la navigation sur un seul niveau
Je constate néamoins que la majorité des blog sont largement plus "search engine frienly" que les sites developpés en interne.
Rédigé par : Renaud | 07 janvier 2005 à 09:12
en effet le gros pb qd on est hebergé a l'etranger est que google ne le place dans la recherche en france par contre on peut obtenir un tres bon referencement avec 2 ou 3 astuces sur google ou yahoo, par exemple j'ai donné un coup de main pour le referencement d'un blog et le résultat est :
en premiere page de yahoo(7 eme) pour le mot" marketing internet"(recherche en francais) difficile a faire avec un site classique donc google et yahoo search aiment les blog
Rédigé par : frederic | 10 janvier 2005 à 14:04
Pour l'indice PR, est-ce que Google tient compte des backlinks qui figurent dans les blogs ??? Ont-ils une valeur ?
Rédigé par : kylian | 12 décembre 2005 à 21:29
Phristo,
Le problème des pages similaires est dû au fait que tu utilises un menu dans la colonne de gauche assez important. J'avais moi même ce problème sur mon blog. J'ai allégé le menu en mettant la plupart des informations dans la colonne de droite et oh miracle, je n'ai plus de pages similaires. Apparemment, l'algorithme de google compare le début du code des pages et donc si tu utilises un menu à gauche assez fourni, tu as de grandes chances d'avoir un nombre de pages similaires très important.
A+
Olivier
Rédigé par : Olivier | 16 janvier 2006 à 17:29
Effectivement, c'est une information parfois évoquée sur les forums de référencement. Ceci ne concerne pas seulement les pages similaires mais est aussi utile pour prévenir le duplicate content. Il est aussi utile de rappeler que ce n'est pas seulement le contenu qui est audité, mais également le code html généré.
Un de calcul de taux de similarité sur WRI entre 2 articles récents sur ce blog donne 72,06% de similarité selon la méthode Jacard et 83.76% selon la méthode Dice...
Rédigé par : stéphane | 17 janvier 2006 à 12:39
La gestion par typepad des url avec underscore au lieu de tiret est vraiment problématique pour le référencement. Quel dommage qu'ils n'utilisent pas la même gestion que Blogger, qui of course prend en compte ce que "souhaite" google...
Rédigé par : communication collectivités | 11 février 2006 à 19:16