Le spamdexing désigne l'ensemble des techniques utilisées par les spammeurs pour gonfler artificiellement le nombre de pages d'un site dans l'index d'un moteur de recherche. On pourrait traduire spamdexing en français par "référencement abusif".
Une étude menée par Yi-Min Wang, Ming Ma (Microsoft Research) et Yuan Niu, Hao Chen (Université de Californie) analyse le phénomène du spam par la construction d'une base de données de plus de 100 000 urls (à partir d'une liste de 1000 mots clés testés sur 3 moteurs majeurs et dont on considère uniquement les 50 premiers résultats). Bilan : 11,6% des pages sont considérées comme du spam (avec une pointe à 31% dans l'univers des produits pharmaceutiques (viagra, xanax...)). Le domaine le plus concerné par les spams est blogspot.com (plateforme d'hébergement de Blogger). A noter que le pourcentage de spams parmi les pages rattachées aux noms de domaine à l'origine du spam montent parfois... jusqu'à 100%.
On pourra télécharger l'étude de 10 pages au format PDF ici (PDF, 92 Ko). Source : Abondance
Posté par Stéphane DEGOR
Commentaires