Nous vous parlions ici du TrustRank comme alternative au PageRank, notamment pour combattre le spam des moteurs de recherche.
Vous trouverez un nouvel article de Webrankinfo traitant du Trustrank ici, contenant notamment une présentation rapide de cet algorithme censé améliorer la pertinence des résultats fournis par les outils de recherche. (Lire Description du Trustrank)
Posté par Stéphane DEGOR
Le trustrank aussi sur le blog de Jean Véronis :
Google: TrustRank, beaucoup de bruit pour rien?
Les 13 indices (Jean Véronis)
1. le nombre d'articles produit par la source
2. la longueur moyenne des articles
3. la "couverture" de la source (en gros, combien d'infos ou "stories", la source reprend-elle par rapport à l'ensemble des sources)
4. la réactivité de la source ("breaking score"), c'est-à-dire la capacité de la source à diffuser le plus vite possible sur une info donnée
5. un indice d'utilisation (en nombre de clics sur cette source)
6. une opinion humaine sur la source (tiens...)
7. une statistique extérieure d'audience telle que Media Metrix ou Nielsen Netratings
8. la taille de l'équipe, (qui peut-être déterminée par le nombre de journalistes distincts qui signent les nouvelles (finis les blogs)
9. le nombre de bureaux ou agences différentes de la source (idem)
10. le nombre d'entités nommées originales citées par la source (personnes, organisations, lieux) -- ceci sans doute dans l'idée que les sources secondaire enlèvent des infos mais n'en ajoutent que rarement (cela fait sens: voir exemple)
11. l'étendue (breadth), c'est-à-dire le nombre du sujets couverts par la source
12. la diversité internationale (tant pis pour la Gazette du Périgord)
13. le style de rédaction, en termes a) d'orthographe b) de grammaire (je me demande comment cela va être évalué!) et c) de "niveaux de lecture" (j'imagine que ce sont les notions standards de longueur de phrase, rareté du vocabulaire, etc.).
Rédigé par : stéphane | 14 juin 2005 à 10:25