Depuis notre premier billet sur ce blog, vous avez pu commencer à découvrir ce qu’est Babbar d’un point de vue technique. Et ce coté technique, nous en sommes très fiers car nous avons réussi à mettre en place une infrastructure et une stack logicielle vraiment au top.
Mais l’objectif de Babbar reste d’abord de proposer à la communauté webmarketing et SEO un outil qui propose de l’information sincère et utile sur la structure du graphe du web, et sur la sémantique de haut niveau qui « gouverne » ce graphe. Dans ce billet nous allons aborder ces métriques.
Il n’est pas encore question de voir les process métiers que l’on peut réaliser avec nos métriques, mais simplement de les présenter, dans le but que vous puissiez commencer à voir l’intérêt de se doter de l’outil pour votre pratique du SEO.
Avant de commencer la description, voyons d’abord le « scope » de tout ceci. Le graphe du web représente les « interactions » via les liens entre les pages. Toutes les métriques de linking que calcule un moteur de recherche moderne sont donc d’abord des métriques au niveau des pages (c’est-à-dire au niveau des URLs). Pour faciliter la compréhension et la prise de décision, on peut agréger ces métriques au niveau des hosts. Les hosts c’est les sous-domaines, et c’est donc souvent ce qui est le plus proche techniquement de ce que le grand public va appeler « site web ».
Il est donc raisonnable de s’intéresser aux caractéristiques en terme de linking des pages web (URLs) et des sites web (hosts).
Mais la plupart des outils (et Babbar est dans le lot) proposent des métriques au niveau domaine également. Est-ce vraiment utile pour le SEO ? Cela se discute, et si nous fournissons les métriques domaines c’est d’abord parce qu’une partie des SEOs ont construit des process à partir de ce niveau de granularité. Mais la validité des décisions SEOs prises avec des métriques au niveau domaine peut se discuter (et devrait l’être d’ailleurs).
Bref, une fois que ceci est dit, nous pouvons passer aux métriques.
Page/Host et Domain Value
Babbar propose aux trois niveaux de granularité une métrique qui quantifie la popularité. Il y a donc le Page Value (PV), la Host Value (HV) et la Domain Value (DV).
A la base nous calculons la PV avec une méthode de calcul dite en streaming, qui approxime le comportement du surfeur aléatoire raisonnable. C’est donc une métrique proche du pagerank raisonnable, sans utilisation de la sémantique des liens.
La PV est ensuite agrégée au niveau host pour donner la HV, et au niveau domaine pour la DV.
La métrique de type Value est conçue pour renvoyer des valeurs entre 0 et 100 et sur le web on s’attend à un centrage des valeurs autour de 50. Avec 77, le site des frères Peyronnet (sur l’image) est un site plutôt populaire.
Page/ Host et Domain Trust
Babbar propose aux trois niveaux de granularité une métrique pour mesurer la confiance que l’on peut accorder à un site. Il y a donc le Page Trust (PT), la Host Trust (HT) et la Domain Trust (DT).
Le calcul est effectué avec un algorithme de transmission de confiance de type Trustrank. L’élément de base est la page, et l’agrégation aux niveaux des hosts et domaines est faite a posteriori.
La confiance est toujours entre 0 et 100, et les valeurs ne sont pas comparables directement à celle de la valeur (popularité). Si vous êtes familier d’autres métriques de confiance, vous remarquerez assez vite que Babbar est plus sévère que d’autres, et que beaucoup de petits sites ont des valeurs de confiance assez faibles.
Avec 20 le site des frères Peyronnet (sur l’image) est un site avec un niveau de confiance plutôt bas.
A titre de comparaison, www.abondance.com a une HT de 41 (et une HV de 85, il est donc dans la league du dessus…).
Semantic Value pour page, host et domain
Une métrique de popularité, une autre de confiance, vous allez pouvoir nous dire qu’il n’y a rien de neuf sous le soleil a part éventuellement dans la qualité du calcul. Et effectivement jusqu’ici nous vous avons laissé en terre connue. Mais voilà maintenant la première métrique nouvelle (Babbar est probablement le seul opérateur a pouvoir vous la fournir) : la Semantic Value (SV).
Nous calculons cette valeur sémantique aux trois niveaux de granularité. Il s’agit d’une métrique de popularité comme les PV, HV et DV, mais qui prend en compte l’adéquation sémantique entre les pages sources des backlinks qui pointent vers la page, le host ou le domaine analysé, et les pages cibles de ces backlinks. C’est donc un modèle de type surfeur aléatoire thématique (pagerank thématique) qui est au coeur de cette métrique.
En terme d’audit de site web, c’est la métrique de choix pour déterminer si le profil de liens est thématisé. En effet, quand il est thématisé au maximum, la SV est très proche, égale voire supérieure à la PV/HV ou DV (selon le niveau que l’on observe).
www.abondance.com a une HV de 85 et une SV niveau host de 84, son profil de liens est bien cohérent thématiquement.
A contrario, un site généraliste de type www.spoonylife.org aura une HV de 76 et une SV niveau host de 65, montrant que les liens vers le site ne sont pas tous en cohérence avec ce que le moteur comprend de la sémantique « locale ».
Si vous achetez des liens, il faut regarder la SV d’un site qui est dans votre thématique comme étant le meilleur indicateur de sa popularité réelle.
Internal Page Value
Il s’agit de la popularité interne de la page dans le host qui la contient. C’est l’analogue du pagerank interne que vous calculeriez avec, par exemple, screaming frog et gephi, avec en plus un modèle de surfeur raisonnable.
Force induite
Pour finir, Babbar vous permet de simuler la force induite d’un hypothétique lien entre deux pages. Les trois caractéristiques d’un bon lien, nous les connaissons tous :
- Un bon lien vient d’une page qui transmet de la popularité.
- Un bon lien est thématisé.
- Un bon lien ne vient pas du dernier dépotoir à la mode, il est de confiance.
La force induite est une métrique qui va utiliser la PV, la PT et la distance sémantique entre les contenus des deux pages source et cible du lien pour donner un score unique qui englobe toutes les caractéristiques que l’on souhaite. Comme il est difficile de donner une réponse parfaite à tous les coups, Babbar va parfois faire quelques approximations, et nous indiquerons systématiquement le niveau de certitude de notre calcul de force induite. Nous faisons cela avec soit le mot « LOW » soit le mot « HIGH » à coté de la valeur chiffrée, selon le niveau de certitude sur la validité du calcul.