Il existe une sorte d’algorithme de liaison qui n’est pas assez discuté, pas assez. Cet article est conçu comme une introduction aux algorithmes de classement des distances de liens. C’est quelque chose qui peut jouer un rôle dans le classement des sites. À mon avis, il est important d’en être conscient.

Google utilise-t-il cela?

Bien que l'algorithme considéré soit issu d'un brevet déposé par Google, la déclaration officielle de Google sur les brevets et les documents de recherche indique qu'ils en produisent beaucoup, qu'ils ne sont pas tous utilisés et qu'ils sont parfois utilisés de manière différente. ce qui est décrit

Cela dit, les détails de cet algorithme semblent correspondre aux contours de ce que Google a officiellement déclaré sur la façon dont il gère les liens.

Complexité des calculs

Le brevet comporte deux parties (Produire un classement pour les pages utilisant des distances dans un graphique de lien Web) qui indiquent la complexité des calculs:

«Malheureusement, cette variation du PageRank nécessite de résoudre séparément le système entier pour chaque graine. Par conséquent, à mesure que le nombre de pages de semences augmente, la complexité du calcul augmente de façon linéaire, ce qui limite le nombre de semences pouvant être utilisées de manière pratique. ”

Il faut donc une méthode et un appareil pour produire un classement des pages sur le Web en utilisant un grand nombre de pages de départ diversifiées… »

Ce qui précède souligne la difficulté de réaliser ces calculs sur le Web en raison du grand nombre de points de données. Il indique que, en décomposant ces domaines par sujet, les calculs sont plus faciles à calculer.

L’intérêt de cette affirmation est que l’algorithme Penguin original a été calculé une fois par an ou plus. Les sites qui ont été pénalisés sont restés pratiquement pénalisés jusqu'à la prochaine date, apparemment aléatoire, à laquelle Google a recalculé le score Penguin.

À un moment donné, l’infrastructure de Google doit s’être améliorée. Google construit constamment sa propre infrastructure mais ne l’annonce apparemment pas. le Système d'indexation Web sur la caféine est l'une des exceptions.

Penguin en temps réel déployé à l'automne 2016.

Il est à noter que ces calculs sont difficiles. Il indique la possibilité que Google effectue un calcul périodique pour l’ensemble du Web, puis attribue des scores en fonction des distances entre les sites de confiance et tous les autres sites. Ainsi, un calcul gigantesque, fait une année.

Ainsi, quand un SERP est calculé via PageRank, les scores de distance sont également calculés. Cela ressemble beaucoup au processus que nous connaissons sous le nom d'algorithme de Penguin.

«Le système attribue ensuite des longueurs aux liens en fonction des propriétés des liens et des propriétés des pages attachées aux liens. Le système calcule ensuite les distances les plus courtes entre le jeu de pages de départ et chaque page du jeu de pages en fonction de la longueur des liens entre les pages. Ensuite, le système détermine un score de classement pour chaque page du jeu de pages en fonction des distances les plus courtes calculées. ”

Que fait le système?

Le système crée un score basé sur la distance la plus courte entre un ensemble de semences et les pages classées proposées. Le score est utilisé pour classer ces pages.

Il s’agit donc essentiellement d’une superposition au-dessus du score de classement PageRank pour aider à éliminer les liens manipulés, en partant de la théorie selon laquelle les liens manipulés auront naturellement une plus longue distance de connexions de lien entre la page de courrier indésirable et l’ensemble de confiance.

On peut dire que le classement d’une page Web se compose de trois processus.

  • Indexage
  • Classement
  • Modification du classement (généralement liée à la personnalisation)

C’est une réduction extrême du processus de classement. Il y a beaucoup plus qui se passe.

Fait intéressant, ce processus de classement à distance se produit pendant la partie classement du processus. Sous cet algorithme, il n’ya aucune chance de se classer pour des phrases significatives à moins que la page ne soit associée au jeu de semences.

Voici ce qu'il dit:

«Une variante possible du PageRank qui réduirait les effets de ces techniques consiste à sélectionner quelques pages« de confiance »(également appelées les pages de départ) et à découvrir d'autres pages susceptibles d'être utiles en suivant les liens des pages de confiance. . « 

Il s'agit d'une distinction importante, savoir dans quelle partie du processus de classement le calcul de la graine est effectué, car cela nous aide à formuler notre stratégie de classement.

Ceci est différent de la chose Yahoo TrustRank. YTR s'est avéré biaisé.

On peut dire que Topical TrustFlow de Majestic est une version améliorée, semblable à un document de recherche qui a démontré qu’en utilisant un ensemble de semences organisé par thèmes de niche, on est plus précis. Des recherches ont également montré que l’organisation d’un algorithme d’ensemencement par sujet correspond à plusieurs ordres, mieux que de ne pas le faire.

Il est donc logique que l’algorithme de classement des distances de Google organise également son jeu de départ par catégories de sujets de niche.

Si je comprends bien, ce brevet Google calcule les distances entre un groupe de semences et attribue des scores de distance.

Graphique de lien réduit

« Dans une variante de ce mode de réalisation, les liens associés aux distances les plus courtes calculées constituent un graphe de lien réduit. »

Cela signifie qu’il existe une carte de l’Internet connue sous le nom de graphe de liens, puis une version plus petite, le graphe de liens rempli de pages Web filtrées par des pages de spam. Les sites qui obtiennent principalement des liens en dehors du graphique de liens réduits risquent de ne jamais y pénétrer. Les liens sales ne reçoivent donc aucune traction.

Qu'est-ce qu'un graphe de lien réduit?

Je vais garder ça court et gentil. Le lien vers le document suit ci-dessous.

Ce que vous devez vraiment savoir, c'est cette partie:

«Les premiers succès des algorithmes de classement basés sur les liens reposaient sur l'hypothèse selon laquelle les liens impliquent le mérite des pages cibles. Cependant, de nombreux liens existent aujourd'hui à des fins autres que celles conférant une autorité. De tels liens introduisent du bruit dans l'analyse des liens et nuisent à la qualité de la récupération.

Afin de fournir des résultats de recherche de haute qualité, il est important de les détecter et de réduire leur influence… À l'aide d'un classificateur, ces liens bruyants sont détectés et supprimés. Après cela, des algorithmes d’analyse de lien sont exécutés sur le graphe de lien réduit. ”

Lisez ce PDF pour plus informations sur les graphes à liens réduits.

Si vous obtenez des liens sur des sites tels que des organisations de presse, il peut être juste de supposer qu’ils se trouvent à l’intérieur du graphique de liens réduits. Mais font-ils partie de la graine? Peut-être que nous ne devrions pas être obsédés par ça.

Pourquoi Google dit-il que le SEO négatif n’existe pas?

“… Les liens associés aux distances les plus courtes calculées constituent un graphe de lien réduit”

Un graphe de lien réduit est différent d'un graphe de lien. Un graphe de liens peut être considéré comme une carte de l’ensemble de l’Internet organisée par les relations de liens entre sites, pages ou même des parties de pages.

Ensuite, il y a un graphique de lien réduit, qui est une carte de tout sauf certains sites qui ne répondent pas à des critères spécifiques.

Un graphique de lien réduit peut être une carte du Web moins les sites non spam. Les sites situés en dehors du graphe de liens réduit n'auront aucun effet sur les sites situés à l'intérieur du graphe de liens, car ils sont situés à l'extérieur.

C’est probablement pour cette raison qu’un lien vers un site de courrier indésirable vers un site normal n’aura pas d’effet négatif sur un site non spam. Étant donné que le site de courrier indésirable se situe en dehors du graphe de liens réduits, il n’a aucun effet. Le lien est ignoré.

Cela pourrait-il être la raison pour laquelle Google est si confiant qu’il capture le spam sur les liens et qu’il n’existe pas de SEO négatif?

Distance de la série de semences est égale à moins de puissance de classement?

Je ne pense pas qu’il soit nécessaire d’essayer de cartographier l’ensemble de semences. Le plus important, à mon avis, est de connaître les quartiers d’actualité et leur lien avec les sites où vous obtenez vos liens.

À une époque, Google affichait publiquement un score de PageRank pour chaque page, afin que je puisse me rappeler quels types de sites avaient tendance à avoir des scores bas. Il existe une catégorie de sites dont le PageRank et le Moz DA sont faibles, mais ils sont étroitement liés à des sites qui, à mon avis, sont probablement situés à quelques clics de la graine.

Ce que Moz DA mesure est une approximation de l’autorité d’un site. C’est un bon outil. Cependant, ce que mesure Moz DA peut ne pas être à une distance d’un ensemble de semences, impossible à connaître car c’est un secret de Google.

Je ne dépose donc pas l’outil Moz DA, continuez à l’utiliser. Je suggère simplement que vous souhaitiez peut-être développer vos critères et définir ce qu'est un lien utile.

Qu'est-ce que cela signifie d'être proche d'un lot de semences?

De Document de classe de l'université de Stanford, page 17 demande: Qu'est-ce qu'une bonne notion de proximité? Les réponses sont:

  • Connexions multiples
  • Qualité de connexion
  • Connexions directes et indirectes
  • Longueur, Degré, Poids

C'est une considération intéressante.

À emporter

Beaucoup de gens s'inquiètent des ratios de texte d'ancrage, DA / PA des liens entrants, mais je pense que ces considérations sont un peu anciennes.

Le problème avec DA / PA est un retour en arrière sur la difficulté d'obtenir des liens à partir de pages avec un PageRank de 4 ou plus, une pratique qui a commencé à partir d'un score PageRank choisi au hasard, le numéro quatre.

Lorsque nous parlons de ou pensons à lorsque nous considérons des liens dans le contexte du classement, il peut être utile de considérer le classement à distance dans le cadre de cette conversation.

Lire le brevet ici
https://www.google.com/patents/US9165040

Images by Shutterstock, Modifié par l'auteur



Source link