Quand cela se résume à cela, chaque idée en SEO peut être comprise comme un ensemble de mesures que nous utilisons pour classer une page par rapport à une autre. Et cela signifie que lorsqu’il s’agit de mesurer un concept comme le autorité de votre contenu, il existe presque certainement des facteurs que vous pouvez analyser et modifier pour l’améliorer.
Mais si Google devait utiliser une mesure d’autorité de contenu, que pourrait-il y entrer? Par rapport à quel critère les SEO devraient-ils mesurer l’E-A-T de leur contenu? Dans cet épisode de Whiteboard Friday, Russ Jones nous guide à travers une expérience de réflexion sur ce qui pourrait exactement constituer un score « d’autorité de contenu » et comment vous pouvez commencer à comprendre l’expertise de votre contenu comme Google.
Transcription vidéo
Hé, les amis, voici Russ Jones ici avec un autre tableau blanc vendredi, et aujourd’hui nous allons nous amuser. Eh bien, au moins amusant pour moi, car c’est complètement spéculatif. Nous allons parler de ce concept de autorité de contenu et juste quelques idées sur les façons dont nous pourrions être en mesure de le mesurer.
Peut-être que Google utilise ces moyens pour le mesurer, peut-être pas. Mais en même temps, j’espère que ce que nous serons en mesure de faire est de trouver un meilleur concept de métriques que nous pouvons utiliser pour obtenir l’autorité de contenu.
Maintenant, nous savons qu’il y a beaucoup de controverse à ce sujet. Google a dit très clairement que l’expertise, l’autorité et la fiabilité sont des éléments très importants de leurs directives d’évaluation de la qualité, mais les informations ont été assez minces sur la partie exacte de l’algorithme qui permet de déterminer exactement ce type de contenu.
Nous savons qu’ils n’utilisent pas les données de l’évaluateur de qualité pour former l’algorithme, mais ils l’utilisent pour rejeter les modifications d’algorithme qui ne répondent pas réellement à ces normes.
Comment mesurons-nous l’autorité du contenu?
Alors, comment pouvons-nous mesurer l’autorité du contenu? En fin de compte, toute sorte d’idée dont nous parlons dans l’optimisation des moteurs de recherche doit se résumer d’une manière ou d’une autre à un ensemble de mesures qui sont faites et en quelque sorte forme ou forme utilisée pour classer une page sur une autre.
Maintenant, parfois, il est logique de le ressentir, comme si vous écrivez pour les humains, soyez un humain. Mais le contenu faisant autorité est un peu plus difficile que cela. Il est un peu plus difficile de savoir que ce contenu fait autorité et ce n’est pas le cas. En fait, les lignes directrices pour l’évaluation de la qualité sont très claires dans certains exemples de ce qui serait considéré comme un contenu faisant vraiment autorité, comme, par exemple, dans la section Actualités, ils mentionnent qu’il est écrit par un auteur lauréat du prix Pulitzer.
Eh bien, je ne sais pas combien d’entre vous ont des auteurs lauréats du prix Pulitzer dans votre personnel ou dont les clients ont des auteurs lauréats du prix Pulitzer. Je ne vois donc pas exactement comment cela est particulièrement utile pour des personnes comme nous qui tentent de produire du contenu faisant autorité à partir d’une position de non écrivain primé.
Aujourd’hui, je veux simplement passer en revue toute une série d’idées qui m’ont traversé la tête avec l’aide de gens de la communauté qui m’ont donné des idées et fait rebondir des choses, que nous pourrions peut-être utiliser pour faire un meilleur travail de compréhension du contenu faisant autorité. D’accord.
1. ALBERT
Voilà donc ce que je considérerais comme certaines des mesures potentielles d’un contenu faisant autorité. Le premier, et cela va juste ouvrir tout un nid de rats, j’en suis sûr, mais d’accord, ALBERT. Nous avons parlé de l’utilisation de BERT pour comprendre le langage par Google. Eh bien, Albert, qui signifie « un BERT plus léger« , est un modèle similaire utilisé par Google, et il a en fait été formé dans des circonstances spécifiques dans le but de répondre aux questions.
Maintenant, cela pourrait ne pas sembler être un problème particulièrement important. Nous répondons aux questions depuis longtemps. Les extraits présentés sont exactement cela. Mais ALBERT a sauté sur la scène d’une manière si dominante qu’il a éclipsé tout ce que nous avons vraiment vu dans ce genre de problème de PNL.
Donc, si vous deviez aller au concours de jeux de données SQuAD, qui est le concours Question Answering de Stanford, où ils ont un ensemble géant de questions et un ensemble géant de documents, puis ils ont fait entrer des humains et trouver les réponses dans les documents et dire quels documents n’ont pas de réponses et lesquels en contiennent, puis toutes sortes d’organisations différentes ont produit des modèles pour essayer de trouver automatiquement les réponses.
Eh bien, cette compétition se déroule depuis très longtemps entre un tas de gros frappeurs, comme Google, Baidu, plusieurs équipes Microsoft. Nous parlons des gens les plus intelligents du monde, l’Institut Allen, tous se battant d’avant en arrière.
Eh bien, en ce moment, ALBERT ou des variantes de celui-ci ont les 5 premières positions et 9 des 10 premières positions, et tous fonctionnent mieux que les humains. C’est la domination. Nous avons donc ici cette technologie incroyable pour répondre aux questions.
Bien, qu’est-ce que cela a à voir avec l’autorité du contenu? Pourquoi diable est-ce important? Eh bien, si vous pensez à un document, à tout type de contenu que nous produisons, l’intention est que nous répondions aux questions auxquelles nos clients souhaitent répondre. Donc, tout sujet avec lequel nous commençons, disons que le sujet avec lequel nous avons commencé était la science des données, eh bien, il y a probablement beaucoup de questions que les gens veulent savoir sur ce sujet.
Ils pourraient vouloir savoir: qu’est-ce qu’un data scientist? Combien d’argent gagnent-ils? Quel genre de choses devez-vous savoir pour être un scientifique des données? Eh bien, c’est là que quelque chose comme ALBERT pourrait entrer et être extrêmement précieux pour mesurer l’autorité du contenu. Vous voyez, que se passe-t-il si l’une des mesures du contenu faisant autorité est à quel point ce contenu répond à toutes les questions liées au sujet?
Vous pouvez donc imaginer Google en train de regarder toutes les pages qui se classent pour la science des données, et ils connaissent les 10 principales questions qui sont posées à ce sujet, puis voir quel contenu répond le mieux à ces 10 questions. S’ils étaient capables de le faire, ce serait une mesure assez impressionnante pour déterminer à quel point ce contenu est approfondi et significatif, précieux, utile et faisant autorité.
Je pense donc que celui-ci, l’algorithme ALBERT a vraiment beaucoup de potentiel. Mais passons de cela. Il y a toutes sortes d’autres choses qui pourraient être liées à l’autorité du contenu.
2. Densité de l’information
Une que j’aime beaucoup est cette idée de la densité de l’information. Donc, souvent, lorsque nous écrivons du contenu, en particulier lorsque nous ne connaissons pas le sujet, nous finissons par écrire beaucoup de choses.
En quelque sorte, nous mettons simplement des mots pour respecter la longueur de mots attendue par le contrat, même si nous savons profondément que le nombre de mots sur la page ne détermine pas vraiment si cela va se classer ou non. Par conséquent, l’une des façons dont vous pouvez déterminer si un élément de contenu est réellement utile ou non ou du moins fournit des informations importantes consiste à utiliser des programmes en langage naturel pour extraire des informations.
ReVerb + OpenIE
Eh bien, la technologie open source NLP probablement la plus populaire ou au moins la technologie disponible ouvertement a commencé comme un projet appelé ReVerb et a maintenant fusionné dans le projet Open IE. Mais essentiellement, vous pouvez lui donner un élément de contenu, et il extraira toutes les allégations factuelles formulées par ce contenu.
Donc, si je lui donne un paragraphe qui dit que le tennis est un sport qui se joue avec une raquette et une balle et aujourd’hui je m’amuse beaucoup, quelque chose de ce genre, il serait en mesure d’identifier la revendication factuelle, ce qu’est le tennis , que c’est un sport joué avec une raquette et une balle.
Mais cela ignorerait l’affirmation selon laquelle je m’amuse beaucoup aujourd’hui, car ce n’est pas vraiment une information, une affirmation factuelle que nous faisons. Ainsi, le concept de densité de l’information serait le nombre de faits qui peuvent être extraits d’un document par rapport au nombre total de mots. D’accord.
Si nous avions cette mesure, nous pourrions facilement passer au crible le contenu qui est simplement écrit pour la longueur par rapport au contenu qui est vraiment riche en informations. Imaginez un article de Wikipédia, à quel point l’information est dense par rapport au type de contenu que la plupart d’entre nous produisent. Alors, quelles sont les autres choses?
3. Style de contenu
Parlons du style de contenu.
Ce serait une mesure vraiment facile. On pourrait parler de l’utilisation de citations en ligne, ce que fait Wikipédia, dans lequel après avoir déclaré un fait, ils lient ensuite au bas de la page où il vous montre la citation, tout comme vous le feriez si vous écriviez un article à l’université ou une thèse, quelque chose qui ferait autorité. Ou l’utilisation de listes de faits ou tables des matières, comme le fait Wikipedia, ou en utilisant datelines avec précision ou formatage de style AP.
Ce sont toutes des mesures très simples qui, si vous y réfléchissez, utilisent plus souvent les types de sites les plus fiables. Si tel est le cas, ils pourraient suggérer à Google que le contenu que vous produisez fait autorité. Ce ne sont donc pas les seuls faciles que nous pourrions examiner.
4. Qualité d’écriture
Il y en a beaucoup d’autres qui sont assez simples, comme la qualité de l’écriture.
Est-il facile de s’assurer que vous utilisez bonne orthographe et grammaire correcte? Mais avez-vous déjà regardé le niveau de lecture? Vous est-il déjà venu à l’esprit de vous assurer que le contenu que vous écrivez n’est pas écrit à un niveau si difficile que personne ne peut le comprendre, ou est écrit à un niveau si bas qu’il n’est certainement pas complet et ne fait pas autorité ? Si votre contenu est écrit à un niveau de troisième niveau et que la page concerne un problème de santé, j’imagine que Google pourrait utiliser cette métrique assez rapidement pour exclure votre site.
Il y a aussi des choses comme durée de la phrase, qui traite de la lisibilité, unicité du contenu, ainsi que utilisation des mots. Ceci est assez simple. Imaginez une fois de plus que nous examinons la science des données et que Google examine les mots que vous utilisez sur votre page. Alors peut-être qu’au lieu de regarder tous les sites qui mentionnent la science des données, Google ne regarde que les sites edu ou Google ne regarde que les articles publiés et compare ensuite l’utilisation de la langue là-bas.
Ce serait un moyen assez simple pour Google d’identifier un contenu destiné aux consommateurs faisant autorité par rapport à un contenu destiné aux consommateurs et non.
5. Styles de médias
Une autre chose que nous pouvons examiner est les styles de médias. C’est quelque chose qui est un peu plus difficile à comprendre comment Google pourrait réellement en profiter.
Mais en même temps, je pense que ceux-ci sont mesurables et faciles à utiliser pour les optimiseurs de moteur de recherche, comme nous.
Graphes annotés
L’un serait des graphiques annotés. Je pense que nous devrions nous éloigner des images graphiques et nous orienter davantage vers l’utilisation de bibliothèques graphiques open source. De cette façon, les informations factuelles réelles, les numéros peuvent être fournis à Google dans le code source.
Imagerie unique
L’imagerie unique est évidemment quelque chose qui nous tient à cœur. En fait, il est en fait répertorié dans les directives de l’évaluateur de qualité.
Accessibilité
Enfin, l’accessibilité compte. Je sais que l’accessibilité ne fait pas autorité sur le contenu, mais cela dit quelque chose sur le degré auquel une personne s’est souciée des détails du site et de la page. Il y a une histoire vraiment célèbre, et je ne me souviens pas du nom du groupe, mais ils ont écrit dans leurs contrats que pour chaque concert, ils devaient avoir un bol de M & Ms, avec tous les M & Ms bruns retirés, les attendant dans la chambre.
Maintenant, ce n’était pas parce qu’ils avaient un problème avec les M & Ms marron ou qu’ils aimaient vraiment les M & Ms ou quoi que ce soit de ce genre. C’était juste pour s’assurer qu’ils lisent le contrat. L’accessibilité est en quelque sorte l’une de ces choses où ils peuvent savoir si vous transpirez les détails ou non.
6. Titres Clickbait, qualité d’auteur et Google Scholar
Enfin, il y en a quelques autres qui, à mon avis, sont intéressants et doivent vraiment être discutés. Le premier est les titres de clickbait.
Titres Clickbait
Ceci est explicitement identifié comme quelque chose que Google examine ou du moins les évaluateurs de qualité examinent afin de déterminer que le contenu ne fait pas autorité. Faites dire à vos titres ce qu’ils signifient, n’essayez pas d’exagérer pour obtenir un clic.
Qualité d’auteur
Une autre chose qu’ils disent spécifiquement est de mentionner vos qualifications d’auteur. Bien sûr, vous n’avez pas d’écrivain du prix Pulitzer, mais votre écrivain a une sorte de qualifications, du moins espérons-le, et ces qualifications seront importantes pour Google pour évaluer si l’auteur sait réellement de quoi il parle .
Google Scholar
Je pense que nous devrions vraiment commencer à examiner Google Scholar. Combien d’argent pensez-vous que Google tire de Google Scholar? Probablement pas beaucoup. Quel est l’intérêt d’avoir une base de données géante d’informations académiques lorsque vous ne diffusez aucune annonce sur aucune des pages? Eh bien, peut-être que les informations académiques peuvent être extraites de manière à ce qu’elles puissent juger du contenu qui est fait pour les consommateurs pour savoir si elles sont conformes ou non, si nous parlons de faits ou de langue ou d’autorité, avec quel milieu universitaire dit sur ce même sujet.
Maintenant, bien sûr, toutes ces idées ne sont que des idées. Nous avons un point d’interrogation géant sur la façon dont Google obtient l’autorité en matière de contenu. Cela ne signifie pas que nous devons l’ignorer. J’espère donc que ces idées vous aideront à trouver des idées pour améliorer votre propre contenu, et peut-être pourriez-vous me donner d’autres idées dans la section des commentaires.
Ce serait formidable et nous pourrions parler davantage de la façon dont ceux-ci pourraient être mesurés. Je l’attends avec impatience. Merci encore.