Qu’est-ce qu’un contenu dupliqué?

Le contenu dupliqué est défini comme un contenu qui est une copie exacte du contenu trouvé ailleurs. Cependant, le terme contenu en double peut également faire référence à un contenu presque identique (comme le simple échange d’un produit, d’un nom de marque ou d’un nom d’emplacement uniquement).

Le simple fait d’échanger quelques mots n’empêchera pas nécessairement une page d’être considérée comme du contenu dupliqué. En réponse, vos performances de recherche organique peuvent voir un effet négatif.

Le contenu en double fait également référence à un contenu identique sur plusieurs pages Web de votre site ou sur deux ou plusieurs sites distincts. Cependant, il existe de nombreuses méthodes pour éviter ou minimiser l’impact du contenu dupliqué qui peut être géré par des correctifs techniques.

Dans ce guide, j’examinerai plus en détail les causes du contenu dupliqué, les meilleurs moyens de l’éviter et comment m’assurer que les concurrents ne peuvent pas copier votre contenu et prétendre être le créateur d’origine.

L’impact du contenu dupliqué

Les pages créées avec du contenu en double peuvent entraîner plusieurs ramifications dans les résultats de recherche Google et, parfois, même des pénalités. Les problèmes de contenu en double les plus courants incluent:

  • La mauvaise version des pages affichées dans les SERPs

  • Les pages clés ne fonctionnent pas correctement dans les SERP ou rencontrent des problèmes d’indexation

  • Fluctuations ou diminutions des indicateurs de base du site (trafic, positions de classement ou critères E-A-T)

  • Autres actions inattendues des moteurs de recherche suite à des signaux de hiérarchisation confus

Bien que personne ne sache quels éléments du contenu seront priorisés et dépriorisés par Google, le géant des moteurs de recherche a toujours conseillé aux webmasters et aux créateurs de contenu de « Créer des pages principalement pour les utilisateurs, pas pour les moteurs de recherche. »

Dans cet esprit, le point de départ de tout webmaster ou SEO devrait être de créer un contenu unique qui apporte une valeur unique aux utilisateurs. Cependant, ce n’est pas toujours facile ni même possible. Des facteurs tels que la création de modèles de contenu, la fonctionnalité de recherche, les balises UTM, le partage d’informations ou la syndication de contenu peuvent présenter un risque de duplication.

S’assurer que votre propre site ne court pas le risque de duplication de contenu implique une combinaison d’une architecture claire, d’une maintenance régulière et d’une compréhension technique pour lutter autant que possible contre la création de contenu dupliqué.

Méthodes pour éviter le contenu dupliqué

Il existe de nombreuses méthodes et stratégies différentes pour empêcher la création de contenu dupliqué sur votre propre site et pour empêcher d’autres sites de bénéficier de la copie de votre contenu:

Taxonomie

Pour commencer, il est judicieux d’examiner de manière générale la taxonomie de votre site. Que vous ayez un document nouveau, existant ou révisé, cartographier les pages d’une analyse et attribuer un mot clé H1 et focus unique est un bon début. Organiser votre contenu dans un groupe de sujets peut vous aider à développer une stratégie réfléchie qui limite la duplication.

Balises canoniques

L’élément le plus important dans la lutte contre la duplication de contenu sur votre propre site ou sur plusieurs sites est peut-être les balises canoniques.

L’élément rel = canonical est un extrait de code HTML qui indique clairement à Google que l’éditeur possède un élément de contenu même lorsque le contenu peut être trouvé ailleurs. Ces balises indiquent à Google quelle version d’une page est la «version principale».

La balise canonique peut être utilisée pour les versions imprimées ou Web du contenu, les versions de pages mobiles et de bureau ou les pages de ciblage géographique multiples. Il peut être utilisé pour toutes les autres instances où existent des pages en double qui proviennent également de la page de version principale.

Il existe deux types de balises canoniques, celles qui pointent vers une page et celles qui pointent vers une page. Ceux qui pointent vers une autre page indiquent aux moteurs de recherche qu’une autre version de la page est la «version principale».

L’autre est ceux qui se reconnaissent comme la version principale, également connue sous le nom de balises canoniques auto-référencées. Le référencement des canoniques est un élément essentiel de la reconnaissance et de l’élimination du contenu dupliqué, et les canoniques d’auto-référencement sont une question de bonne pratique.

Marquage méta

Les méta robots et les signaux que vous envoyez actuellement aux moteurs de recherche à partir de vos pages sont un autre élément technique utile à rechercher lors de l’analyse du risque de contenu dupliqué sur votre site.

Les balises Meta robots sont utiles si vous souhaitez exclure une ou plusieurs pages de l’indexation par Google et préférez qu’elles ne s’affichent pas dans les résultats de recherche.

En ajoutant la balise Meta robots « no index » au code HTML de la page, vous indiquez effectivement à Google que vous ne voulez pas qu’elle soit affichée sur les SERPs. C’est la méthode préférée pour le blocage de Robots.txt, car cette méthodologie permet un blocage plus granulaire d’une page ou d’un fichier particulier, alors que Robots.txt est le plus souvent une entreprise à plus grande échelle.

Bien que cette instruction puisse être donnée pour de nombreuses raisons, Google comprendra cette directive et devrait exclure les pages en double des SERPs.

Gestion des paramètres

Les paramètres d’URL indiquent comment explorer les sites de manière efficace et efficiente vers les moteurs de recherche. Les paramètres provoquent souvent une duplication du contenu car leur utilisation crée des copies d’une page. Par exemple, s’il y avait plusieurs pages produits différentes du même produit, il serait considéré comme un contenu en double par Google.

Cependant, la gestion des paramètres facilite l’exploration plus efficace et efficiente des sites. L’avantage pour les moteurs de recherche est prouvé, et leur résolution pour éviter de créer du contenu dupliqué est simple. En particulier pour les sites plus volumineux et les sites dotés d’une fonctionnalité de recherche intégrée, il est important d’utiliser la gestion des paramètres via Google Search Console et Bing Webmaster Tools.

En indiquant les pages paramétrées dans l’outil respectif et en signalant à Google, il peut être clair pour le moteur de recherche que ces pages ne doivent pas être explorées et quelles mesures supplémentaires, le cas échéant, doivent prendre.

URL en double

Plusieurs éléments d’URL structurels peuvent entraîner des problèmes de duplication sur un site Web. Beaucoup de ces problèmes sont dus à la façon dont les moteurs de recherche perçoivent les URL. S’il n’y a pas d’autres directives ou instructions, une URL différente signifiera toujours une page différente.

Ce manque de clarté ou une mauvaise signalisation involontaire peut provoquer des fluctuations ou des diminutions des métriques de base du site (trafic, positions de classement ou critères E-A-T) s’il n’est pas traité. Comme nous l’avons déjà expliqué, les paramètres d’URL causés par la fonctionnalité de recherche, les codes de suivi et d’autres éléments tiers peuvent entraîner la création de plusieurs versions d’une page.

Les manières les plus courantes de dupliquer des versions d’URL sont les suivantes: versions HTTP et HTTPS des pages, www. et non-www., et les pages avec des barres obliques et celles sans.

Dans le cas de www. vs non-www et slash de fin vs slash non de fin, vous devez identifier la version la plus couramment utilisée sur votre site et vous en tenir à cette version sur toutes les pages pour éviter le risque de duplication. En outre, les redirections doivent être configurées pour diriger vers la version de la page qui doit être indexée et éliminer le risque de duplication, par exemple, mysite.com> www.monsite.com.

D’un autre côté, les URL HTTP représentent un problème de sécurité car la version HTTPS de la page utiliserait le cryptage (SSL), rendant la page sécurisée.

Redirige

Les redirections sont très utiles pour éliminer le contenu en double. Les pages dupliquées à partir d’une autre peuvent être redirigées et renvoyées vers la version principale de la page.

Lorsqu’il y a des pages sur votre site avec des volumes élevés de trafic ou de valeur de lien qui sont dupliqués à partir d’une autre page, les redirections peuvent être une option viable pour résoudre le problème.

Lorsque vous utilisez des redirections pour supprimer du contenu en double, il y a deux choses importantes à retenir: redirigez toujours vers la page la plus performante pour limiter l’impact sur les performances de votre site et, si possible, utilisez la redirection 301. Si vous souhaitez plus d’informations sur les redirections à mettre en œuvre, consultez notre guide des redirections 301.

Et si mon contenu a été copié contre ma volonté?

Que devez-vous faire si votre contenu a été copié et que vous n’avez pas utilisé de balise canonique pour indiquer que votre contenu est l’original?

  • Utilisez la Search Console pour identifier la fréquence à laquelle votre site est indexé.

  • Contactez le webmaster responsable du site qui a copié votre contenu et demandez une accréditation ou une suppression.

  • Utilisez des balises canoniques auto-référencées sur tous les nouveaux contenus créés pour vous assurer que votre contenu est reconnu comme la «véritable source» des informations.

Examen du contenu en double

Éviter le contenu dupliqué commence à se concentrer sur la création d’un contenu de qualité unique pour votre site; cependant, les pratiques pour éviter le risque que d’autres vous copient peuvent être plus complexes. Le moyen le plus sûr d’éviter les problèmes de contenu en double est de bien réfléchir à la structure du site et de concentrer vos utilisateurs et leurs déplacements sur place. Lorsque la duplication de contenu se produit en raison de facteurs techniques, les tactiques couvertes devraient réduire le risque pour votre site.

Lors de l’examen des risques de contenu dupliqué, il est important d’envoyer les bons signaux à Google pour marquer votre contenu comme la source d’origine. Cela est particulièrement vrai si votre contenu est syndiqué ou si vous avez trouvé que votre contenu avait déjà été répliqué par d’autres sources.

En fonction de la façon dont la duplication s’est produite, vous pouvez utiliser une ou plusieurs tactiques pour établir le contenu comme ayant une source originale et reconnaître les autres versions comme des doublons.