Que vous soyez novice en référencement ou en tant qu’expert professionnel, recherchez des des baisses dans le classement des mots clés fait partie du commerce.

Il existe de nombreuses méthodes pour rechercher la raison pour laquelle vos mots clés ciblés ont peut-être été abandonnés, mais utiliser Python et Data Studio ensemble change la donne!

Un avertissement rapide: je n'ai pas créé ce script moi-même. Evan, architecte chez SEO et développeur, d’Architek, a collaboré avec moi pour résoudre un de mes besoins particuliers. Evan était le cerveau derrière la création du script.

J'ai toujours souhaité pouvoir visualiser un grand nombre de résultats Google à l'échelle, sans avoir à effectuer ces recherches manuellement, une par une.

Evan a mentionné que Python pourrait être la solution idéale pour résoudre mes besoins d’investigation SEO.

Pourquoi Python est pertinent pour le référencement

Python est un langage de programmation incroyablement puissant qui peut faire à peu près tout. L’une des utilisations les plus courantes de Python est l’automatisation des tâches monotones quotidiennes.

L’un des aspects les plus intéressants de Python est qu’il existe différentes manières de réaliser la même tâche. Cependant, cela ajoute également un nouveau niveau de difficulté.

La plupart des exemples de scripts Python peuvent être un peu dépassés. Vous devrez donc faire beaucoup d'essais et d'erreurs.

Python a de nombreuses applications pour analyse des données de référencement. La clé est d'avoir la bonne idée. Si vous avez l’idée d’automatiser une tâche, il est probable qu’un script puisse être créé pour cette tâche.

Pour rester à jour avec les derniers cas d'utilisation de Python en référencement, Hameau Batista a publié des articles remarquables ici dans le Search Engine Journal.

Ce que ce script spécifique fait et ne fait pas

La plupart des outils de classement des mots clés indiquent le classement moyen d'un mot clé sur une période donnée. Ce script Python exécute une seule analyse au moment où vous l'exécutez à partir de votre adresse IP. Ce script n'est pas destiné à suivre les classements des mots clés.

Le but de ce script était de résoudre un problème que je rencontrais lors de mon enquête sur les chutes subites de classements chez mes clients et leurs concurrents.

La plupart des outils de classement des mots-clés vous indiqueront les pages pour lesquelles votre domaine est classé, mais pas les pages les mieux classées de vos concurrents par mot-clé.

Alors pourquoi est-ce important?

Dans ce scénario, nous ne visons pas la performance des pages pour le long terme. Nous essayons simplement d’obtenir des données rapides.

Ce script nous permet d'identifier rapidement les tendances du paysage organique et de déterminer les pages les plus performantes.

Ce dont vous aurez besoin pour commencer

Si vous êtes nouveau sur Python, je vous recommande de consulter la tutoriel officiel sur Python ou Automatiser le truc ennuyeux.

Pour ce tutoriel, j’utilise PyCharm CE, mais vous pouvez utiliser Sublime Text ou l’environnement de développement de votre choix.

Ce script est écrit en Python 3 et peut être un peu avancé pour les débutants dans ce langage de programmation.

Si vous n'avez pas encore trouvé d'interprète ou configuré votre premier environnement virtuel, ce guide peut vous aider à démarrer.

Une fois que vous avez configuré un nouvel environnement virtuel, vous aurez besoin des bibliothèques suivantes:

Maintenant que vous êtes tous installés, passons à la recherche ensemble.

1. Dressez une liste de mots-clés à étudier

Nous allons utiliser des exemples de données pour étudier des mots clés que nous prétendons suivre.

Supposons que vous ayez consulté votre logiciel de suivi des mots clés et constaté que les mots-clés suivants ont perdu plus de cinq positions:

  • Conseils de référencement
  • Conseils de référencement local
  • Apprendre le référencement
  • Articles sur l'optimisation des moteurs de recherche
  • Blog SEO
  • Notions de base sur le référencement

Avertissement: * La recherche de trop de mots-clés peut entraîner l'interdiction temporaire de votre adresse IP. Pinguer Google pour autant de résultats à la fois peut sembler spammeur et épuiser ses ressources. Utilisez avec prudence et modération.

La première chose à faire est de placer ces mots-clés dans un simple fichier texte. Les mots clés doivent être séparés par un saut de ligne, comme indiqué dans la capture d'écran ci-dessous.

Exemple de mots-clés pour rechercher avec Python

2. Exécuter le script d’investigation Python Ranking

Le TL; DR de ce script est qu’il remplit trois fonctions de base:

  • Localise et ouvre votre fichier search.txt.
  • Utilise ces mots-clés et recherche chaque résultat dans la première page de Google.
  • Crée un nouveau fichier CSV et imprime les résultats (mot clé, URL et titres de page).

Nous avons rendu ce script facile à exécuter, vous pouvez donc simplement copier et coller le script entier et l'exécuter en une seule fois.

depuis urllib.parse import urlencode, urlparse, parse_qs

depuis lxml.html import fromstring
à partir des demandes d'importation obtenir
importer csv

Vous pourrez ensuite saisir la fonction principale de ce script en une seule opération copier / coller. Cette partie du script définit les étapes réellement effectuées, mais n'exécutera pas la commande avant la troisième étape.

def scrape_run ():
    avec open ('search.txt') comme recherches:
        pour la recherche dans les recherches:
           userQuery = recherche
           raw = get ("https://www.google.com/search?q=" + userQuery) .text
           page = fromstring (raw)
           links = page.cssselect ('.r a')
           csvfile = 'data.csv'
           pour la ligne dans les liens:
               raw_url = row.get ('href')
               title = row.text_content ()
               Si raw_url.startswith ("/ url?"):
                   url = parse_qs (urlparse (raw_url) .query)['q']
                   csvRow = [userQuery, url[0], Titre]avec open (csvfile, 'a') comme donnée:
                       writer = csv.writer (données)
                       writer.writerow (csvRow)

Vous êtes maintenant prêt à exécuter la commande. La dernière étape consiste à copier / coller la commande ci-dessous et à cliquer sur la touche de retour.

scrape_run ()

C'est tout!

3. Utiliser Data Studio pour analyser les résultats

En exécutant cette commande, vous remarquerez peut-être qu'un nouveau fichier CSV appelé data.csv a été créé. Ce sont vos résultats bruts, dont nous aurons besoin pour la dernière étape.

Mon agence a créé un outil pratique Modèle Data Studio pour analyser vos résultats. Pour utiliser ce rapport gratuit, vous devez coller vos résultats dans Google Sheets.

La page dans le lien ci-dessus contient des instructions détaillées sur la configuration de votre rapport Data Studio.

Comment analyser nos résultats

Maintenant que votre nouveau rapport Data Studio est implémenté, il est temps de donner un sens à toutes ces données.

Ce que nous recherchons, ce sont des modèles. Oui, vous pouvez trouver des modèles dans les données brutes, mais ce modèle Data Studio est doté d'une fonctionnalité pratique qui nous permet d'identifier rapidement les pages les plus fréquemment classées pour nos mots clés ciblés.

Cela est utile, car cela nous permet de voir quels concurrents ont de bonnes performances et quelles pages spécifiques fonctionnent bien.

Modèle Data Studio pour l'analyse des données de récupération Web python

Comme vous pouvez le voir dans la capture d'écran de Data Studio ci-dessus, Moz et Ahrefs sont les deux principaux concurrents pour le classement de nos mots clés recherchés.

Cependant, cela ne nous aide pas vraiment à savoir exactement ce qu'ils font pour classer ces mots clés.

C’est là que le deuxième graphique est utile. Cela affiche chaque page de classement et le nombre de fois où elles se produisent pour toutes nos requêtes de recherche. Nous sommes rapidement en mesure d'identifier les trois pages les plus performantes pour nos mots clés.

Besoin de filtrer jusqu'à un niveau spécifique à une page ou à un mot clé?

Nous avons inclus des filtres en haut du modèle Data Studio pour simplifier cela.

filtres de studio de données

Une fois que vous avez dressé la liste des pages les plus performantes, vous pouvez effectuer des analyses supplémentaires page par page et hors page pour déterminer pourquoi ces pages fonctionnent si bien.

Être coincé?

Si vous êtes bloqué, atteindre à l'inventeur de ce script pour obtenir des conseils ou des solutions de programmation personnalisées.

Quelle est ton idée?

Espérons que cela a suscité des idées créatives sur la façon dont vous pouvez utiliser Python pour aider à automatiser vos processus de référencement.

Plus de ressources:


Crédits d'image

Toutes les captures d'écran prises par l'auteur, mai 2019





Source link