Le guide ultime de robots.txt • Yoast

Joost de Valk

Joost de Valk est le fondateur et le directeur des produits de Yoast et le responsable marketing et communication de WordPress.org. Il est un spécialiste du marketing numérique, un développeur et un fanatique de l'open source.

le robots.txt Le fichier est l’un des principaux moyens de dire à un moteur de recherche où il peut et ne peut pas aller sur votre site Web. Tous les principaux moteurs de recherche prennent en charge les fonctionnalités de base qu'il offre, mais certains d'entre eux répondent à des règles supplémentaires qui peuvent également s'avérer utiles. Ce guide couvre toutes les façons d’utiliser robots.txt sur votre site Web, mais, même si cela semble simple, toutes les erreurs que vous faites dans votre robots.txt peut nuire gravement à votre site. Assurez-vous donc de lire et de comprendre l'ensemble de cet article avant de plonger.

Moteur de recherche	Champ	Agent utilisateur
Baidu	Général	`baiduspider`
Baidu	Images	`baiduspider-image`
Baidu	Mobile	`baiduspider-mobile`
Baidu	Nouvelles	`baiduspider-news`
Baidu	Vidéo	`baiduspider-video`
Bing	Général	`bingbot`
Bing	Général	`msnbot`
Bing	Images et vidéo	`msnbot-media`
Bing	Les publicités	`adidxbot`
Google	Général	`Googlebot`
Google	Images	`Googlebot-Image`
Google	Mobile	`Googlebot-Mobile`
Google	Nouvelles	`Googlebot-News`
Google	Vidéo	`Googlebot-Video`
Google	AdSense	`Mediapartners-Google`
Google	AdWords	`AdsBot-Google`
Yahoo!	Général	`slurp`
Yandex	Général	`Yandex`

Le guide ultime de robots.txt • Yoast

Qu'est ce qu'un `robots.txt` fichier?

Que fait le `robots.txt` fichier faire?

Où devrais-je mettre mon `robots.txt` fichier?

Avantages et inconvénients de l'utilisation `robots.txt`

Pro: gestion du budget d'analyse

Une note sur le blocage des paramètres de requête

Con: ne pas supprimer une page des résultats de recherche

Con: ne pas diffuser la valeur du lien

`robots.txt` syntaxe

le `Agent utilisateur` directif

Les agents utilisateurs les plus courants pour les spiders des moteurs de recherche

le `Refuser` directif

Comment utiliser des caractères génériques / expressions régulières

Non standard `robots.txt` directives d'exploration

le `Permettre` directif

le `hôte` directif

le `délai d'analyse` directif

le `plan du site` directive pour les sitemaps XML

Validez votre `robots.txt`

Qu'est ce qu'un robots.txt fichier?

Directives d'exploration

Que fait le robots.txt fichier faire?

human.txt

Où devrais-je mettre mon robots.txt fichier?

Avantages et inconvénients de l'utilisation robots.txt

Pro: gestion du budget d'analyse

Une note sur le blocage des paramètres de requête

Con: ne pas supprimer une page des résultats de recherche

Directives Noindex

Con: ne pas diffuser la valeur du lien

robots.txt syntaxe

WordPress robots.txt

le Agent utilisateur directif

Les agents utilisateurs les plus courants pour les spiders des moteurs de recherche

le Refuser directif