26
Sep

Désindexation Google : Comment mettre de l’ordre dans votre jardin en ligne

Bienvenue dans un monde où votre jardin en ligne a besoin d’un peu d’entretien. Aujourd’hui, nous allons parler de la désindexation des pages sur Google. Pourquoi ? Eh bien, il y a plusieurs raisons pour lesquelles vous pourriez vouloir retirer certaines pages de l’index de Google. Que ce soit parce que vous ne saviez pas qu’elles étaient indexées, qu’elles créent des problèmes de contenu en double, ou qu’elles sont tout simplement de mauvaise qualité, nous avons des solutions pour vous. Préparez votre râteau numérique, car nous allons balayer vos pages indésirables !

Pourquoi désindexer des pages ?

Commençons par la question fondamentale : pourquoi voudriez-vous désindexer des pages de Google ? Eh bien, il y a plusieurs situations :

👉 Vous ne saviez pas que certaines pages étaient indexées, et cela n’était pas prévu.
👉 Certaines pages créent du contenu en double interne, et vous souhaitez vous en débarrasser.
👉 Vous estimez que certaines pages de faible qualité vous font prendre trop de risques avec l’algorithme de Google, ou même avec l’équipe qualité de la recherche si elle venait à passer par là, et vous souhaitez donc les supprimer de Google.
👉 Une ou plusieurs pages vous posent des problèmes juridiques, et vous devez les retirer au plus vite de votre site et de Google.
👉 Votre site a subi un piratage.

Et bien d’autres encore. Si vous avez déjà suivi ma formation, vous savez que je décris le concept de « masse noire », qui désigne les pages que Google crawle et indexe parfois alors qu’elles ne devraient pas l’être. Si la proportion de cette masse noire devient trop importante sur votre site, il est grand temps de faire un peu de nettoyage !

La différence entre page indexable et page indexée :

Avant de plonger dans les détails de la désindexation, comprenons la différence entre une page indexable et une page indexée.

👉 Page Indexable : Une page indexable est une page qui respecte toutes les conditions techniques pour être indexée.

👉 Page Indexée : Une page indexée est une page que Google a crawlée et « décidé » d’ajouter à son index (bien que Google puisse parfois crawler une page indexable sans l’indexer).

Il est important de noter que pour qu’une page soit indexable, elle doit évidemment être « crawlable ». Une page crawlable est une page autorisée au crawl, c’est-à-dire qu’elle n’est pas bloquée dans le fichier robots.txt, même si nous verrons plus tard un cas particulier. De plus, elle doit être accessible par Google et être d’un format pris en charge.

Comment rendre une page non-indexable :

Maintenant que nous avons clarifié ce point, passons aux étapes pour rendre une page non-indexable pour Google. La première question à se poser est de savoir si la page que vous souhaitez désindexer doit rester consultable par les internautes.

Désindexer une page toujours accessible aux internautes :

Dans ce cas, vous avez plusieurs options :


👉 Balise Meta Robots Noindex (ou None) : Ajoutez une balise meta robots noindex (ou none) pour indiquer aux moteurs de recherche que vous ne souhaitez pas que la page soit indexée. Si la page est déjà indexée, elle sera désindexée dès que Google détectera cette balise dans la page. Si elle n’est pas encore indexée, elle ne le sera pas à l’avenir.


👉 Entête HTTP Spécial (X-Robots-Tag) : Utilisez un entête HTTP spécial (X-Robots-Tag) pour la même finalité que la balise meta robots noindex. Cette méthode est particulièrement utile lorsque le document à désindexer n’est pas une page HTML, car dans ce cas, vous ne pouvez pas ajouter de balises meta. Cela s’applique aux fichiers PDF, aux documents Word ou Excel, etc.


👉 Définir une URL Canonique Différente : Dans certains cas, vous pouvez définir une URL canonique différente de l’URL de la page que vous souhaitez désindexer. Par exemple, une fiche produit peut être accessible à la fois via l’URL A et l’URL temporaire B en raison d’une promotion. Vous pouvez définir une URL canonique dans la page B faisant référence à A. Cependant, notez que l’URL canonique est un indicateur que vous fournissez à Google, qui ne s’engage pas à le respecter à 100 %.

Désindexer une page qui n’est plus accessible :

Dans ce cas, vous avez également plusieurs options :

👉 Envoyer un Code HTTP 404 ou 410 : Envoyez un code HTTP 404 (page non trouvée) ou 410 (ressource supprimée de façon permanente) pour indiquer à Google que la page n’existe plus. Le code 410 est souvent recommandé car il semble plus efficace, tandis qu’avec le code 404, il peut s’écouler plusieurs mois avant que Google ne désindexe la page.

👉 Entête HTTP Spécial (X-Robots-Tag) : Utilisez un entête HTTP spécial (X-Robots-Tag) pour désindexer une page qui n’est plus accessible. Cette méthode est particulièrement utile lorsque le document à désindexer n’est pas une page HTML.

👉 Redirection 301 vers une Autre Page : Si vous pensez que l’URL que vous souhaitez supprimer a reçu des backlinks de qualité, vous pouvez mettre en place une redirection permanente (301) vers une autre page. Cela permet de transférer le bénéfice des backlinks vers la nouvelle page. Notez que si vous utilisez cette méthode sur un grand nombre d’URL, Google pourrait les considérer comme des soft 404, et les pages pourraient ne pas être désindexées.

Comment vérifier qu’une page est non-indexable :

Pour vérifier si vous êtes dans l’une des situations mentionnées ci-dessus, vous pouvez utiliser différents outils. Cependant, je recommande l’utilisation d’un logiciel spécialisé tel que RM Tech, qui listera l’ensemble des URL des pages HTML non-indexables après une analyse complète de votre site. Cela vous permettra de confirmer que les pages non-indexables sont celles que vous avez prévues. Si l’outil liste des pages non-indexables qui devraient être indexables, cela signale une erreur grave.

Combien de temps Google mettra-t-il pour supprimer mes pages ?

Google désindexera une page uniquement lorsqu’il cherchera à y accéder, c’est-à-dire lorsque la page sera crawlée. Dans le cas d’une erreur 404, cela peut prendre beaucoup de temps. Cependant, il existe des moyens d’accélérer le processus.

Supprimer rapidement une page de Google :

Si vous avez seulement quelques pages à supprimer, ou un petit nombre, la méthode la plus efficace est de faire une demande explicite dans Google Search Console. Allez dans le module « Suppressions » et cliquez sur « Nouvelle demande ».

Cependant, si vous avez de nombreuses URL à supprimer, il peut être fastidieux de passer par des demandes individuelles dans la Search Console. Une astuce consiste à lister toutes les URL à désindexer dans un fichier sitemap. Un simple fichier texte avec une URL par ligne suffit. Déclarez ce fichier dans Search Console (rubrique Exploration > Sitemaps) et patientez. Un sitemap ne sert pas à faire indexer des pages, mais à inciter Google à crawler des URL. Grâce à ce sitemap, Google viendra rapidement crawler toutes ces URL, constatera qu’elles doivent être désindexées, et les désindexera au fur et à mesure.

Le fichier Robots.txt ne désindexe pas les pages :

Le fichier robots.txt ne gère pas l’indexation, mais le crawl. Si vous interdisez le crawl d’une URL, Google ne la crawle tout simplement plus, mais ne la désindexera pas s’il l’a déjà indexée. Une combinaison de la « demande de désindexation dans GSC + blocage dans robots.txt » peut être utilisée pour empêcher une page de revenir dans l’index de Google.

Conclusion

Voilà comment vous pouvez prendre soin de votre jardin en ligne en désindexant les pages indésirables de Google. La désindexation est un processus essentiel pour maintenir un site web propre et optimisé. Que vous ayez besoin de retirer une poignée de pages ou de désindexer un site entier, vous avez maintenant les outils et les connaissances nécessaires pour le faire. N’oubliez pas de garder un œil sur votre jardin numérique et de le maintenir en ordre pour une meilleure expérience utilisateur et un meilleur classement dans les moteurs de recherche.

Passionné par le marketing 360° et le growth hacking, Laurent Thomas pilote la stratégie marketing et les innovations produits au sein de l’agence. En veille constante, c'est désormais l'intelligence artificielle (IA), qu'il explore avec autant de fascination que d'appréhension, pour permettre aux clients de gagner en efficacité et en performance.

Laurent THOMAS, Directeur marketing, innovation et performance
Photo de profil pour Laurent THOMAS

Ce n’est pas fini !
On a aussi d’autres sujets bouillants

Sinon vous pouvez aussi
réchauffer votre veille

en vous abonnant
sur vos réseaux préférés

Planifiez un appel gratuit