Le sitemap à quoi sert ? Quel est son rôle au SEO ?

  • 28 February 2020
  • Seo

Un fichier sitemap contient la liste des urls du site web. Il a pour rôle d’indiquer aux robots des moteurs de recherche quelles sont les urls à indexer et quelles pages à lire et à analyser. Le fichier sitemap peut avoir le format d’un fichier texte ou d’un fichier XML.

Qu’est-ce qu’un sitemap ?

Le sitemap est un fichier au format XML ou Texte regroupant les URL internes d’un site web que l’on souhaite faire crawler par les moteurs de recherche. Pour faire simple, ce fichier est ni plus ni moins qu’un moyen d’indiquer aux robots de prendre en compte certaines URL. Ces robots respectent une logique d’indexation (protocole naturel) qu’il convient d’assimiler :

  1. Les robots vont commencer par lire le contenu de votre fichier robots.txt. Pour en savoir plus concernant ce fichier, rendez-vous dans cet article.
  2. Une fois qu’ils ont pris connaissance de vos instructions (via le robots.txt), ils vont télécharger le répertoire principal (la racine) de votre site web : www.votresite.com
  3. Une fois le contenu de ce répertoire analysé, ils vont extraire l’ensemble des liens internes qui figurent sur cette page
  4. Chaque lien extrait va à son tour être exploré et téléchargé jusqu’à ce que les robots remarquent l’absence de « nouveaux liens » (qu’ils crawleront par la suite)

Format des fichiers Sitemaps

Le format « Sitemap Protocol » décrit un fichier XML qui va fournir des indications pour chaque page de votre site.
Le fichier créé sera de la forme :

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/Sitemap/0.84">
<url>
<loc>url</loc>
<lastmod>date</lastmod>
<changefreq>fréquence de mise à jour</changefreq>
<priority>priorité</priority>
</url>
</urlset>

Ce fichier contiendra les indications suivantes :

  • La balise <urlset> contient le fichier en question
  • La balise <url> décrit chaque page et contient les champs suivants :
    • La balise <uloc> représente l’adresse de la page (http://www.votresite.com/page1.html).
    • La balise <lastmod> est la date de dernière modification du fichier.
    • La balise <changefreq> représente la fréquence de mise à jour de la page, à choisir parmi les possibilités suivantes : always, hourly, daily, weekly, monthly, yearly et never.
    • La balise <priority> indique l’importance que vous donnez à la page à l’intérieur de votre site. Sa valeur va de 0 à 1 et peut être, bien entendu, décimale (0.5, 0.7, etc.).

La présence d’un sitemap est-elle obligatoire ?

Au même titre que la présence d’un robots.txt, d’un balisage Hn sensé ou encore de l’unicité des balises Title, la présence d’un sitemap est juste « recommandée ». On pourrait partir du principe que rien n’est obligatoire en matière de SEO et que, quitte à prioriser les tâches SEO, il vaut mieux travailler le contenu de vos pages plutôt que le sitemap…

La présence d’un sitemap est donc « utile » mais loin d’être obligatoire, surtout si vous possédez un site internet techniquement « simple », sur lequel vous publiez très peu de contenu.

Le travail que vous allez accomplir sur votre sitemap va donc dépendre de vos ressources techniques, du nombre de pages présentes sur votre site, de la fréquence de mise à jour de ce dernier et surtout, des technologies utilisées sur votre site (Js, Flash et compagnie). Si a minima votre site contient beaucoup de pages et est mis à jour régulièrement, je vous recommande fortement de créer un sitemap.

Quelle est l’utilité de proposer un sitemap aux robots ?

Si les crawlers sont favorables au protocole Sitemaps, c’est qu’ils sont susceptibles de s’en servir à un moment donné.
Ce fichier XML très utile pour plusieurs raisons :

  • Selon une ancienne étude commentée par le célèbre SEOMoz, soumettre un sitemap aux moteurs de recherche augmenterait la vitesse d’indexation de vos pages
  • Ça ne coûte rien de créer un sitemap, même si ce dernier est mal conçu ou pas du tout interprété par les crawlers. Dans tous les cas de figure, votre référencement ne sera pas pénalisé
  • On parle toujours de Google et oublions très souvent les autres moteurs de recherche. Si Google n’a pas obligatoirement besoin de votre sitemap XML pour détecter la présence de nouvelles URL, d’autres moteurs beaucoup moins puissants techniquement pourraient s’en servir. Je pense en particulier à Bing
  • Les relations entre votre sitemap et la Google Search Console vous permettent de suivre l’état d’indexation de votre sitemap. En plus du monitoring, la console de Google vous permet de repérer facilement les erreurs liées à votre sitemap (erreurs que vous n’aurez pas forcément repéré du premier coup sur votre site !)
  • Si votre site ne possède que de l’actualité (et une ou deux pages statiques), il est possible de demander à Google d’indexer uniquement le sitemap news. Cela permet à Googlebot de se concentrer majoritairement sur le contenu faisant référence à l’actualité.

Comment créer et soumettre un sitemap ?

La réponse va en partie dépendre de la manière dont a été conçu votre site internet. Si vous passez par un CMS type WordPress ou Prestashop, vous pouvez télécharger une extension qui générera pour vous, le fameux fichier sitemap en XML (plug-in Yoast pour WordPress). Si vous travaillez sur un site conçu sur-mesure ou bien passez par un CMS ne proposant pas de plug-in dédié à la génération de sitemap, vous devrez créer ce qu’on appelle un script. Dans tous les cas, l’objectif reste le même : faire en sorte que le sitemap se mette à jour automatiquement pour que vous n’ayez pas à le soumettre manuellement dans votre back-office…

Une autre solution existe mais autant vous dire que je ne l’apprécie guère : le générateur de sitemap. Vous n’aurez pas de mal à en trouver un peu partout sur la toile, le plus connu étant : XML Sitemap Generator. Le problème de ces générateurs, c’est qu’ils se contentent de produire un sitemap standard, type et pas forcément propre à votre activité. Certes, le process est simple et ne vous demande aucune connaissance technique mais encore faut-il faire en sorte que son contenu corresponde à votre site (fréquence des publications, type de support…). Attention également aux générateurs de type « crawlers » car certains d’entre eux ont tendance à venir surcharger les serveurs du site…

Comment soumettre un sitemap ?

Une fois que votre sitemap est prêt à l’emploi, vous devez indiquer à Google à quel endroit il peut venir le récupérer. Pour cela, rendez-vous dans votre compte Google Search Console. Dans le menu « Exploration », allez dans la rubrique « Sitemaps » et cliquez sur le bouton « Ajouter/Tester un sitemap ». joutez le nom de votre sitemap à la suite de votre nom de domaine, cliquez d’abord sur le bouton « Test » pour tester votre sitemap avant de l’envoyer. Une fois le test terminé par Google (cela peut lui prendre quelques minutes), prenez note de l’éventuelle présence d’erreur. Corrigez l’erreur s’il le faut, refaite un test pour voir si l’erreur persiste et envoyez votre sitemap.