Que faire quand votre site Web est indisponible ?
La disponibilité d’un site Web doit être proche de 100 % pour les Internautes. Mais que faire lorsqu’il devient momentanément indisponible ?
Si cela vous arrive, chaque minute qui passe, vous perdez de l’argent. D’autant plus qu’il va falloir éviter la désindexation des pages de votre site Web par Google ou les autres moteurs de recherche, car les conséquences pourraient être très graves pour votre entreprise. Et trouver des solutions rapides.
Trois choses relativement faciles à faire pour éviter la catastrophe sont à mettre en œuvre dans les plus brefs délais, et une chose est à savoir :
- Utilisez un fichier .htaccess pour renvoyer un code HTTP 503.
- Optimisez le fichier robots.txt.
- Anticipez les conséquences de l’indisponibilité.
- Que faire si vos pages Web sont indisponibles trop longtemps ?
Dans cet article, je vais détailler la manière de mettre en œuvre les trois points listés ci-dessus, et vous donner un bonus au cas où l’indisponibilité du serveur durerait trop longtemps.
Utilisez un fichier .htaccess pour renvoyer un code HTTP 503.
Renvoyez un header HTTP 503 Service Unavailable (service indisponible) pour les pages Web momentanément inaccessibles afin de l’indiquer à vos visiteurs et aux moteurs de recherche. Pour cela, faites pointer toutes les URL inaccessibles vers la page de maintenance grâce au fichier .htaccess.
Vérifiez dans Chrome que c’est bien le cas en faisant un clic droit : Inspecter, sélectionnez « Réseau » en haut, puis actualisez la page. Enfin, vérifiez l'entrée du haut : elle devrait être rouge et afficher le statut 503.
Optimisez le fichier robots.txt.
Assurez-vous que votre fichier robots.txt renvoie soit un code HTTP 200 avec un fichier robots.txt à jour, soit un code HTTP 404. Il ne doit pas renvoyer le code HTTP 503. Ne vous fiez pas à l’affichage code HTTP 404 de votre page dans votre navigateur, vérifiez-le avec Chrome Dev Tools.
Le fichier robots.txt doit renvoyer un code HTTP 404 ou HTTP 200 parce que s'il renvoie un code HTTP 503, les robots supposeront que le site est entièrement bloqué pendant un certain temps et c'est une mauvaise idée.
Anticipez les conséquences de l’indisponibilité.
Si vous êtes propriétaire d’un site Web qui affiche « indisponible » lorsque l’on cherche à l’atteindre, alors il est très probable que vous ayez un problème avec votre serveur. Il est aussi possible que vous souhaitiez volontairement le rendre indisponible pour quelques heures.
Dans tous les cas, limitez si possible la durée du code HTTP 503 à 24 heures maximum, car au-delà, vous prenez le risque de voir vos pages être désindexées des résultats de recherche.
Veuillez noter que le blocage d’un site Web, même pour moins de 24 heures, aura des effets secondaires : Googlebot ralentira l’exploration du site Web.
S’il ne contient que quelques pages, ce sera sans conséquence, mais s’il contient plusieurs milliers de pages, votre budget de crawl va diminuer, ce qui posera des problèmes pour se positionner dans les résultats de recherche.
Si un site Web veut rester fermé plus de 24 heures, il y aura nécessairement des effets négatifs en matière de résultats de recherche, quelle que soit l'option choisie (503, blocked, noindex, 404, 403).
Que faire si vos pages Web sont indisponibles trop longtemps ?
Vérifiez si les pages critiques sont toujours indexées et, si ce n'est pas le cas, soumettez-les de nouveau à l'indexation grâce à Google Search Console si elles sont peu nombreuses ou grâce à un fichier sitemap si vous en avez beaucoup. Concentrez-vous sur les dix ou vingt premières pages car elles sont généralement indexées par Google.
John Mu précise que Google n'indexe pratiquement jamais toutes les pages d'un site Web. Il est donc normal qu’une certaine quantité de pages ne le soient pas.
Sources
- Google Search Central - Temporarily pause or disable a website (en anglais)