Cómo evitar que Google indexe el archivo sitemap.xml de su sitio

¿Alguna vez ha buscado su propio sitio web en Google y ha notado que el archivo sitemap.xml aparece en los resultados de búsqueda? Si no lo ha hecho, probablemente no sea algo que valga la pena preocuparse, sin embargo, si como yo lo ha hecho, entonces puede ser algo que valga la pena cambiar.

El “problema”:

Todo sitio debería tener un mapa del sitio (principalmente para informar a los motores de búsqueda sobre las páginas de su sitio que de otra manera no podrían descubrir), sin embargo, hasta donde puedo decir, no hay ninguna razón por la que el mapa del sitio en sí debería aparecer en las SERP – ya que el mapa del sitio.xml no es una página que cualquiera que visite su sitio normalmente entenderá, y mucho menos querrá visitar.

Esto es lo que vi hace unas semanas después de buscar “WinningWP” en Google:

…difícilmente ideal, ya que este espacio podría (y probablemente debería) ser mejor aprovechado por una página más útil y atractiva.

¿Y qué hacer al respecto? Bueno, no se puede hacer nada y esperar que Google se dé cuenta eventualmente de que su sitio tiene páginas más dignas de ser mostradas, o como parece no haber una razón decente para que Google (y otros motores de búsqueda) muestren esta página en las SERP, se podría ir informando a Google, etc., que preferiría que no se mostrara añadiendo un valor de metaetiqueta de noindex de los robots a la página para solicitar que los robots automatizados de Internet eviten indexarla en el futuro.

Leer
Cómo saber si un sitio web usa WordPress

El “arreglo”:

Hay varias formas de añadir el valor de la metaetiqueta de los robots noindex a su mapa de sitio xml, sin embargo, dado que nuestro mapa de sitio se genera automáticamente (hacemos que Google XML Sitemaps genere el nuestro) y no hay una forma obvia de añadir el valor noindex a los mapas de sitio generados directamente, tendremos que añadirlo a la página de forma indirecta – añadiendo el siguiente código al archivo .htaccess (más sobre este archivo particularmente útil en una futura publicación):

12345 Juego de cabeza X-Robots-Tag “noindex”

…recordando cambiar “sitemap.xml” por el nombre de su propio sitemap XML.

¿Funcionó?

Una vez que hayas hecho lo anterior, dirígete a URI Valet y escribe la URL completa que lleva a tu mapa de sitio en el campo “URL” y pulsa “enviar”. Si todo ha ido según lo planeado, ahora deberías poder ver “X-Robots-Tag: noindex” en algún lugar de la página.

Agradecimientos: solución original atribuida a JohnMu

¿Qué piensas? ¿Es algo por lo que valga la pena preocuparse?

Deja una respuesta