que es robots.txt

¿Qué es robots.txt?

¿Qué es el archivo robots.txt?

La clasificación de los sitios en los resultados del motor de búsqueda se basa en la indexación del contenido por parte de los robots de búsqueda. El resultado de la indexación son listas de URL que se verifican periódicamente para determinar la relevancia y la calidad del contenido. Cuando se encuentra un nuevo enlace, el robot lo agrega a la lista y la página pasa a estar disponible en los resultados de búsqueda.

¿Para qué sirven los robots.txt?

Los robots.txt son una serie de instrucciones, configuradas bien por los desarrolladores web o por los especialistas SEO, para los robots de los diferentes motores de búsqueda. A la hora de indexar una URL, tienen en cuenta el contenido del robots.txt para determinar que hacer con ese contenido.

¿Qué permite el documento robots.txt?

A través del contenido de los robots.txt se pueden realizar las siguientes acciones:

  • Permitir o prohibir la indexación de diferentes elementos.
  • Indicar que página es la canónica.
  • Establecer el intervalo de tiempo para descargar el contenido.

¿Es obligatorio tener robots.txt?

Cuándo no existe un archivo robots.txt en el sitio web no hay normas sobre la publicación de los diferentes contenidos en los buscadores como Google, Bing, Yahoo!…¿Qué quiere decir esto? Significa que todo aquel contenido dispuesto en el sitio web puede ser indexado y comenzar a aparecer como un resultado de búsqueda. Por ello es muy importante tener un documento robots.txt bien organizado y revisarlo con detalle para evitar futuros problemas de indexación y de crawleo.

¿Cómo crear un archivo robots.txt?

Aunque pueda sonar complicado, crear un documento robots.txt es muy sencillo. Solamente necesitaremos abrir un documento en blanco. Puede ser el bloc de notas, word o con el que te sientas más con mayor comodidad. El requisito principal es que se encuentre en formato .txt. Dentro de este documento será donde pongamos las instrucciones que los robots de los motores de búsqueda deben leer.

En Denocheydia trabajamos a diario con robots.txt ya sea para realizar cambios en ellos o simplemente revisando que estén correctamente configurados. En más ocasiones de las que podrías imaginar nos encontramos sitios web dónde el archivo robots.txt bloquea la indexación o el rastreo de páginas importantes para la web. Este es uno de los problemas que más puede afectar al crecimiento de un sitio web aunque su solución es sencilla.

Tags: No tags

Add a Comment

Your email address will not be published. Required fields are marked *