Mejorando el archivo robots.txt en Webmaster de Blogger

  • Autor Autor leit0s
  • Fecha de inicio Fecha de inicio
leit0s

leit0s

Eta
Verificado
Verificación en dos pasos activada
Verificado por Whatsapp
¡Ha verificado su Paypal!
Hola betas, alguien podría aclararme que significa y si esta bien el contenido del archivo robots.txt que aparece en el panel de herramientas de webmaster de un blogger, lo pregunto porque en la ultima linea hace referencia a un xml que no existe, cual seria el optimo para indexar mejor en google; supongo que las modificaciones se harían en la parte de: configuración/preferencias para motores de búsqueda/Archivo robots.txt personalizado.

Insertar CODE, HTML o PHP:
User-agent: Mediapartners-Google
Disallow: 

User-agent: *
Disallow: /search
Allow: /

Sitemap: http://www.compumatico.com/sitemap.xml
 
el robots sirve para decirle a los buscadores que indexar y que no..

especificamente ese hace mencion que no indexe las busquedas (search) y al final la URL del sitemap

yo añadiria disallow para las paginaciones, categorías y tags
 
Ese robotsestá bien, e sitemap en Blogger se pone así:

Insertar CODE, HTML o PHP:
http://URL-DEL-BLOG.com/feeds/posts/default/
 
La configuración del robot se hace exactamente donde dijiste.
Respecto al contenido de este archivo, vamos parte a parte:

Insertar CODE, HTML o PHP:
User-agent: Mediapartners-Google
Disallow:

Acá estás dándole acceso a todas las páginas de tu blog al robot de Google AdSense y Google AdSense Mobile. Este robot es el encargado de rastrear la página para mostrar la publicidad contextual de AdSense.

Insertar CODE, HTML o PHP:
User-agent: *
Disallow: /search
Allow: /

Acá dices que todos los robots que ingresen al sitio, deben evitar rastrear las páginas que comiencen con tusutio.com/search. Estas páginas en blogger incluyen:

  • Paginaciones.
  • Etiquetas.
  • Búsquedas en el sitio.

En el resto de las páginas del sitio estarás permitiendo a las arañas rastrearlo e indexarlo. Esto sería el home, los artículos, las páginas estáticas y las páginas de archivo del blog. Hasta aquí, es la configuración que blogger trae por defecto.

Insertar CODE, HTML o PHP:
Sitemap: http://www.compumatico.com/sitemap.xml

En esta línea indicas explícitamente cuál es el sitemap de tu sitio. En caso de Blogger puedes ponerlo de dos maneras. La usual es como ya te indicaron anteriormente:

Insertar CODE, HTML o PHP:
http://tusitio.com/feeds/posts/default/

En este caso puedes ademas agregarle algunos atributos JSON para condicionarlo. Este tipo de sitemaps (en realidad RSS) tienen el inconveniente que solo llegarán a un máximo de 500 entradas. A partir de la entrada 501, la entrada 1 dejará de estar en el RSS, y en consecuencia, en tu sitemap. Ten en cuenta que esto NO implica que desaparezca de los buscadores, pero no es lo óptimo.

Insertar CODE, HTML o PHP:
http://tusitio.blogspot.com/sitemap.xml

La otra forma de hacerlo es la que te muestro arriba y es mejor que el RSS, ya que no tiene su limitación. No obstante, tiene como inconveniente que solo puedes acceder al archivo si ingresas via subdominio de blogspot. Si intentas tomar el archivo a través de http://tusitio.com/sitemap.xml, obtienes un error 500. Esto hace que solo sea útil si no cuentas con dominio propio.
Es posible que para este último caso puedas incluir en el robots.txt el sitemap haciendo referencia de esta manera, pero desconozco si el mismo es reconocido y tomado por válido, ya que técnicamente la ubicación no corresponde a tu dominio.
 
Atrás
Arriba