El sitemap incluye URL que el archivo robots.txt ha bloqueado

  • Autor Autor tupacsoul
  • Fecha de inicio Fecha de inicio
T

tupacsoul

Curioso
¡Usuario con pocos negocios! ¡Utiliza siempre saldo de Forobeta!
Buenas.

Llevo todo el día dándome cabezazos contra esto, y la verdad, no tengo ni pajolera idea de cuál puede ser el problema.

Tengo el siguiente robots.txt
HTML:
User-agent: * 
Allow: /
Disallow: /wp-content/plugins/
Sitemap: http://www.gameit.es/sitemap.xml

Pues bien, como podéis ver, no bloquea más que la parte de los plugins de wordpress... sin embargo, Google dice, con Webmasters Tools, que todas las URL incluídas en el sitemaps, están bloqueadas por el robots.txt
El sitemap incluye URL que el archivo robots.txt ha bloqueado.

La cosa es que compruebo el robots.txt desde webmasters tools y me dice que está bien, y meto una a una las url que avisa en el sitemap que no se pueden acceder, y todas dice que está permitido... no entiendo.

¿Puede ser que tarde en actualizar? Y si es así... más de un día?

Gracias!
 
Claro, y para mí, pero por algún motivo, me lo siguen restringiendo en webmasters tools diciendo que el robots.txt lo bloquea... no entiendo por qué.
 
HTML:
User-agent: * 
Disallow: /wp-content/plugins/ 

Sitemap: http://www.gameit.es/sitemap.xml

Coloca este. Según el estándar debes tener una línea de separación entre esas instrucciones, y agregar la línea Allow:/ es inútil pues ese es el comportamiento por default.
 
Ok Brandon, muchas gracias. Lo acabo de volver a enviar según tus instrucciones. Te cuento en unas horas cuando termine de analizar.

- - - Actualizado - - -

Pues tenías razón Brandon. Parece estar ya solucionado.

Mil gracias de nuevo 🙂
 
Perdonar que recupere un post tan antiguo, pero estoy teniendo este mismo problema. He dejado el robots.txt como decís, pero me sigue diciendo que tengo todas las url bloqueadas. ¿Que puede ser?

Tengo el YoastSEO pero lo tengo todo bien configurado y la opción disuadir los motores de búsqueda desactivado. Mes estoy volviendo loco 🙁

- - - Actualizado - - -

HTML:
User-agent: * 
Disallow: /wp-content/plugins/ 

Sitemap: http://www.gameit.es/sitemap.xml

Coloca este. Según el estándar debes tener una línea de separación entre esas instrucciones, y agregar la línea Allow:/ es inútil pues ese es el comportamiento por default.

Me contesto yo mismo, ya está solucionado.
Es tal y como dice Brandon, pero hay que dejarle tiempo a la web a que haga un nuevo rastreo. (Unas cuantas horas o un par de días)
 
Atrás
Arriba