El crawler de Google me satura el servidor, Cloudflare devuelve error 502 y Google pasa de crawlear más

  • Autor Autor Dinero Infinito
  • Fecha de inicio Fecha de inicio

Dinero Infinito

Gamma
Verificado por Whatsapp
¡Usuario con pocos negocios! ¡Utiliza siempre saldo de Forobeta!
Tengo un proyecto web con cientos de miles de páginas. Tengo también Cloudflare entre medias para evitar bots de mierda y ataques.
La cosa es que ahora google ya no deja modificar la velocidad del crawler y te comes con patatas la que a él le salga de los huevos. En su documentación dice que si detecta error 500, 503 o 429 durante el crawleo lo toma como un indicador de que debe reducir la frecuencia de rastreo.

El problema: que con Cloudflare, cuando el origin host está saturado y no responde, Cloudflare tira error 502. Por lo que no satisface los requisitos de Google, que son error 500, 503 o 429. Tampoco puedo cambiar el código de respuesta. Esto hace que cada vez que google me rastrea las páginas enseguida me satura el servidor, lee error 502 y pasa de volver a intentar crawlear las restantes. Se me van acumulando



Se os ocurre alguna solución?





 
y que te dice tu flamante hosting?
ya que el tema va por ahi... el origin.