El crawler de Google me satura el servidor, Cloudflare devuelve error 502 y Google pasa de crawlear más

  • Autor Autor Dinero Infinito
  • Fecha de inicio Fecha de inicio
Dinero Infinito

Dinero Infinito

Gamma
Verificado por Whatsapp
¡Usuario con pocos negocios! ¡Utiliza siempre saldo de Forobeta!
Tengo un proyecto web con cientos de miles de páginas. Tengo también Cloudflare entre medias para evitar bots de mierda y ataques.
La cosa es que ahora google ya no deja modificar la velocidad del crawler y te comes con patatas la que a él le salga de los huevos. En su documentación dice que si detecta error 500, 503 o 429 durante el crawleo lo toma como un indicador de que debe reducir la frecuencia de rastreo.

El problema: que con Cloudflare, cuando el origin host está saturado y no responde, Cloudflare tira error 502. Por lo que no satisface los requisitos de Google, que son error 500, 503 o 429. Tampoco puedo cambiar el código de respuesta. Esto hace que cada vez que google me rastrea las páginas enseguida me satura el servidor, lee error 502 y pasa de volver a intentar crawlear las restantes. Se me van acumulando

Captura de pantalla 2024-09-19 a las 11.05.41.webp


Se os ocurre alguna solución?

image1.bhOtPL9__14jsoa.webp


Captura de pantalla 2024-09-19 a las 10.54.31.png


 
y que te dice tu flamante hosting?
ya que el tema va por ahi... el origin.
 
Atrás
Arriba