No creo que sean ni rusos ni chinos sospecho que es un venezolano porque lo descubri en facebook publicando su mierdaweb con perfil fake y en su perfil pone que es de trujillo solo una persona que conozca a venezuela pone esa dirección.Hola no es algo que puedas frenar son muchos los rusos, chinos y mas que se la pasan en eso, en su momento me funciono https://help.directadmin.com/item.php?id=33 para evitar hotlink de imágenes y otros archivos asi evitar que se coman tu ancho de banda, si es Apache tu servidor te servira
Puedes bloquear httrack y otros copiadores, pero fijate si te esta copiando en tiempo real de ser asi lo esta haciendo con un metodo curl y podrias desindexarlo de google en tal caso, ademas puedes reportar a google por suplantacion: https://safebrowsing.google.com/safebrowsing/report_general/No creo que sean ni rusos ni chinos sospecho que es un venezolano porque lo descubri en facebook publicando su mierdaweb con perfil fake y en su perfil pone que es de trujillo solo una persona que conozca a venezuela pone esa dirección.
Ni los rusus ni chinos comparten en grupos de facebook y menos latinos!
no lo tiene en tiempo real lo tiene para cada ciertas horas haga el scrapping y publiquePuedes bloquear httrack y otros copiadores, pero fijate si te esta copiando en tiempo real de ser asi lo esta haciendo con un metodo curl y podrias desindexarlo de google en tal caso, ademas puedes reportar a google por suplantacion: https://safebrowsing.google.com/safebrowsing/report_general/
Los que lo hacen suelen usar proxys, asi que puede bloquear las ip que quiera igual no solucionara. Que formas ademas de la ip conoces? porque yo tengo a unos fastidiandome y no vi mas que hacer protección global en htaccesHay muchas formas de frenarlo, si puedes obtener la ip y bloquearla desde tu cpanel o de tu web con algún plugin
Pues es que tiene un bot automático que saca el contenido de tu sitio puede fácilmente usar curl con php, o con python u otro lenguaje de programación....No creo que sean ni rusos ni chinos sospecho que es un venezolano porque lo descubri en facebook publicando su mierdaweb con perfil fake y en su perfil pone que es de trujillo solo una persona que conozca a venezuela pone esa dirección.
Ni los rusus ni chinos comparten en grupos de facebook y menos latinos!
Son muy buenos los datos que das, me servirán.Pues es que tiene un bot automático que saca el contenido de tu sitio puede fácilmente usar curl con php, o con python u otro lenguaje de programación....
Lo más importante es obtener la IP desde donde lo hacen para poder bloquearla aun así con un proxy puede saltar esta limitación... Yo tengo experiencia con el scraping y te puedo decir que es imposible detener el sraping pero si se puede limitar y hacerlo más difícil para el que roba el contenido.
Se pueden hacer varias cosas para obtener la IP.
(1). Hacer un log no se si tengas wordpress puedes buscar un plugin.
+++ Lo importante es que se almacene la IP de todos los usuarios que ingresan al sitio, con sus respectivas cabeceras de petición.
Proceder analizar estos datos:
+++ Ejemplo de que país es la IP, si tu sitio es en español y están ingresando desde una IP extranjera como estados unidos prender las alarmas.
+++ Revisar las cabeceras muchos de los que hacen estos bots olvidan colocar unas cabeceras comunes (Request Headers) en sus peticiones, cosa que nunca lo hace un navegador web de un usuario real, tales como accept, accept-language, el user agent que sea de un navegador conocido.
(2). Sistema limitado por IP con tiempo.
(3). Hacerle cambios al HTML del contenido constantemente pues el robot lo tienen configurado por ejemplo para sacar el contenido de este div: <div id="mi-contenido">CONTENIDO</div> entonces cambio el id por <div id="otroo">CONTENIDO</div> entonces el que roba tendrá que actualizar el bot, bueno todo depende del sitio web y del bot que saque el contenido.
(4). Proteger lo importante que es los enlaces con captcha como dice el usuario de arriba.
(5). O joder su trafico mandarlo a xvideos o a otro sitio de adultos a sus usuarios con un javascript: Coloca esto en tus entradas.
<script type="text/javascript">if(location.href.indexOf("nombredemiweb")<=0){ document.location="http://www.nombredemiweb.com/"; }</script>
Como evitar ser clonado con espejo ? cloudflare ? otra opcion ?
Hola el año pasado me clonaron espejo y me destruyeron mi sitio de 5000 dolares por mes, tengo ahora cloudflare en Minimum TLS Version 1.2 pero veo que con un soft de clonacion puedo clonarme, por lo tanto no estaria rebotando todo, alguno sabe de otra opcion ? es en WPforobeta.com
Aquí hay más trucos para contrarrestar un poco al copiador:
How do I prevent site scraping?
I have a fairly large music website with a large artist database. I've been noticing other music sites scraping our site's data (I enter dummy Artist names here and there and then do google search...stackoverflow.com
Este tema de aqui https://forobeta.com/temas/te-han-clonado-la-web-webs-espejo-y-solucion-bastante-simple.554282/ y si sigue funcionando lo realice como por enero de este añoQuieres que dejen de copiarte I que deje de aparecer en Google dicha página, si quieres lo segundo, agrega el dominio de esa página a tu search console y luego subes el archivo a tu web, cómo esa copia todo de tu web también va copiar el archivo una vez hecho y la tengas agregada le das en eliminar de Google .
Hace mucho lo hice y me funcionó, actualmente no sé si aún se puede.
activa la opcionSon muy buenos los datos que das, me servirán.
En el caso del html si es web espejo todo lo que cambie cambiara la persona en el que roba el contenido apareceria al instante sin cambiar nada en el bot.
Cloudflare no lo soluciona lamentablemente.
lo pasara igual, así como los waf, son persistentes, en el caso del usuario creador del tema quiza lo pueda solucionar viendo que no es totalmente automático como el comenta y se cansa el que copia, pero en muchos otros casos lo hacen tan en gran escala con millones de webs que es casi imposible frenarlos.Puedes usar cloudflare activa la. Opción bajo ataque, esta forma seria la definitiva, otra opción que se me
activa la opcion
Under Attack Mode
no es espejo bro es scrapping las web espejos son automatica en lo que publiques algo automaticamente se publica es la webespejoEste tema de aqui https://forobeta.com/temas/te-han-clonado-la-web-webs-espejo-y-solucion-bastante-simple.554282/ y si sigue funcionando lo realice como por enero de este año
ya intente eso no sube los archivos puse cualquie file ejemplo file.html y no abre desde esa webQuieres que dejen de copiarte I que deje de aparecer en Google dicha página, si quieres lo segundo, agrega el dominio de esa página a tu search console y luego subes el archivo a tu web, cómo esa copia todo de tu web también va copiar el archivo una vez hecho y la tengas agregada le das en eliminar de Google .
Hace mucho lo hice y me funcionó, actualmente no sé si aún se puede.
Los sitios espejos son los que cargan tu sitio tal cual ya que pareciera que te están cargando la web desde un proxy.ya intente eso no sube los archivos puse cualquie file ejemplo file.html y no abre desde esa web