¿Cómo eliminar completamente una web de Google y evitar contenido duplicado?

  • Autor Autor puraco
  • Fecha de inicio Fecha de inicio
puraco

puraco

Ni
Verificado por Whatsapp
Hola:

Necesito eliminar completamente una web de Google y que desindexe todas las url´s del buscador pues quiero montar el mismo contenido en otro dominio pues el primero fue penalizado por enlaces artificiales y no hay manera de salir de la penalización por más que he hecho, así que quiero hacer unas pruebas, pero primero necesito que sea todo desindexado para que luego no me penalice el segundo dominio por contenido duplicado.

Así que lo que he hecho ha sido por supuesto eliminar la web del servidor, ya si entras no existe, y he puesto en la raíz un archivo robots.txt con este código:

User-Agent: *
Disallow: /

¿Está bien este robots?

Pero según veo leyendo lo que pide google para eliminar todo permanentemente es que cuando alguien entre a la web en cualquiera de sus url´s todavía indexadas les muestre un error 404 o 410, aunque según veo el mejor es el 410 pues hace que desindexe más rápido, pero aquí es donde me atasco.

¿Cómo hago esta página 410, como logro que cuando alguien entre muestre este 410?, es que no tengo ni idea y por más que leo y pruebo no hay forma, solo me sale esto cuando entro a la web:

Forbidden

You don't have permission to access / on this server.
Additionally, a 403 Forbidden error was encountered while trying to use an ErrorDocument to handle the request.

Y se supone que lo que tiene que salir es ese 410 lo que indica que la web ha sido eliminada permanentemente.

¿Alguien puede ayudarme con esto?

Saludos y muchas gracias

- - - Actualizado - - -

¿Nadie sabe como hacerlo?
 
Hola:

Necesito eliminar completamente una web de Google y que desindexe todas las url´s del buscador pues quiero montar el mismo contenido en otro dominio pues el primero fue penalizado por enlaces artificiales y no hay manera de salir de la penalización por más que he hecho, así que quiero hacer unas pruebas, pero primero necesito que sea todo desindexado para que luego no me penalice el segundo dominio por contenido duplicado.

Así que lo que he hecho ha sido por supuesto eliminar la web del servidor, ya si entras no existe, y he puesto en la raíz un archivo robots.txt con este código:

User-Agent: *
Disallow: /

¿Está bien este robots?

Pero según veo leyendo lo que pide google para eliminar todo permanentemente es que cuando alguien entre a la web en cualquiera de sus url´s todavía indexadas les muestre un error 404 o 410, aunque según veo el mejor es el 410 pues hace que desindexe más rápido, pero aquí es donde me atasco.

¿Cómo hago esta página 410, como logro que cuando alguien entre muestre este 410?, es que no tengo ni idea y por más que leo y pruebo no hay forma, solo me sale esto cuando entro a la web:

Forbidden

You don't have permission to access / on this server.
Additionally, a 403 Forbidden error was encountered while trying to use an ErrorDocument to handle the request.

Y se supone que lo que tiene que salir es ese 410 lo que indica que la web ha sido eliminada permanentemente.

¿Alguien puede ayudarme con esto?

Saludos y muchas gracias

- - - Actualizado - - -

¿Nadie sabe como hacerlo?
Hola puraco:

Entiendo tu situación y el deseo de eliminar completamente tu web de Google para evitar problemas de contenido duplicado. A continuación, te doy algunos pasos y recomendaciones que podrían ayudarte:

1. Archivo robots.txt: Lo que has hecho con el archivo robots.txt es correcto para evitar que los motores de búsqueda indexen tu sitio en el futuro, pero esto no elimina ya las URLs que están indexadas.

2. Errores 404 y 410: Como bien mencionas, el código 410 (Gone) es más explícito que el 404 (Not Found) y le indica a Google que el contenido ha sido eliminado permanentemente. Para configurarlo, necesitas asegurarte de que tu servidor responda correctamente con el código 410 para las URLs que deseas desindexar.

3. Configuración del servidor: Dependiendo del servidor que estés utilizando (Apache, Nginx, etc.), la forma de implementar un error 410 puede variar.

- Apache: Si estás usando un servidor Apache, puedes crear o modificar el archivo .htaccess en la raíz de tu dominio. Añade lo siguiente:

Insertar CODE, HTML o PHP:
apache
     RewriteEngine On
     RewriteRule ^ - [G]

Esto forzará que cualquier solicitud sea respondida con un código 410. Sin embargo, si solo deseas que algunas URLs específicas devuelvan un 410, puedes especificarlas individualmente.

- Nginx: Si usas Nginx, puedes añadir lo siguiente en tu archivo de configuración:

Insertar CODE, HTML o PHP:
nginx
     location / {
         return 410;
     }

Esto también devolverá el 410 para todas las solicitudes. De nuevo, puedes ajustar las ubicaciones según necesites.

4. Redirigir a la nueva web: Si ya tienes el nuevo dominio preparado, considera también si deseas redirigir a los usuarios a este nuevo sitio (aunque eso puede ser arriesgado si el nuevo contenido es similar al anterior).

5. Utilizar la Consola de Búsqueda de Google: Además de los cambios en el servidor, puedes utilizar la herramienta de eliminación de la Consola de Búsqueda de Google para solicitar que Google elimine las URLs indexadas. Esto puede ayudar a acelerar el proceso.

6. Esperar la Re-indexación: Ten en cuenta que puede tardar algún tiempo en que Google re-crawlee tu sitio y actualice los resultados en sus búsquedas.

Espero que estas indicaciones te sean útiles. Si continúas teniendo problemas, revisa que la configuración de tu servidor esté correctamente aplicada y que no haya conflictos con otros archivos de configuración. ¡Buena suerte!

Saludos.
 
Atrás
Arriba