Revisión robots.txt en Google para evitar indexación incorrecta

  • Autor Autor Miguelonx
  • Fecha de inicio Fecha de inicio
Miguelonx

Miguelonx

Gamma
Verificado por Whatsapp
¡Usuario con pocos negocios! ¡Utiliza siempre saldo de Forobeta!
Hola,
Quería preguntaros como puedo darle la orden al buscador de Google para que no me indexe o que no me muestre las pagina web que tengo con miweb.com/product-tag/
En el archivo robots.txt le he dado la orden (hace 6h) para que no me la busque con:
Disallow: /product-tag/
Pero Google continua mostrándomela.
Sabéis si tengo que esperar mas tiempo para que me lo corrija o es que tengo que hacerlo de otra forma.
Este es mi robots.txt por si hubiera algo mal:

User-agent: *
Disallow: /cgi-bin
Disallow: /wp-admin/
Disallow: /wp-content/
Disallow: /wp-includes/
Disallow: /wp-login.php
Disallow: /*/feed/
Disallow: /*/trackback/
Disallow: /*/attachment/
Disallow: /author/
Disallow: /comments/
Disallow: /xmlrpc.php
Disallow: /*?s=
Disallow: /product-tag/

User-agent: Googlebot-Image
Allow: /
 
Google es como un niño consentido, espera un día y nos cuentas :encouragement:
 
Gracias RedxLus por tu respuesta.
 
Si, esta modifica... acabo de revisarlo de nuevo y aparece se Search Console tal cual lo he posteado arriba.

- - - Actualizado - - -

Ha pasado ya un día y Google todavía sigue dándome los resultados de las pagina miweb.com/product-tag/
Solamente son dos resultados que quiero eliminar, que son:
miweb.com/product-tag/mtb/
miweb.com/product-tag/comida/
¿Me aconsejáis alguna otra forma de eliminarlo?
 
Para que lo desindexe puede tardar semanas, no es tan rápido como quisieras. 😕
 
Gracias PRO por tu respuesta.
Pues vaya gracias que me esta haciendo Google :s
Bueno, no nos queda otra que esperar.

- - - Actualizado - - -

Hola,

A ver si me podéis ayudar...
Search Console me esta advirtiendo en el apartado sitemaps que el archivo robots.txt me esta bloqueando las siguientes URLs:

bloqueo.webp
urls.webp
urls2.webp

El sitemaps lo tengo configura de la siguiente manera:

sitemap.webp

Mi configuración de robots.txt:

User-agent: *
Disallow: /cgi-bin
Disallow: /wp-admin/
Disallow: /wp-content/
Disallow: /wp-includes/
Disallow: /wp-login.php
Disallow: /*/feed/
Disallow: /*/trackback/
Disallow: /*/attachment/
Disallow: /author/
Disallow: /comments/
Disallow: /xmlrpc.php
Disallow: /*?s=
Disallow: /product-tag/

User-agent: Googlebot-Image
Allow: /


¿Podéis ayudarme a modificar estas advertencias?

Gracias,
 
Última edición:
Lo que pasa es que tu sitemap tiene enlaces a páginas dentro de tu carpeta /wp-content/ pero en tu robots.txt estás bloqueando esa carpeta.
Si no quieres indexar las páginas dentro de esa carpeta, quítala de tu sitemap, o si quieres mostrar esa carpeta, desbloquéala de tu robots.txt, pero no tengas las dos cosas que se contradicen. :witless:
 
Hola Pro!

Exacto, ayer me di cuenta de ello y lo corregí en mi robots.txt.

Gracias por tu respuesta.
 
Puedes enviar la petición de desindexado desde Google Webmaster Tools :encouragement:
 
Hola Eduardo,
Como puedo realizar lo que me comentas?
Gracias por tu respuesta.

- - - Actualizado - - -

Desde ayer que Search Console me esta avisando del bloqueo que estoy teniendo en /page-sitemap.xml el cual no de donde viene este problema. Estado revisando el plugin Yoast en la configuración de Sitemaps XML y no veo nada raro:

page-sitemaps.webp

taxonomi.webp

Error

sitemaps.webp

xml sitemap.webp

La configuración de mi archivo robots.txt es:

User-agent: *
Disallow: /cgi-bin
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-login.php
Disallow: /*/feed/
Disallow: /*/trackback/
Disallow: /*/attachment/
Disallow: /author/
Disallow: /comments/
Disallow: /xmlrpc.php
Disallow: /*?s=
Disallow: /product-tag/
Disallow: /product/
Disallow: /mdtf-results-page/
Disallow: /my-account/
Disallow: /como-funciona/
Disallow: /user/
Disallow: /login/
Disallow: /register/
Disallow: /members/
Disallow: /logout/
Disallow: /account/
Disallow: /password-reset/
Disallow: /formulario-de-contacto/
Disallow: /politica-de-privacidad/
Disallow: /sobre-nosotros/
Disallow: /que-es-una-cookie/
Disallow: /politica-de-cookies/

User-agent: Googlebot-Image
Allow: /

Sitemap: Enlace eliminado


Gracias por vuestra ayuda.
 

Adjuntos

  • sitemap.webp
    sitemap.webp
    26,3 KB · Visitas: 23
Última edición:
Hola,

Alguien de vosotros puede ayudarme.

Gracias,
 
Es el mismo error, en tu robots.txt tienes bloqueadas las carpetas /account/, /como-funciona/ , /formulario-de-contacto/ y a la vez las estás poniendo en tu sitemap.
No es tan complicado, si pones algún directorio/página en tu sitemap, entonces no lo pongas en tu robots.txt y viceversa.
 
Pufff vaya duplicación de información que estoy haciendo con los dos archivos.
Gracias por despejarme las dudas PRO.
 
Atrás
Arriba