T
tracid
Gamma
¡Usuario con pocos negocios! ¡Utiliza siempre saldo de Forobeta!
eliminalas desde google webmaster. pr ahi ya las habia indexado antes y todavia no las saco
El robots.txt NO EVITA QUE LAS PAGINAS SEAN INDEXADAS
Pero si están bloqueadas deberían no aparecer en google no? Porque el resto que me bloquea el robots no salen :S
No lo se, depende como tengas tu sitio. Tal ves algun plugin te funcione..Entonces como hago para que no se indexen esas páginas? Quitando lo de compartir que es de donde deben salir esos enlaces? No hay manera de no indexar esas urls?
Claro pero dices "puede" pero por ejemplo las categorías no las tengo indexadas y hay enlaces de ellas por el blog, no entiendo porque unas sí y otras no.
Disallow: /*/feed/
Disallow: /feed/
Disallow: /*/?share=twitter
Disallow: /?share=twitter
- - - Actualizado - - -
No es instantaneo, le toma tiempo a Google eliminar las URL's.
Creo que dijo que ya estan bloqueadas por el robots.txt
Entonces no hay mas que hacer, como dije: Solo es cuestion de esperar a que Google aga su trabajo.
No.
Cuando pones "Disallow" evitas que las arañas de los buscadores "lean" esa pagina, pero si existen enlaces a la misma puede ser indexada.
En cambio, teniendo la meta etiqueta robots con el valor "noindex" le estas diciendo al buscador que "lea" esa pagina, pero que no la indexe.
Ahora que si usas "noindex,nofollow" ni la "lee" ni la indexa
Fuente: Cómo bloquear o eliminar páginas con un archivo robots.txt - Ayuda de Herramientas para webmasters de GoogleSi bien Google no rastreará ni indexará el contenido de las páginas bloqueadas por robots.txt, sí que indexará las URL que encuentre en otras páginas de la Web. Como consecuencia, la URL de la página y otros datos disponibles públicamente, como el texto de anclaje en enlaces que dirigen al sitio o el título de Open Directory Project (Enlace eliminado), podrían aparecer en los resultados de búsqueda de Google.
Re afirmo:
Fuente: Cómo bloquear o eliminar páginas con un archivo robots.txt - Ayuda de Herramientas para webmasters de Google
- - - Actualizado - - -
No es necesario usar meta robots...... Yo no los uso, y solo mis posts y categorias son indexadas.
Hola, en un blog que tengo google me indexa páginas del tipo ......./feed/ o ...../?share=twitter, /?share=google-plus-1. Estas páginas aparecen al usar el comando site:misitio en google, en la descripción dice que han sido bloqueadas por el robots.txt. Pues bien si voy a WMT y meto cualquier url de esas para ver donde las bloquea el robots, me dice que están bloqueadas, pero cada vez que añado una entrada al blog, se me crean 4,5, o las que sean de esas entradas, a alguien más le ha pasado esto?
Si existieran casos serian porque el usuario a agregado esos valores despues de ser inexadas las paginas al robots.txt, o porque no esta bien creado el archivo robots.txt, primero hay que descartar estas opciones para despues culpar a Google de no seguir al robots.txt. Satanarchist tracid
Si bien Google no rastreará ni indexará el contenido de las páginas bloqueadas por robots.txt, sí que indexará las URL que encuentre en otras páginas de la Web. Como consecuencia, la URL de la página y otros datos disponibles públicamente, como el texto de anclaje en enlaces que dirigen al sitio o el título de Open Directory Project (Enlace eliminado), podrían aparecer en los resultados de búsqueda de Google..
Para impedir que aparezca cualquier contenido de una página en el índice de páginas web de Google, incluso si está vinculado a otros sitios, se puede utilizar una metaetiqueta "noindex" o una etiqueta x-robots-tag. Siempre que Googlebot rastree la página, verá la metaetiqueta "noindex" y no incluirá esa página en el índice de páginas web.
Para aclarar este asunto, cito el mismo documento que tu:
Se refiere a que SI INDEXARA las URLs que ENCUENTRE EN OTRAS PAGINAS DE LA WEB. Osease, que tengan enlaces desde otros sitios.
Mas abajo en el mismo documento dice:
La clave es donde dice "incluso si esta vinculado a otros sitios". Osease, incluso si esta referenciado (enlazado) por otros sitios, al usar la metaetiqueta noindex no sera INDEXADO, a diferencia de usar solamente el robots.txt
Tenga en cuenta que debido a que tenemos que rastrear la página para ver la etiqueta "noindex", existe una pequeña posibilidad de que Googlebot no vea y respete la metaetiqueta. Si su página sigue apareciendo en los resultados, probablemente se debe a que no hemos rastreado su sitio desde que añadió la etiqueta. (Igualmente, si ha utilizado el archivo robots.txt para bloquear la página, tampoco podremos ver la etiqueta).
En la fuente que cite, queda a discucion porque es un poco confusa la informacion que tiene. En ningun lugar he leido directamente que Teniendo el robots.txt bloqueado a todo un sitio y si un enlace entrante tiene, entonces Google lo indexara?
PUEDE indexar la pagina a donde el enlace apunta
Entonces seria inutil el robots.txt. Generalmente un mismo sitio incluye enlaces a si mismo y muchas veces es tedioso colocar noindex en los enlaces y/o meta robots que pueden ser ingnorados, en cambio en ningun lugar menciona que el robots.txt sea ignorado, a no ser que sea un robot malicioso.
Utilizamos cookies y tecnologías similares para los siguientes fines:
¿Aceptas las cookies y estas tecnologías?
Utilizamos cookies y tecnologías similares para los siguientes fines:
¿Aceptas las cookies y estas tecnologías?