Mejor forma de crear robot.txt

  • Autor Autor Aguila SEO
  • Fecha de inicio Fecha de inicio
Aguila SEO

Aguila SEO

Lambda
Social Media
Verificado
Verificado por Whatsapp
¡Ha verificado su Paypal!
Hola, jamas utilice el robot.txt pero ahora que estoy empezando con un proyecto serio me gustaría usarlo pero por mas que busco no entiendo muy bien como crearlo

Alguien me puede facilitar una pagina donde lo haga de forma automática o un ejemplo para poder copiarlo, gracias 🙂
 
Yo siempre uso mi robot.txt de la siguiente forma:

User-Agent: *
Allow: /?display=wide
Allow: /wp-content/uploads/
Disallow: /wp-content/plugins/
Disallow: /readme.html
Disallow: /refer/

Sitemap: Aqui direccion del sitemap

Espero y te sea de ayuda :encouragement:
 
La mejor forma es crearlo con el bloc de notas en un archivo .txt
 
Hazlo manual, no es nada difícil, solo busca algún ejemplo en cualquier blog.

Enviado desde mi XT1032 mediante Tapatalk
 
Yo siempre uso mi robot.txt de la siguiente forma:

User-Agent: *
Allow: /?display=wide
Allow: /wp-content/uploads/
Disallow: /wp-content/plugins/
Disallow: /readme.html
Disallow: /refer/

Sitemap: Aqui direccion del sitemap

Espero y te sea de ayuda :encouragement:

Me puedes detallar que significa cada linea jeje
 
Aquí he encontrado uno muy pepino:

Insertar CODE, HTML o PHP:
User-agent: *
Disallow: /wp-login
Disallow: /wp-admin
Disallow: //wp-includes/
Disallow: /*/feed/
Disallow: /*/trackback/
Disallow: /*/attachment/
Disallow: /author/
Disallow: /*/page/
Disallow: /*/feed/
Disallow: /tag/*/page/
Disallow: /tag/*/feed/
Disallow: /page/
Disallow: /comments/
Disallow: /xmlrpc.php
Disallow: /*?s=
Disallow: /*/*/*/feed.xml
Disallow: /?attachment_id*

User-agent: Orthogaffe
Disallow: /

User-agent: UbiCrawler
Disallow: /

User-agent: DOC
Disallow: /

User-agent: Zao
Disallow: /

# Some bots are known to be trouble, particularly those designed to copy

# entire sites. Please obey robots.txt.

User-agent: sitecheck.internetseer.com
Disallow: /

User-agent: Zealbot
Disallow: /

User-agent: MSIECrawler
Disallow: /

User-agent: SiteSnagger
Disallow: /

User-agent: WebStripper
Disallow: /

User-agent: WebCopier
Disallow: /

User-agent: Fetch
Disallow: /

User-agent: Offline Explorer
Disallow: /

User-agent: Teleport
Disallow: /

User-agent: TeleportPro
Disallow: /

User-agent: WebZIP
Disallow: /

User-agent: linko
Disallow: /

User-agent: HTTrack
Disallow: /

User-agent: Microsoft.URL.Control
Disallow: /

User-agent: Xenu
Disallow: /

User-agent: larbin
Disallow: /

User-agent: libwww
Disallow: /

User-agent: ZyBORG
Disallow: /

User-agent: Download Ninja
Disallow: /

User-agent: wget
Disallow: /

User-agent: grub-client
Disallow: /
 
Última edición:
Aquí he encontrado uno muy pepino:

Insertar CODE, HTML o PHP:
User-agent: *
Disallow: /wp-login
Disallow: /wp-admin
Disallow: //wp-includes/
Disallow: /*/feed/
Disallow: /*/trackback/
Disallow: /*/attachment/
Disallow: /author/
Disallow: /*/page/
Disallow: /*/feed/
Disallow: /tag/*/page/
Disallow: /tag/*/feed/
Disallow: /page/
Disallow: /comments/
Disallow: /xmlrpc.php
Disallow: /*?s=
Disallow: /*/*/*/feed.xml
Disallow: /?attachment_id*

User-agent: Orthogaffe
Disallow: /

User-agent: UbiCrawler
Disallow: /

User-agent: DOC
Disallow: /

User-agent: Zao
Disallow: /

# Some bots are known to be trouble, particularly those designed to copy

# entire sites. Please obey robots.txt.

User-agent: sitecheck.internetseer.com
Disallow: /

User-agent: Zealbot
Disallow: /

User-agent: MSIECrawler
Disallow: /

User-agent: SiteSnagger
Disallow: /

User-agent: WebStripper
Disallow: /

User-agent: WebCopier
Disallow: /

User-agent: Fetch
Disallow: /

User-agent: Offline Explorer
Disallow: /

User-agent: Teleport
Disallow: /

User-agent: TeleportPro
Disallow: /

User-agent: WebZIP
Disallow: /

User-agent: linko
Disallow: /

User-agent: HTTrack
Disallow: /

User-agent: Microsoft.URL.Control
Disallow: /

User-agent: Xenu
Disallow: /

User-agent: larbin
Disallow: /

User-agent: libwww
Disallow: /

User-agent: ZyBORG
Disallow: /

User-agent: Download Ninja
Disallow: /

User-agent: wget
Disallow: /

User-agent: grub-client
Disallow: /

buscando por google también lo encontré xD

lo usare y veré que tal es :ghost:
 
User-Agent: * //Significa que acepta todos los robots

Allow: /?display=wide //Allow significa "Permite" en Inglés, pero no he encontrado qué significa /?display=wide

Allow: /wp-content/uploads/ //Permite, que los robots indexen el contenido de esta carpeta

Disallow: /wp-content/plugins/ //Disallow significa "Prohíbe", entonces prohíbe el robot indexe el contenido de esta carpeta

Disallow: /readme.html //prohíbe el robot indexe el contenido de esta carpeta

Disallow: /refer/ //lo mismo

Sitemap: La dirección de tu archivo sitemap.xml por ejemplo, tudominio.com - tudominio Resources and Information.

Espero haberte ayuda.

Saludos
Imerio Matos
 
Atrás
Arriba