Aplicación para comprobar enlaces dofollow/nofollow en listado de URLs

  • Autor Autor jelop391
  • Fecha de inicio Fecha de inicio
J

jelop391

Beta
¡Usuario con pocos negocios! ¡Utiliza siempre saldo de Forobeta!
Bueno, estoy desempolvando los libros de php ya que quiero hacer una aplicación la cual se alimentara de un listado de urls (añadidas en un form) y devolverá solo las url que contienen un link a el destino que hayas seleccionado (también mediante form) y ademas sea DOFOLLOW, es decir esta aplicación tendrá que comprobar las etiquetas de dicho enlace una vez localizado en busca del la fatídica "nofollow".

¿ Sabéis si existe alguna app que haga algo similar?
¿Que funciones necesitare para llevar esto a cabo?....Hace tiempo que no programo...

Una vez lo termine lo subiré para todos los betianos.

Gracias y saludos.
 
curl y regex.

curl para bajar las páginas
regex para encontrar el texto
 
Muchas gracias por vuestra contestación.

Ya estoy en ello.

Estoy abierto si a alguien se le ocurre algun buen consejo que deba de tener en cuenta.
 
ahora que lo recuerdo yo hice un script para verificar si mi sitio estaba en una cosa que se llamaba blogsmexico.com que era una especie de... pst.. no me acuerdo, pero cada 10 minutos revisaba si mi sitio estaba en la portada y si no estaba, lo mandaba automágicamente...

bueno... no era yo, era mi hermano gemelo maldito... el "Perro Callejero".

Ahorita actualizo. Enlace eliminado

Insertar CODE, HTML o PHP:
#!/usr/bin/env python
#-*- coding: utf-8 -*-

import urllib

bmexico = 'http://conxb.com'
titulo = 'El Toledano'
url="http://toledano.org/"
ping ="hxxp://conxb.com/hacerping.php?"

data = urllib.urlencode({"titulo" : titulo, "url" : url})
f = urllib.urlopen(bmexico).read().find('toledano')
if f > 0:
  print 'Estás en la portada'
else:
  f = urllib.urlopen(ping+data)

Como es Python, en la misma línea que abre el strem, se lee y se busca la cadena.

ATENCION: No visiten blogsmexico que inyecta un virus.
 
Última edición:
Me gusta la idea de tu script, estaría bien tener una sección de scripts en la página así cualquier podría usarlos!

Es buena idea hacerse un autoping cada X horas así siempre estás 'pingueado' jajaja
 
Por cierto, la advertencia de no visitar blogsmexico es en serio, hace tiempo quise entrar y me lo marco como sospechoso el navegador Chrome, asi que mejor alejense de ese sitio !
 
Atrás
Arriba