Extractor de correos electrónicos masivo

Demiax

Delta
Programador
Verificación en dos pasos desactivada
Desde
4 Sep 2011
Mensajes
500
Edad
35
Crédito(s)
1
Puntos
112
Hola Betas, hoy quiero compartir con ustedes una herramienta que cree hace algún tiempo con Python y que todavía tengo en desarrollo, así que si se los ocurre alguna idea, bienvenida sea!!!

Su funcionalidad principal es las búsqueda en Google, ideal para Marketing

Ejemplo de uso: pasas una frase como "talleres mecánicos en Buenos aires", ingresas la cantidad de búsquedas en Google (ej: 500), el script ingresará a esos primeros 500 enlaces de Google para extraer todos sus correos.

Link GitHub: https://github.com/DiegoCaraballo/Email-extractor

Funcionalidades:

1 - Extraer los correos de una única URL
2 - Extraer los correos de una URL (dos niveles) - Busca sobre la página ingresada y todas sus URLs
3 - Hacer una búsqueda en Google, guardar las Urls encontradas y buscar los correos en dichas Urls
4 - Los correos son guardados en una base de datos Sqlite
5 - Se pueden listar los correos guardados
6 - Se pueden guardar los correos en un archivo .txt

Instalación:

1) Si tienes conocimientos en GIT puedes clonar el repositorio de GitHub, de lo contrario puedes bajarte el ZIP también desde GitHub
2) Descargar e instalar Python 3.x --> https://www.python.org/downloads/
3) Ya sea que hayas clonado el repositorio o descomprimido el ZIP, debes posicionarte (por CMD - Consola de Windows, Linux o MAC) en el directorio donde se encuentra el archivo EmailExtractor.py . Este se alojará donde lo guardes + la ruta del repositorio /DiegoCaraballo/EmailExtractor.
4) Ahora no recuerdo bien, pero creo que PIP (es un instalador de paquetes de Python) ya viene incorporado al instalar Python 3, de lo contrario tendrán que hacer una búsqueda en Google de como instalarlo (es bastante sencillo). Para que la aplicación funcione debemos ejecutar el siguiente comando en la consola: pip install -r requirements.txt , esto instalara todos los módulos necesarios que utiliza la aplicación.
5) Si todo se instaló correctamente solo queda correr la aplicación: en la consola nuevamente ejecutamos python EmailExtractor.py

P.D
: Cuando estén en la consola siempre tienen que ejecutar los comandos en la ruta de la aplicación.

P.D2: Para la funcionalidad 3, cuanto mayor sea el número de búsquedas que ingresemos en Google mayor será el tiempo que la aplicación esté buscando correos, recuerden que busca en las Urls que Google devolvió + todas las Urls que estén en esos sitios web.

EmailExtractor.png
 
Última edición:

abecedaria

Épsilon
Programador
Verificación en dos pasos desactivada
Desde
4 Ago 2015
Mensajes
809
Edad
24
Crédito(s)
0
Puntos
481
Hola Betas, hoy quiero compartir con ustedes una herramienta que cree hace algún tiempo con Python y que todavía tengo en desarrollo, así que si se los ocurre alguna idea, bienvenida sea!!!

Su funcionalidad principal es las búsqueda en Google, ideal para Marketing

Ejemplo de uso: pasas una frase como "talleres mecánicos en Buenos aires", ingresas la cantidad de búsquedas en Google (ej: 500), el script ingresará a esos primeros 500 enlaces de Google para extraer todos sus correos.

Link GitHub: https://github.com/DiegoCaraballo/Email-extractor

Funcionalidades:

1 - Extraer los correos de una única URL
2 - Extraer los correos de una URL (dos niveles) - Busca sobre la página ingresada y todas sus URLs
3 - Hacer una búsqueda en Google, guardar las Urls encontradas y buscar los correos en dichas Urls
4 - Los correos son guardados en una base de datos Sqlite
5 - Se pueden listar los correos guardados
6 - Se pueden guardar los correos en un archivo .txt

Ver el archivo adjunto 157967
¿Google no te limita las búsquedas con captchas?
 

Demiax

Delta
Programador
Verificación en dos pasos desactivada
Desde
4 Sep 2011
Mensajes
500
Edad
35
Crédito(s)
1
Puntos
112
¿Google no te limita las búsquedas con captchas?
Hola, he probado hasta mil búsquedas y no he tenido ningún inconveniente.
El script primero obtiene las Urls (como si buscaras una frase en google) y luego realiza el scraping de los correos entrando en cada Url obtenida.

Saludos.
 

abecedaria

Épsilon
Programador
Verificación en dos pasos desactivada
Desde
4 Ago 2015
Mensajes
809
Edad
24
Crédito(s)
0
Puntos
481
Hola, he probado hasta mil búsquedas y no he tenido ningún inconveniente.
El script primero obtiene las Urls (como si buscaras una frase en google) y luego realiza el scraping de los correos entrando en cada Url obtenida.

Saludos.
Te refieres a esas mil búsquedas seguidas, una tras otra, o en total?
Lo digo porque yo, con c#, de varias formas, haciendo peticiones al buscador de Google, me acaba sacando un "Too many requests" o un captcha de verificación anti-robots...
 

Demiax

Delta
Programador
Verificación en dos pasos desactivada
Desde
4 Sep 2011
Mensajes
500
Edad
35
Crédito(s)
1
Puntos
112
Te refieres a esas mil búsquedas seguidas, una tras otra, o en total?
Lo digo porque yo, con c#, de varias formas, haciendo peticiones al buscador de Google, me acaba sacando un "Too many requests" o un captcha de verificación anti-robots...
No he tenido ese inconveniente. Igualmente imagino que debe ser porque haces las solicitudes muy seguidas.
Lo que hace la librería de google en este script es solo brindarme las Urls que califican por ejemplo en los primeros 1000 lugares para cierta frase, luego yo trabajo con ellas para extraer sus correos sin depender de Google..
Saludos
 

Franyer Rivas

VIP
1
Ni
Marketing
Verificado con documento
Verificación en dos pasos desactivada
Verificado por Whatsapp
Desde
11 Ago 2010
Mensajes
3.903
Crédito(s)
0
Puntos
1.969
Excelente aporte, aunque seria bueno un pequeño tutorial de como ejecutarlo, para los que no sabemos Python :( se te agradecería al infinito y más allá
 

multigom

Beta
Verificación en dos pasos desactivada
Desde
13 May 2019
Mensajes
40
Edad
28
Crédito(s)
0
Puntos
0
podrias hacer una explicacion para los que no sabemos python
 

Demiax

Delta
Programador
Verificación en dos pasos desactivada
Desde
4 Sep 2011
Mensajes
500
Edad
35
Crédito(s)
1
Puntos
112

Franyer Rivas

VIP
1
Ni
Marketing
Verificado con documento
Verificación en dos pasos desactivada
Verificado por Whatsapp
Desde
11 Ago 2010
Mensajes
3.903
Crédito(s)
0
Puntos
1.969
Hoy editare la entrada para su correcta instalación. Espero les sea de ayuda.

Saludos, Diego
Estupendo, estaré atento a la actualización, aparte te podría hacer una sugerencia
por ejemplo, aparte de guardar el email, guardar el nombre del sitio web (el que se encuentra en la etiqueta <title>
esto puede servir demasiado a la hora de enviar email personalizados, ya que aumenta mucho la taza de apertura y respuesta
entonces al exportarlo puede ser en un archivo de texto tipo : nombre, email
Si llegas a implementar eso igual avisa! Saludos.
 

Demiax

Delta
Programador
Verificación en dos pasos desactivada
Desde
4 Sep 2011
Mensajes
500
Edad
35
Crédito(s)
1
Puntos
112
Estupendo, estaré atento a la actualización, aparte te podría hacer una sugerencia
por ejemplo, aparte de guardar el email, guardar el nombre del sitio web (el que se encuentra en la etiqueta <title>
esto puede servir demasiado a la hora de enviar email personalizados, ya que aumenta mucho la taza de apertura y respuesta
entonces al exportarlo puede ser en un archivo de texto tipo : nombre, email
Si llegas a implementar eso igual avisa! Saludos.
Si es una muy buena idea, gracias.

También estoy con el desarrollo de 2 funcionalidades más:
1 - Poder filtrar las búsquedas por países
2 - Agregar un .txt con una lista de frases a buscar

Saludos
 

Demiax

Delta
Programador
Verificación en dos pasos desactivada
Desde
4 Sep 2011
Mensajes
500
Edad
35
Crédito(s)
1
Puntos
112
Editado para su correcta instalación, cualquier cosa me avisan. Saludos
 

iamcholo

VIP
Delta
Verificación en dos pasos activada
Desde
1 Oct 2015
Mensajes
720
Crédito(s)
0
Puntos
706
Muy buen aporte @Demiax

Como tip e idea, te sugiero hacer una versión para instagram, le sería de utilida ha algunos usuarios en el foro, para obtener los emails que dejan en los comentarios de IG.

Éxito compa!
 

Demiax

Delta
Programador
Verificación en dos pasos desactivada
Desde
4 Sep 2011
Mensajes
500
Edad
35
Crédito(s)
1
Puntos
112
Gracias, lo tendré en cuenta. Saludos
 

Arriba