automatizar procesos con scraping

EMM

Curioso
Verificación en dos pasos desactivada
Verificado por Whatsapp
¡Usuario con pocos negocios!
Desde
21 Feb 2021
Mensajes
2
Hola a todos.

Estoy buscando alguna aplicación que me permita automatizar un proceso que requiere de webscrapping.

Se trata de extraer ciertos valores de una pagina web (fecha, url de imagen y titulo) para insertarlos en el "esqueleto" de un fichero .txt cuyo contenido es:

<script type="application/ld+json"> { "@context": "[URL='https://schema.org/']https://schema.org[/URL]", "@type": "NewsArticle", "headline": "AQUI EL TITULO DE LA PAGINA WEB", "image": [ "[URL='https://AQUI LA URL DE LA IMAGEN.png[/URL]" ], "datePublished": "AQUI LA FECHA", "dateModified": "AQUI LA FECHA" } </script>

Mi idea es poder realizar todo el proceso con un solo click.

Alguna sugerencia para realizar esta automatización?

Gracias.
 

cholemon

Gamma
Verificación en dos pasos desactivada
Verificado por Whatsapp
¡Usuario con pocos negocios!
Desde
12 Mar 2017
Mensajes
151
Haz scrap y le aplicas expresiones regulares para poder extraer lo que necesitas.
 

Henry00jj95

VIP
Épsilon
Programador
Verificación en dos pasos activada
Verificado por Whatsapp
¡Ha verificado su Paypal!
Desde
29 May 2019
Mensajes
782
Hola a todos.

Estoy buscando alguna aplicación que me permita automatizar un proceso que requiere de webscrapping.

Se trata de extraer ciertos valores de una pagina web (fecha, url de imagen y titulo) para insertarlos en el "esqueleto" de un fichero .txt cuyo contenido es:

<script type="application/ld+json"> { "@context": "[URL='https://schema.org/']https://schema.org[/URL]", "@type": "NewsArticle", "headline": "AQUI EL TITULO DE LA PAGINA WEB", "image": [ "[URL='https://AQUI LA URL DE LA IMAGEN.png[/URL]" ], "datePublished": "AQUI LA FECHA", "dateModified": "AQUI LA FECHA" } </script>

Mi idea es poder realizar todo el proceso con un solo click.

Alguna sugerencia para realizar esta automatización?

Gracias.
Si sabes algo de PHP te recomiendo usar curl más expresiones regulares como preg_match o preg_match_all para sacar dicho contenido.
 

Demiax

Épsilon
Programador
Verificación en dos pasos desactivada
Desde
4 Sep 2011
Mensajes
784
Buenas, si conoces Python puedes realizarlo con él y BeautifulSoup.
Saludos
 

mchojrin

Beta
Verificación en dos pasos desactivada
¡Usuario con pocos negocios!
Desde
10 Feb 2017
Mensajes
37
Aquí tienes un ejemplo que utiliza simples expresiones regulares pero lo que yo te recomiendo es que utilices la librería DomCrawler de Symfony.
 

EMM

Curioso
Verificación en dos pasos desactivada
Verificado por Whatsapp
¡Usuario con pocos negocios!
Desde
21 Feb 2021
Mensajes
2
Muchas gracias!!
 

Crea una cuenta o accede para comentar

Debes ser un miembro para poder comentar

Crear cuenta

Crea una cuenta en nuestra comunidad

Acceder

¿Ya tienes una cuenta? Accede aquí


Arriba