automatizar procesos con scraping

  • Autor Autor EMM
  • Fecha de inicio Fecha de inicio
E

EMM

Alfa
Verificado por Whatsapp
¡Usuario con pocos negocios! ¡Utiliza siempre saldo de Forobeta!
Hola a todos.

Estoy buscando alguna aplicación que me permita automatizar un proceso que requiere de webscrapping.

Se trata de extraer ciertos valores de una pagina web (fecha, url de imagen y titulo) para insertarlos en el "esqueleto" de un fichero .txt cuyo contenido es:

<script type="application/ld+json"> { "@context": "[URL='https://schema.org/']https://schema.org[/URL]", "@type": "NewsArticle", "headline": "AQUI EL TITULO DE LA PAGINA WEB", "image": [ "[URL='https://AQUI LA URL DE LA IMAGEN.png[/URL]" ], "datePublished": "AQUI LA FECHA", "dateModified": "AQUI LA FECHA" } </script>

Mi idea es poder realizar todo el proceso con un solo click.

Alguna sugerencia para realizar esta automatización?

Gracias.
 
Haz scrap y le aplicas expresiones regulares para poder extraer lo que necesitas.
 
Hola a todos.

Estoy buscando alguna aplicación que me permita automatizar un proceso que requiere de webscrapping.

Se trata de extraer ciertos valores de una pagina web (fecha, url de imagen y titulo) para insertarlos en el "esqueleto" de un fichero .txt cuyo contenido es:

<script type="application/ld+json"> { "@context": "[URL='https://schema.org/']https://schema.org[/URL]", "@type": "NewsArticle", "headline": "AQUI EL TITULO DE LA PAGINA WEB", "image": [ "[URL='https://AQUI LA URL DE LA IMAGEN.png[/URL]" ], "datePublished": "AQUI LA FECHA", "dateModified": "AQUI LA FECHA" } </script>

Mi idea es poder realizar todo el proceso con un solo click.

Alguna sugerencia para realizar esta automatización?

Gracias.
Si sabes algo de PHP te recomiendo usar curl más expresiones regulares como preg_match o preg_match_all para sacar dicho contenido.
 
Buenas, si conoces Python puedes realizarlo con él y BeautifulSoup.
Saludos
 
Aquí tienes un ejemplo que utiliza simples expresiones regulares pero lo que yo te recomiendo es que utilices la librería DomCrawler de Symfony.
 
Muchas gracias!!
 

Temas similares

C
Respuestas
8
Visitas
267
compuplas
compuplas
E
Respuestas
3
Visitas
211
Maria Coiran
Maria Coiran
Atrás
Arriba