como scrapear el titulo de un post?

adpays

Delta
Verificación en dos pasos desactivada
Verificado por Whatsapp
Desde
11 Oct 2017
Mensajes
603
Hola, quiero scrapear el titulo de varias URLS y poner los titulos en una lista, como hago eso?
 

Benderslab

VIP
Iota
Programador
Verificado
Verificación en dos pasos desactivada
Verificado por Whatsapp
Verificado por Binance
Desde
16 Abr 2018
Mensajes
2.060
Con js podes hacer un fetch a cada url y sacar el titulo
 

edw9879

Gamma
Verificación en dos pasos desactivada
Verificado por Whatsapp
¡Usuario con pocos negocios! ¡Utiliza siempre saldo de Forobeta o intermediario gratuito!
Desde
12 Dic 2014
Mensajes
399
Lo puedes realizar con el lenguaje que dominas.
Si la web no tiene ninguna seguridad, lo puedes realizar con php.
Al realizar un scrapping, pon un temporizador, para que no te detecte como bot.
 

moon-ra

Gamma
Verificación en dos pasos activada
Verificado por Whatsapp
Desde
15 Oct 2019
Mensajes
484
Ya va, pero ¿Has hecho alguna vez web scrapping o primera vez? Si es primera vez, ponte a ver tutoriales. En YT hay bastantes. Lo que puedo decirte es que hasta con Excel puedes hacer esa tarea, solo ten presente que no siempre los títulos de los posts son h1. En Blogger por ejemplo son h2, y no se si es el único caso.
En cuanto a librerias, en Python puedes usar bs4, en R está rvest, en js está cheerio y así por el estilo.
 

RaynierL

Beta
Verificación en dos pasos desactivada
Verificado por Whatsapp
¡Usuario con pocos negocios! ¡Utiliza siempre saldo de Forobeta o intermediario gratuito!
Desde
7 Dic 2020
Mensajes
105
Js con Node lo haces en unos minutos.
 

Hugo7

VIP
Ni
Marketing
Verificación en dos pasos activada
Verificado por Whatsapp
¡Ha verificado su Paypal!
Desde
15 May 2017
Mensajes
3.713
con papel y lápiz, en su defecto un bolígrafo (invento argentino)

tf3xPgn.gif
 

Hadrien Rivere

Épsilon
Verificación en dos pasos desactivada
Verificado por Whatsapp
Desde
10 Feb 2017
Mensajes
971
Con Bun.js o Node.js (dependiendo la version de este), puedes hacer algo tan simple como esto, para scrapear los titulos de un sitio.

JavaScript:
const req = await fetch("https://www.youtube.com/watch?v=M0qMgoChzGI");
const html = await req.text();
const title = html.match(/title/gm);
console.log(title);
 

DevOpKinG

Gamma
Verificación en dos pasos desactivada
Verificado por Whatsapp
Usuario nuevo
¡Usuario con pocos negocios! ¡Utiliza siempre saldo de Forobeta o intermediario gratuito!
Desde
25 Nov 2022
Mensajes
382
Puedes hacerlo con un bot de telegram creado en python, hay muchos tutoriales en internet . Si no entiendes, puedes escribirme yo te ayudo.
 

Hugo7

VIP
Ni
Marketing
Verificación en dos pasos activada
Verificado por Whatsapp
¡Ha verificado su Paypal!
Desde
15 May 2017
Mensajes
3.713
En PHP es ultra fácil, copiar y pegar...

PHP:
<?php
    function page_title($url) {
        $fp = file_get_contents($url);
        if (!$fp)
            return null;

        $res = preg_match("/<title>(.*)<\/title>/siU", $fp, $title_matches);
        if (!$res)
            return null;

        $title = preg_replace('/\s+/', ' ', $title_matches[1]);
        $title = trim($title);
        return $title;
    }

    echo page_title("https://www.forobeta.com/");
?>
 

¡Regístrate y comienza a ganar!

Beneficios

  • Gana dinero por participar
  • Gana dinero por recomendarnos
  • Descubre ofertas de empleo diariamente
  • Negocios seguros, intermediario gratis
  • ¡Información premium y más!

Acceder

¿Ya tienes una cuenta? Accede aquí


Arriba