como scrapear el titulo de un post?

adpays Seguir

VIP
Épsilon
Verificado
Verificación en dos pasos activada
Verificado por Whatsapp
Verificado por Binance
Suscripción a IA
Desde
11 Oct 2017
Mensajes
867
Hola, quiero scrapear el titulo de varias URLS y poner los titulos en una lista, como hago eso?
 

Benderslab

Kappa
Verificado
Verificación en dos pasos activada
Verificado por Whatsapp
Verificado por Binance
Desde
16 Abr 2018
Mensajes
2.545
Con js podes hacer un fetch a cada url y sacar el titulo
 

edw9879

Gamma
Verificación en dos pasos desactivada
Verificado por Whatsapp
¡Usuario con pocos negocios! ¡Utiliza siempre saldo de Forobeta!
Desde
12 Dic 2014
Mensajes
417
Lo puedes realizar con el lenguaje que dominas.
Si la web no tiene ninguna seguridad, lo puedes realizar con php.
Al realizar un scrapping, pon un temporizador, para que no te detecte como bot.
 

SEMTaurus

Delta
Verificación en dos pasos activada
Verificado por Whatsapp
Desde
15 Oct 2019
Mensajes
517
Ya va, pero ¿Has hecho alguna vez web scrapping o primera vez? Si es primera vez, ponte a ver tutoriales. En YT hay bastantes. Lo que puedo decirte es que hasta con Excel puedes hacer esa tarea, solo ten presente que no siempre los títulos de los posts son h1. En Blogger por ejemplo son h2, y no se si es el único caso.
En cuanto a librerias, en Python puedes usar bs4, en R está rvest, en js está cheerio y así por el estilo.
 

RaynierL

Gamma
Verificado
Verificación en dos pasos activada
Verificado por Whatsapp
Verificado por Binance
Desde
7 Dic 2020
Mensajes
374
Js con Node lo haces en unos minutos.
 

Hugo7

Ni
Verificación en dos pasos activada
Verificado por Whatsapp
¡Ha verificado su Paypal!
Desde
15 May 2017
Mensajes
3.957
con papel y lápiz, en su defecto un bolígrafo (invento argentino)

tf3xPgn.gif
 

Hadrien Rivere

Dseda
Verificación en dos pasos activada
Verificado por Whatsapp
Desde
10 Feb 2017
Mensajes
1.030
Con Bun.js o Node.js (dependiendo la version de este), puedes hacer algo tan simple como esto, para scrapear los titulos de un sitio.

JavaScript:
const req = await fetch("https://www.youtube.com/watch?v=M0qMgoChzGI");
const html = await req.text();
const title = html.match(/title/gm);
console.log(title);
 

DevOpKinG

No recomendado
Verificación en dos pasos desactivada
Verificado por Whatsapp
¡Usuario con pocos negocios! ¡Utiliza siempre saldo de Forobeta!
Desde
25 Nov 2022
Mensajes
788
Por favor, ten en cuenta 📝 que si deseas hacer un trato 🤝 con este usuario, está baneado 🔒.
Puedes hacerlo con un bot de telegram creado en python, hay muchos tutoriales en internet . Si no entiendes, puedes escribirme yo te ayudo.
 

Hugo7

Ni
Verificación en dos pasos activada
Verificado por Whatsapp
¡Ha verificado su Paypal!
Desde
15 May 2017
Mensajes
3.957
En PHP es ultra fácil, copiar y pegar...

PHP:
<?php
    function page_title($url) {
        $fp = file_get_contents($url);
        if (!$fp)
            return null;

        $res = preg_match("/<title>(.*)<\/title>/siU", $fp, $title_matches);
        if (!$res)
            return null;

        $title = preg_replace('/\s+/', ' ', $title_matches[1]);
        $title = trim($title);
        return $title;
    }

    echo page_title("https://www.forobeta.com/");
?>
 

¡Regístrate y comienza a ganar!

Beneficios

  • Gana dinero por participar
  • Gana dinero por recomendarnos
  • Descubre ofertas de empleo diariamente
  • Negocios seguros
  • ¡Información premium y más!

Acceder

¿Ya tienes una cuenta? Accede aquí

Arriba