Tutorial: Scraper Xvideos [Node.js + Playwright]

rafadizeosp · 22 May 2024

Hola comunidad, les comparto algo en lo que estuve trabajando esta mañana:

Video Scrapper

Este proyecto es un scrapper que extrae información de videos de Xvideos y la guarda en un archivo JSON. Utiliza Playwright para navegar y extraer datos de la página web.

Requisitos:

Node.js (versión 14 o superior)
npm (versión 6 o superior)

Instalación:

Descargue el archivo: Descargue el archivo video-scrapper-v1.0.0.zip desde los archivos adjuntos.
Descomprimir el Archivo: Descomprima el archivo descargado en una ubicación de su elección.
Instalar dependencias:
Abra una terminal o línea de comandos y navegue hasta el directorio del proyecto descomprimido.
Ejecute el siguiente comando para instalar las dependencias:
Bash:
```
npm install
```
Modificar la URL a scrapear: Busque en el código URL_RESULTADOS_BUSQUEDA_XVIDEOS y reemplácela por la URL de los resultados de búsqueda (por ejemplo, https://www.xvideos.com/?k=Argentina&sort=uploaddate).
Ejecutar el scraper:
Bash:
```
node index.js
```

Uso:

Ejecutar el scrapper:
Bash:
```
node index.js
```
Verificar la generación del archivo: Verifique que se haya generado el archivo data.json con la información recopilada.

Estructura del Proyecto:

index.js: El script principal que realiza el scraping.
package.json: Contiene las dependencias y scripts del proyecto.

UPDATE: Dejo un ejemplo del JSON generado

China Locura · 22 May 2024

Excelente voy a testearlo compañero muchas gracias

LosReyesMagos · 22 May 2024

se agradece tu trabajo

pero ¿para que sirve exactamente?

rafadizeosp dijo:
Hola comunidad, les comparto algo en lo que estuve trabajando esta mañana:

Video Scrapper

Este proyecto es un scrapper que extrae información de videos de Xvideos y la guarda en un archivo JSON. Utiliza Playwright para navegar y extraer datos de la página web.

Requisitos:

Node.js (versión 14 o superior)

npm (versión 6 o superior)

Instalación:

Descargue el archivo: Descargue el archivo video-scrapper-v1.0.0.zip desde los archivos adjuntos.

Descomprimir el Archivo: Descomprima el archivo descargado en una ubicación de su elección.

Instalar dependencias:
Abra una terminal o línea de comandos y navegue hasta el directorio del proyecto descomprimido.
Ejecute el siguiente comando para instalar las dependencias:

Bash:

npm install

Modificar la URL a scrapear: Busque en el código URL_RESULTADOS_BUSQUEDA_XVIDEOS y reemplácela por la URL de los resultados de búsqueda (por ejemplo, https://www.xvideos.com/?k=Argentina&sort=uploaddate).

Ejecutar el scraper:

Bash:

node index.js

Uso:

Ejecutar el scrapper:

Bash:

node index.js

Verificar la generación del archivo: Verifique que se haya generado el archivo data.json con la información recopilada.

Estructura del Proyecto:

index.js: El script principal que realiza el scraping.

package.json: Contiene las dependencias y scripts del proyecto.

uva · 22 May 2024

LosReyesMagos dijo:
se agradece tu trabajo

pero ¿para que sirve exactamente?

Te lo dice en el post, extrae información de los vídeos de xvideos

Me imagino que guardara nombres de canal, antigüedad, nombres, etc

Esa información en buenas manos es bastante útil

rafadizeosp · 22 May 2024

LosReyesMagos dijo:
se agradece tu trabajo

pero ¿para que sirve exactamente?

Puedes hacer muchas cosas, simples como crear un script que consuma el JSON y añada videos a tu sitio web, crear un api rest, crear una base de datos de videos. También puedes automatizar el proceso con alguna cronjob, utilizar los enlaces directos de video para implementar tu propio reproductor, etc

Prothone · 22 May 2024

rafadizeosp dijo:
Hola comunidad, les comparto algo en lo que estuve trabajando esta mañana:

Video Scrapper

Este proyecto es un scrapper que extrae información de videos de Xvideos y la guarda en un archivo JSON. Utiliza Playwright para navegar y extraer datos de la página web.

Requisitos:

Node.js (versión 14 o superior)

npm (versión 6 o superior)

Instalación:

Descargue el archivo: Descargue el archivo video-scrapper-v1.0.0.zip desde los archivos adjuntos.

Descomprimir el Archivo: Descomprima el archivo descargado en una ubicación de su elección.

Instalar dependencias:
Abra una terminal o línea de comandos y navegue hasta el directorio del proyecto descomprimido.
Ejecute el siguiente comando para instalar las dependencias:

Bash:

npm install

Modificar la URL a scrapear: Busque en el código URL_RESULTADOS_BUSQUEDA_XVIDEOS y reemplácela por la URL de los resultados de búsqueda (por ejemplo, https://www.xvideos.com/?k=Argentina&sort=uploaddate).

Ejecutar el scraper:

Bash:

node index.js

Uso:

Ejecutar el scrapper:

Bash:

node index.js

Verificar la generación del archivo: Verifique que se haya generado el archivo data.json con la información recopilada.

Estructura del Proyecto:

index.js: El script principal que realiza el scraping.

package.json: Contiene las dependencias y scripts del proyecto.

UPDATE: Dejo un ejemplo del JSON generado

Esta buenisimo pero yo por gusto personal usaria mas selenium pero eso ya es personal xD

rafadizeosp · 23 May 2024

Prothone dijo:
Esta buenisimo pero yo por gusto personal usaria mas selenium pero eso ya es personal xD

Nunca toqué Selenium, soy nuevo en lo que es automatizaciones/scraping, lo hice en Playwright por una cuestion de simplicidad.

Tutorial: Scraper Xvideos [Node.js + Playwright]

rafadizeosp

Adjuntos

China Locura

LosReyesMagos

uva

rafadizeosp

Prothone

rafadizeosp