Hola comunidad, les comparto algo en lo que estuve trabajando esta mañana:
Video Scrapper
Este proyecto es un scrapper que extrae información de videos de Xvideos y la guarda en un archivo JSON. Utiliza Playwright para navegar y extraer datos de la página web.
Requisitos:
- Node.js (versión 14 o superior)
- npm (versión 6 o superior)
Instalación:
- Descargue el archivo: Descargue el archivo video-scrapper-v1.0.0.zip desde los archivos adjuntos.
- Descomprimir el Archivo: Descomprima el archivo descargado en una ubicación de su elección.
- Instalar dependencias:
Abra una terminal o línea de comandos y navegue hasta el directorio del proyecto descomprimido.
Ejecute el siguiente comando para instalar las dependencias:
- Modificar la URL a scrapear: Busque en el código URL_RESULTADOS_BUSQUEDA_XVIDEOS y reemplácela por la URL de los resultados de búsqueda (por ejemplo, https://www.xvideos.com/?k=Argentina&sort=uploaddate).
- Ejecutar el scraper:
Uso:
- Ejecutar el scrapper:
- Verificar la generación del archivo: Verifique que se haya generado el archivo data.json con la información recopilada.
Estructura del Proyecto:
- index.js: El script principal que realiza el scraping.
- package.json: Contiene las dependencias y scripts del proyecto.
UPDATE: Dejo un ejemplo del JSON generado