easy.
Requerimientos:
1: Nodejs + npm
2: Google Chrome
Como usar:
1 Abre una consola en cmd
2 Escribe npm init --yes
3 Instala las dependencias: (copia, pega y da enter en la consola) npm i puppeteer-core chrome-paths
@Colors/colors
4 Crea un nuevo archivo de js con el nombre que quieras, Ejemplo "buscar.js" y pega este codigo:
JavaScript:
const puppeteer = require('puppeteer-core');
const chromePaths = require('chrome-paths');
const colors = require('@colors/colors');
(async function () {
let browser = await puppeteer.launch({
headless: false,
executablePath: chromePaths.chrome
})
//Array of pages in which I want to search for an "h1".
const myPagesArray = [
'https://google.com',
'https://youtube.com',
'https://instagram.com',
'https://tiktok.com'
]
const [page] = await browser.pages();
for (const pages of myPagesArray) {
await page.goto(pages, { timeout: 0, waitUntil: "networkidle2" })
// Validate if exists an h1 into web.
if (await page.$('h1') !== null) {
console.log('Estoy en la pagina'.yellow, pages, 'y si posee un h1'.green);
} else {
console.log('La pagina'.yellow, pages, 'No posee un h1'.red)
}
await page.waitForTimeout(5000);
}
// Closing the browser.
await page.close();
})()
5 En la consola escribe node busdcar.js
Fin.
Ps: Si deseas buscar dentro del DOM texto especifico, en la estructura de control cambia el "h1" por "body", una ves tengas el body tocara que uses el metodo .include o .filter para encontrar lo que buscas.