DOM de PHP obtener nodeValue con etiquetas de <br>

  • Autor Usuario eliminado 44716
  • Fecha de inicio
U

Usuario eliminado 44716

Hola a todos, verán hice un script (cURL / DOM) para obtener elementos de las sub-páginas de una página y poder guardarlos en otra.

Mi problema viene cuando con el DOM quiero obtener el valor "td" de una tabla, dicho "table date" contiene saltos de línea "<br>" y "<strong>" pero usando nodeValue para sacar el valor se come estas etiquetas y no conozco de otra forma para hacerlo sin que pase de ellas.

Gracias por leerme,

Saludos!
 
U

Usuario eliminado 44716

Hola, gracias por responder mira aquí tienes:

Insertar CODE, HTML o PHP:
$caracteristicas = $DOM->getElementById('fichaproducto')->getElementsByTagName('tr')->item(3)->getElementsByTagName('td')->item(0)->nodeValue;
$DOM es un objeto que proviene de cURL y como puedes ver voy accediendo por partes hasta que llego al td que quiero ese td tiene saltos de línea y negritas pero si uso nodeValue solo me da el texto formateado.
 
U

Usuario eliminado 44716

Mira:

PHP:
	$response = curl_exec($handler);
	curl_close($handler);
	
	$DOM = new DOMDocument();
	@$DOM->loadHTML($response);

Tu te refieres a que no haga esto, y del $response que es la página en sí obtenida por curl use tu método ¿no?, si es así, ¿podrías decirme cómo se hace por favor o explicarme la función esa ya que no la entiendo en la página de php?

Saludos!
 
U

Usuario eliminado 44716

Sí pero casualmente el td que quiero no me lo ha obtenido en el array :witless: si quieres te puedo pasar la página por mp para que veas ya que no quiero ponerla aquí por el SEO.

Saludos!
 
U

Usuario eliminado 44716

Funciona perfecto, pero ¿sabrías como podría eliminar la imagen que aparece al inicio?, y por último ¿que los caracteres salgan sin codificación ahí no significa que cuando yo los almacene en una bd y los vuelva a imprimir no vallan a salir bien o sí?

Gracias por tu ayuda :p
 
Arriba