- Desde
- 20 Ene 2014
- Mensajes
- 47
Amigos estoy tratando de leer pdf's y verificar si contienen cierto contenido.
Lo que necesito es si el pdf contiene el texto que busco mover ese pdf a otra carpeta y la verdad es que ya estoy trabado y no se donde continuar
Este php es el que llama a las funciones y verifica si hay texto
include('class.pdf2text.php');
$a = new PDF2Text();
$a->searchdoc($filename);
$a->decodePDF();
$a->output();
$contenido=($a->output());
$cadena_de_texto = $contenido;
$cadena_buscada = 'SEL0204041U6';
$posicion_coincidencia = strpos($cadena_de_texto, $cadena_buscada);
//se puede hacer la comparacion con 'false' o 'true' y los comparadores '===' o '!=='
if ($posicion_coincidencia === false) {
echo "NO se ha encontrado la palabra deseada!!!!";
} else {
echo "Éxito!!! Se ha encontrado la palabra buscada en ";
}
y aqui esta el de las clases y funciones :
class PDF2Text {
// Some settings
var $multibyte = 4; // Use setUnicode(TRUE|FALSE)
var $convertquotes = ENT_QUOTES; // ENT_COMPAT (double-quotes), ENT_QUOTES (Both), ENT_NOQUOTES (None)
var $showprogress = true; // TRUE if you have problems with time-out
// Variables
var $filename = '';
var $decodedtext = '';
function searchdoc($filename) {
// Reset
foreach (glob("*.pdf") as $filename){
$this->decodedtext = '';
$this->filename = $filename;}
return $nombrearchivo;
}
function output($echo = false) {
if($echo) echo $this->decodedtext;
else return $this->decodedtext;
}
function setUnicode($input) {
// 4 for unicode. But 2 should work in most cases just fine
if($input == true) $this->multibyte = 4;
else $this->multibyte = 2;
}
function decodePDF() {
// Read the data from pdf file
$infile = @file_get_contents($this->filename, FILE_BINARY);
if (empty($infile))
return "";
Gracias por la ayuda!
Lo que necesito es si el pdf contiene el texto que busco mover ese pdf a otra carpeta y la verdad es que ya estoy trabado y no se donde continuar
Este php es el que llama a las funciones y verifica si hay texto
include('class.pdf2text.php');
$a = new PDF2Text();
$a->searchdoc($filename);
$a->decodePDF();
$a->output();
$contenido=($a->output());
$cadena_de_texto = $contenido;
$cadena_buscada = 'SEL0204041U6';
$posicion_coincidencia = strpos($cadena_de_texto, $cadena_buscada);
//se puede hacer la comparacion con 'false' o 'true' y los comparadores '===' o '!=='
if ($posicion_coincidencia === false) {
echo "NO se ha encontrado la palabra deseada!!!!";
} else {
echo "Éxito!!! Se ha encontrado la palabra buscada en ";
}
y aqui esta el de las clases y funciones :
class PDF2Text {
// Some settings
var $multibyte = 4; // Use setUnicode(TRUE|FALSE)
var $convertquotes = ENT_QUOTES; // ENT_COMPAT (double-quotes), ENT_QUOTES (Both), ENT_NOQUOTES (None)
var $showprogress = true; // TRUE if you have problems with time-out
// Variables
var $filename = '';
var $decodedtext = '';
function searchdoc($filename) {
// Reset
foreach (glob("*.pdf") as $filename){
$this->decodedtext = '';
$this->filename = $filename;}
return $nombrearchivo;
}
function output($echo = false) {
if($echo) echo $this->decodedtext;
else return $this->decodedtext;
}
function setUnicode($input) {
// 4 for unicode. But 2 should work in most cases just fine
if($input == true) $this->multibyte = 4;
else $this->multibyte = 2;
}
function decodePDF() {
// Read the data from pdf file
$infile = @file_get_contents($this->filename, FILE_BINARY);
if (empty($infile))
return "";
Gracias por la ayuda!