Si lo que quieres es extraer informacion de una pagina web automaticamente y luego procesarla (parsearla, guardarla, lo que quieras hacer), existen muchas herramientas especificas y automatizadas. Ya te han nombrado algunas, yo nunca he usado ninguna ya hecha.
Si lo quieras hacer tu mismo entonces deberias tener conocimientos en algun lenguaje de programacion.
Con php lo basico seria pedir la url que quieres con CURL o algo mas sensillo con FILE_GET_CONTENTS
Ya teniendo el contenido de la pagina deberias parsearla, por ejemplo usando expresiones regulares y las funcionas PREG_MATCH o PREG_MATCH_ALL segun el caso de lo que quieras hacer. Otra alternativa a este paso seria usar XPATH o DOMXPATH.
Aqui ya tendrias la informacion que te interesa parseada y podrias hacer lo que quieras con ella.
Igualmente deberias tener cuidado con lo que quieres hacer, no es muy etico crear una web con contenido ajeno.
Saludos.