W
wasab
Gamma
El año pasado tras una serie de infortunados sucesos, Walhez estuvo fuera de linea por mas de dos semanas. El estar fuera de linea no fue algo malo, si se compara con lo que sucedió después. Y es perdimos una gran cantidad de artículos. Se recuperaron la mayoría de ellos. Por otro lado, quedaron todavía los artículos que teníamos publicados del 2008 hasta julio del 2009 perdidos, y así lo dejamos. Creímos que no tendriamos problemas.
Sin embargo, la realidad es otra. Perdimos posiciones en Google y por ende, trafico. Lo que me hizo darme cuenta de esto o mas bien, quien me hizo darme cuenta de esto fue Enlace eliminado, un SEO que conoce del tema y que me esta sacando de la ignorancia en cuanto a posicionamiento se refiere. El me señalo la importancia de corregir ese montón de enlaces perdidos y que Google reconoce como error 404 (no encontrado).
Publicando de dos a tres entradas diarias, seria como 730 artículos anuales. En 1 año y 7 meses seria aproximadamente 1150 artículos. La primer pregunta que me hice es, ¿como recupero tal cantidad de artículos?. Cuando la información se perdió, el proveedor del host no tenia ningún respaldo (nunca sean tan ingenuos en confiar todo al proveedor). Busque alternativas para recuperar la información perdida. Y entre las opciones para recuperar información de un website, como artículos perdidos de este, encontré:
Las dos primeras opciones se pueden utilizar cuando se tiene poco contenido, debido a que ambas exigen que se copie y pegue el contenido manualmente. La tercera opción es la mas viable; sin embargo, ante tanta demanda, en Warrick temporalmente no están atendiendo solicitudes. Me estaba quedando sin posibilidades de recuperar todo el contenido perdido de una sola vez.
Empece a considerar el copiar y pegar manualmente cada articulo. Copie unos treinta y de ahí no resistí mas. Busque y busque en Google una solución mas eficaz y eficiente, hasta que encontré varias formas de recuperar el contenido perdido. Las diferentes opciones giraban entorno a utilizar Feedburner y Google Reader para recuperar los artículos.
Si han estado distribuyendo sus artículos a sus lectores a través de una fuente RSS, hay una buena noticia y es que se puede, por medio de Feedburner y Google Reader, empezar a desplazarse a través del Feed del blog y llegar hasta los artículos mas antiguos y por ende, ¡recuperarlos!. Se puede recuperar las entradas de los blog individualmente o en masa de Google Reader.
En mi caso, al tener tanta cantidad de contenido perdido, me fui por la opción de recuperar todo en masa. Tras buscar en foros de ayuda y blogs, encontré un par de alternativas a mi dilema. Primero tenia que encontrar una forma de poder exportar solo el contenido que me interesaba restaurar. Para eso lo que hice fue:
Destacar los artículos a exportar:
Google Reader destacar articulos a recuperar
Lo siguiente es saber como importar estos artículos. Con el cambio de interfaz de Google Reader, también vino la posibilidad de exportar los artículos destacados y/o compartidos en JSON. En Google Reader se van a configuraciones (el icono en forma de tuerca) y seleccionan la pestaña importar/exportar y tendran un archivo .JSON.
1. Convertir JSON a WXR (.xml) para importar a WordPress
El inconveniente es que WordPress no importa archivos JSON. Me di a la tarea de buscar un convertidor de JSON a WXR (.xml). Encontré un convertidor de JSON a .XML. Es un script en PHP que tras correrlo en localhost, no me funciono:
Google Reader to WordPressConvirtió unos pocos artículos hasta que apareció un error. Como se espera, el archivo convertido no pudo ser importado por WordPress. Me toco que buscar otra alternativa para importar el contenido de Google Reader a WordPress.
2. Exportar elementos destacados de Google Reader en Atom (.XML) para convertir en archivos .RSS aceptados por WordPress
En un grupo de Google, encontré lo que requería. Un usuario de Google Reader comentaba como hizo para exportar los artículos destacados en .XML. Lo que el hizo fue descargar los elementos destacados por partes, debido a que Google Reader no permite descargar mas de 1000 elementos de una vez. Google Reader solo devuelve las ultimas 1000 entradas destacadas, por lo que es necesario descargar por partes los elementos destacados cuando son mas de 1000.
Primero es necesario identificar nuestro id de Google. Para hacer eso hay que dar clic en todos los elementos en Google Reader y copiar la URL:
google reader id
En la URL copiada se encuentra el id de Google. Para identificar el id hay que hacer lo siguiente. Tomamos la URL:
Google Reader – Google
Se descompone la URL para encontrar el id, el cual esta después de user%2F y antes de %2Fstate. El id de la cuenta de Google Reader es de 20 digitos:
Google Reader – Google
02284805872778321574 <— ID de Google Reader
%2Fstate%2Fcom.google%2Freading-list
Teniendo el id de nuestra cuenta de Google Reader identificado, procedemos al siguiente paso. Tomamos la siguiente URL como base y agregamos el id de la cuenta de Google Reader:
Google Reader – Google[Tu ID de Google Reader]/state/com.google/starred?n=1000
Ingresamos la URL base modificada con la ID en nuestro navegador y obtendremos algo como esto:
recuperando articulos en XML
Se guarda la pagina a la que se accedió (ctrl + S o ctrl + G dependiendo del idioma de su SO), esta se guardara con extensión .XML con el nombre destacados o starred (dependiendo el idioma). Como les decía en algunos párrafos atrás, Google Reader solo devuelve un máximo de 1000 elementos y eso es precisamente lo que hay en el archivo que se guardo. Si unicamente quieren guardar menos 1000 artículos, sáltense el siguiente paso.
En la pagina a la que accedimos, busquen el código que se encuentra entre:< gr:continuation> xxxxxxxx < /gr:continuation>. Para mi caso es el siguiente (ver imagen de arriba):
< gr:continuation>CKvLvMq_6rAC< /gr:continuation>
Se copia el código marcado en negritas y se agrega al final de la URL que se uso atrás, quedando así:
http://www.google.com/reader/public...tate/com.google/starred?n=1000&c=CKvLvMq_6rAC
Se guarda la pagina a la que se accedió, y se creara un archivo .XML.
Como importar los archivos Atom (.XML) a WordPress
El siguiente y ultimo paso es convertir esos ficheros Atom (.XML) a otro tipo que WordPress pueda leer. Hay varias opciones para convertir archivos .XML entre las cuales están:
El ultimo método fue el que use y que encontré en el blog de Sergio Molina. Cuando ya estén descargadas las dos utilidades, se procede a colocarlas en una carpeta junto a los archivos Atom (.XML) descargados de Google Reader.
Se abre la consola de comandos y se mueven entre las carpetas hasta donde tienen las dos aplicaciones y los archivos .XML:
Una vez en la carpeta donde todo esta guardado, ejecutan estos comandos para correr las dos aplicaciones y convertir los archivos:
Repetimos el paso de arriba para cada archivo que se haya descargado de Google Reader. En este caso starred1.xml es el archivo original que sera convertido a uno .rss que llamare starred1.rss.
Después de ejecutar los comandos el resultado final sera:
Ya con los archivos .rss, se continua con el ultimo paso, importarlos a WordPress. WordPress tiene un limite de peso para los archivos que se importan. Si sus ficheros son demasiado pesados, Sergio Molina explica como partirlos para que puedan pasar la limitacion de peso de WordPress.
Teniendo en cuenta lo indicado arriba con respecto al peso y con los archivos listos, se van al Dashboard -> Tools -> Import y seleccionan RSS (instalan el plugin, si no lo esta) . Suben el archivo .rss y esto sera lo que verán:
En mi caso la herramienta de WordPress no tuvo ningun problema en importar mis posts perdidos:
Los resultados fueron evidentes desde el primer momento:
Antes
Después
Tras la importacion satisfactoria de los mas de 1000 artículos perdidos, unicamente tuve como inconveniente que, las etiquetas se convirtieron en categorias. Y es que ahora tengo mas de ¡1,600 categorias!. Tendré que empezar a borrar ¡desde ya!. Algo que no me parece tan mal, comparado con la idea de copiar y pegar manualmente cada articulo perdido.
Espero les haya servido este articulo/tutorial. Recuerden,¡respalden sus archivos, siempre!. No querran que les pase igual que a nosotros y si les pasa con su blog, ya conocen algunos métodos para recuperar sus artículos.
Por la cantidad de imágenes que tiene el tutorial solo copie y pegue del blog, si quieren verlo con las imágenes ilustrativas y detalles en el texto.
Fuente: Como recuperar artículos perdidos de WordPress utilizando Google Reader como respaldo de seguridad
Sin embargo, la realidad es otra. Perdimos posiciones en Google y por ende, trafico. Lo que me hizo darme cuenta de esto o mas bien, quien me hizo darme cuenta de esto fue Enlace eliminado, un SEO que conoce del tema y que me esta sacando de la ignorancia en cuanto a posicionamiento se refiere. El me señalo la importancia de corregir ese montón de enlaces perdidos y que Google reconoce como error 404 (no encontrado).
Publicando de dos a tres entradas diarias, seria como 730 artículos anuales. En 1 año y 7 meses seria aproximadamente 1150 artículos. La primer pregunta que me hice es, ¿como recupero tal cantidad de artículos?. Cuando la información se perdió, el proveedor del host no tenia ningún respaldo (nunca sean tan ingenuos en confiar todo al proveedor). Busque alternativas para recuperar la información perdida. Y entre las opciones para recuperar información de un website, como artículos perdidos de este, encontré:
- Buscar los artículos en Google y luego utilizar el caché de Google para recuperarlos.
- Buscar en WayBack Machine.
- Utilizar Warrick. De momento no esta funcionando ante la carga de trabajo de sus creadores, y es que han tenido bastantes solicitudes de restauración de websites.
Las dos primeras opciones se pueden utilizar cuando se tiene poco contenido, debido a que ambas exigen que se copie y pegue el contenido manualmente. La tercera opción es la mas viable; sin embargo, ante tanta demanda, en Warrick temporalmente no están atendiendo solicitudes. Me estaba quedando sin posibilidades de recuperar todo el contenido perdido de una sola vez.
Empece a considerar el copiar y pegar manualmente cada articulo. Copie unos treinta y de ahí no resistí mas. Busque y busque en Google una solución mas eficaz y eficiente, hasta que encontré varias formas de recuperar el contenido perdido. Las diferentes opciones giraban entorno a utilizar Feedburner y Google Reader para recuperar los artículos.
Si han estado distribuyendo sus artículos a sus lectores a través de una fuente RSS, hay una buena noticia y es que se puede, por medio de Feedburner y Google Reader, empezar a desplazarse a través del Feed del blog y llegar hasta los artículos mas antiguos y por ende, ¡recuperarlos!. Se puede recuperar las entradas de los blog individualmente o en masa de Google Reader.
En mi caso, al tener tanta cantidad de contenido perdido, me fui por la opción de recuperar todo en masa. Tras buscar en foros de ayuda y blogs, encontré un par de alternativas a mi dilema. Primero tenia que encontrar una forma de poder exportar solo el contenido que me interesaba restaurar. Para eso lo que hice fue:
Destacar los artículos a exportar:
Google Reader destacar articulos a recuperar
Lo siguiente es saber como importar estos artículos. Con el cambio de interfaz de Google Reader, también vino la posibilidad de exportar los artículos destacados y/o compartidos en JSON. En Google Reader se van a configuraciones (el icono en forma de tuerca) y seleccionan la pestaña importar/exportar y tendran un archivo .JSON.
1. Convertir JSON a WXR (.xml) para importar a WordPress
El inconveniente es que WordPress no importa archivos JSON. Me di a la tarea de buscar un convertidor de JSON a WXR (.xml). Encontré un convertidor de JSON a .XML. Es un script en PHP que tras correrlo en localhost, no me funciono:
Google Reader to WordPressConvirtió unos pocos artículos hasta que apareció un error. Como se espera, el archivo convertido no pudo ser importado por WordPress. Me toco que buscar otra alternativa para importar el contenido de Google Reader a WordPress.
2. Exportar elementos destacados de Google Reader en Atom (.XML) para convertir en archivos .RSS aceptados por WordPress
En un grupo de Google, encontré lo que requería. Un usuario de Google Reader comentaba como hizo para exportar los artículos destacados en .XML. Lo que el hizo fue descargar los elementos destacados por partes, debido a que Google Reader no permite descargar mas de 1000 elementos de una vez. Google Reader solo devuelve las ultimas 1000 entradas destacadas, por lo que es necesario descargar por partes los elementos destacados cuando son mas de 1000.
Primero es necesario identificar nuestro id de Google. Para hacer eso hay que dar clic en todos los elementos en Google Reader y copiar la URL:
google reader id
En la URL copiada se encuentra el id de Google. Para identificar el id hay que hacer lo siguiente. Tomamos la URL:
Google Reader – Google
Se descompone la URL para encontrar el id, el cual esta después de user%2F y antes de %2Fstate. El id de la cuenta de Google Reader es de 20 digitos:
Google Reader – Google
02284805872778321574 <— ID de Google Reader
%2Fstate%2Fcom.google%2Freading-list
Teniendo el id de nuestra cuenta de Google Reader identificado, procedemos al siguiente paso. Tomamos la siguiente URL como base y agregamos el id de la cuenta de Google Reader:
Google Reader – Google[Tu ID de Google Reader]/state/com.google/starred?n=1000
Ingresamos la URL base modificada con la ID en nuestro navegador y obtendremos algo como esto:
recuperando articulos en XML
Se guarda la pagina a la que se accedió (ctrl + S o ctrl + G dependiendo del idioma de su SO), esta se guardara con extensión .XML con el nombre destacados o starred (dependiendo el idioma). Como les decía en algunos párrafos atrás, Google Reader solo devuelve un máximo de 1000 elementos y eso es precisamente lo que hay en el archivo que se guardo. Si unicamente quieren guardar menos 1000 artículos, sáltense el siguiente paso.
En la pagina a la que accedimos, busquen el código que se encuentra entre:< gr:continuation> xxxxxxxx < /gr:continuation>. Para mi caso es el siguiente (ver imagen de arriba):
< gr:continuation>CKvLvMq_6rAC< /gr:continuation>
Se copia el código marcado en negritas y se agrega al final de la URL que se uso atrás, quedando así:
http://www.google.com/reader/public...tate/com.google/starred?n=1000&c=CKvLvMq_6rAC
Se guarda la pagina a la que se accedió, y se creara un archivo .XML.
Como importar los archivos Atom (.XML) a WordPress
El siguiente y ultimo paso es convertir esos ficheros Atom (.XML) a otro tipo que WordPress pueda leer. Hay varias opciones para convertir archivos .XML entre las cuales están:
- Blogger2wordpres es una aplicación en-linea que corre sobre la App Engine de Google y que permite convertir archivos exportados de Blogger (.XML que son el tipo que obtuvimos) en el formato WXR de WordPress.
- Si usan Linux o Mac OS X, pueden utilizar este script en Python desarrollado por Stefan Wehrmeyer. Este script convierte de Atom (.XML) a WordPress eXtended RSS (formato WXR de WordPress)
- Convertir los archivos Atom que descargamos a RSS, con las aplicaciones: Atom conversion tools (atom2rss.xsl), y la Command Line Transformation Utility (archivo msxsl.exe) de Microsoft. Este ultimo método funciona solo desde Windows o maquina virtual con Windows.
El ultimo método fue el que use y que encontré en el blog de Sergio Molina. Cuando ya estén descargadas las dos utilidades, se procede a colocarlas en una carpeta junto a los archivos Atom (.XML) descargados de Google Reader.
Se abre la consola de comandos y se mueven entre las carpetas hasta donde tienen las dos aplicaciones y los archivos .XML:
Una vez en la carpeta donde todo esta guardado, ejecutan estos comandos para correr las dos aplicaciones y convertir los archivos:
Insertar CODE, HTML o PHP:
msxsl.exe -o starred1.rss starred1.xml atom2rss.xsl
Repetimos el paso de arriba para cada archivo que se haya descargado de Google Reader. En este caso starred1.xml es el archivo original que sera convertido a uno .rss que llamare starred1.rss.
Después de ejecutar los comandos el resultado final sera:
Ya con los archivos .rss, se continua con el ultimo paso, importarlos a WordPress. WordPress tiene un limite de peso para los archivos que se importan. Si sus ficheros son demasiado pesados, Sergio Molina explica como partirlos para que puedan pasar la limitacion de peso de WordPress.
Teniendo en cuenta lo indicado arriba con respecto al peso y con los archivos listos, se van al Dashboard -> Tools -> Import y seleccionan RSS (instalan el plugin, si no lo esta) . Suben el archivo .rss y esto sera lo que verán:
En mi caso la herramienta de WordPress no tuvo ningun problema en importar mis posts perdidos:
Los resultados fueron evidentes desde el primer momento:
Antes
Después
Tras la importacion satisfactoria de los mas de 1000 artículos perdidos, unicamente tuve como inconveniente que, las etiquetas se convirtieron en categorias. Y es que ahora tengo mas de ¡1,600 categorias!. Tendré que empezar a borrar ¡desde ya!. Algo que no me parece tan mal, comparado con la idea de copiar y pegar manualmente cada articulo perdido.
Espero les haya servido este articulo/tutorial. Recuerden,¡respalden sus archivos, siempre!. No querran que les pase igual que a nosotros y si les pasa con su blog, ya conocen algunos métodos para recuperar sus artículos.
Por la cantidad de imágenes que tiene el tutorial solo copie y pegue del blog, si quieren verlo con las imágenes ilustrativas y detalles en el texto.
Fuente: Como recuperar artículos perdidos de WordPress utilizando Google Reader como respaldo de seguridad
Última edición: