El contenido duplicado generalmente hace referencia a bloques de contenido considerables en varios dominios que coinciden completamente o que son muy parecidos. La mayoría de las veces no se trata de un engaño. Ejemplos de contenido duplicado que no es malintencionado:
foros de debate que generan páginas estándar o simplificadas para dispositivos móviles,
elementos almacenados que se muestran o que se encuentran enlazados mediante URL diferentes,
versiones para imprimir de páginas web.
Si su sitio contiene varias páginas con contenido idéntico en gran parte, existen distintos métodos para indicar su URL preferida a Google. (A esto se le conoce como "canonicalización"). Más información sobre canonicalización
Sin embargo, en algunos casos se duplica deliberadamente el contenido en varios dominios en un intento de manipular las clasificaciones de los motores de búsqueda o para obtener un mayor volumen de tráfico. Las prácticas engañosas de este estilo constituyen una experiencia negativa para el usuario, ya que verá el mismo contenido repetido en un conjunto de resultados de búsqueda.
Google intenta por todos los medios indexar y mostrar páginas con información diferente. Al utilizar este filtro, si su sitio dispone de dos versiones de todos los artículos (una "normal" y otra "para imprimir") y ninguna de las dos está bloqueada mediante una metaetiqueta noindex, Google elegirá una de las dos versiones para mostrarla. En los contados casos en que Google detecte que se muestra contenido duplicado con la intención de manipular nuestras clasificaciones y engañar a los usuarios, también aplicará los ajustes adecuados en la indexación y clasificación de los sitios involucrados. Como consecuencia, se puede ver afectada la clasificación del sitio o puede que el sitio sea eliminado por completo del índice de Google para que deje de aparecer en los resultados de la búsqueda.
Existen algunas medidas que puede tomar para abordar por anticipado los problemas de contenido duplicado y asegurarse de que los usuarios que visiten el sitio vean el contenido que desea.
Utilice redireccionamientos 301: si ha reestructurado su sitio, utilice los redireccionamientos 301 ("RedirectPermanent") en el archivo .htaccess para redireccionar de forma inteligente tanto a los usuarios como a Googlebot y a otras arañas. En Apache, puede hacerlo mediante el archivo .htaccess, y en IIS, con la consola administrativa.
Sea coherente: procure que sus enlaces internos sean coherentes. Por ejemplo, no enlace
Enlace eliminado,
Enlace eliminado y
Enlace eliminado.
Utilice dominios de nivel superior: para ayudarnos a mostrar la versión más adecuada de un documento, utilice dominios de nivel superior para administrar el contenido específico de un país siempre que le sea posible. Es más probable que, por ejemplo, sepamos que
example.de - Ankndigung Ausstellung Oktoberfest Mnchen incluye contenido centrado en Alemania que
Enlace eliminado o
Enlace eliminado.
Distribuya el contenido con precaución: si distribuye su contenido en otros sitios, Google siempre mostrará la versión que considere más apropiada para los usuarios en una búsqueda determinada, que puede o no coincidir con la versión que prefiere. Sin embargo, resulta útil asegurarse de que cada sitio que distribuye su contenido incluya un enlace que apunte al artículo original. También puede pedir a aquellos que utilizan el material distribuido que utilicen la metaetiqueta noindex para evitar que los motores de búsqueda indexen su versión del contenido.
Utilice las Herramientas para webmasters de Google para informarnos de cómo prefiere que indexemos su sitio: puede comunicar a Google su dominio preferido (por ejemplo,
Example Web Page o
Example Web Page).
Reduzca la repetición de expresiones: por ejemplo, en vez de incluir un amplio texto sobre los derechos de autor en la parte inferior de cada página, puede incluir un breve resumen y un enlace a una página con más información. Además, puede utilizar la herramienta de organización de parámetros para especificar cómo quiere que Google trate los parámetros de URL.
Evite publicar esbozos: a los usuarios no les gusta ver páginas "vacías", por lo que debe evitar el uso de marcadores de posición siempre que sea posible. Por ejemplo, no publique páginas sin contenido. Si incluye páginas en blanco, utilice la metaetiqueta noindex para evitar que se indexen estas páginas.
Conozca el sistema de administración de contenido: asegúrese de conocer la forma en que se muestra el contenido de su sitio web. Los blogs, foros y sistemas relacionados muestran con frecuencia el mismo contenido en distintos formatos. Por ejemplo, la entrada de un blog puede aparecer en su página principal, en una página de archivo y en una página con otras entradas bajo la misma etiqueta.
Reduzca el contenido similar: si tiene muchas páginas similares, considere la posibilidad de ampliar cada página o agruparlas en una sola. Por ejemplo, si tiene un sitio para viajeros con páginas independientes sobre dos ciudades pero con la misma información, puede unir la información en una sola página o bien ampliar los datos de cada una de ellas con contenido único para cada ciudad.
Google no recomienda que bloquee el acceso de los rastreadores al contenido duplicado de su sitio web, tanto si utiliza un archivo robots.txt como si utiliza otros métodos. Si los motores de búsqueda no pueden rastrear las páginas con contenido duplicado, no podrán detectar automáticamente que las URL dirigen al mismo contenido, por lo que las tratará de forma efectiva como páginas independientes y únicas. Una solución más eficaz sería permitir que los motores de búsqueda rastreen esas URL, pero se deberían marcar como duplicadas mediante el elemento de enlace rel="canonical", la herramienta de organización de parámetros o los redireccionamientos 301. En aquellos casos en los que el contenido duplicado obligue a Google a rastrear su sitio web en exceso, puede ajustar la configuración de frecuencia de rastreo en las Herramientas para webmasters de Google.
El contenido duplicado de un sitio no implica que deban tomarse medidas al respecto a menos que aparentemente el objetivo sea engañar y manipular los resultados de los motores de búsqueda. Si su sitio tiene problemas relacionados con contenido duplicado y no sigue los consejos indicados anteriormente, conocemos muy bien la manera de elegir la versión adecuada para mostrarla en los resultados de la búsqueda.
Sin embargo, si nuestra revisión indica que ha estado involucrado en prácticas engañosas y su sitio ha sido eliminado de nuestros resultados de búsqueda, revise el sitio detenidamente. Para obtener más información sobre los motivos por los que se ha retirado su sitio de los resultados de búsqueda, consulte las directrices para webmasters. Una vez que haya realizado los cambios y esté seguro de que el sitio ya no infringe nuestras directrices, envíe una solicitud de reconsideración.
Si descubre que otro sitio duplica su contenido mediante extracción (apropiación indebida y nueva publicación), es improbable que ello influya negativamente en la clasificación de su sitio en las páginas de los resultados de búsqueda de Google. Si descubre algún caso que sea particularmente grave, presente una solicitud basada en la ley estadounidense de protección de los derechos de autor (DMCA) para reclamar la propiedad del contenido y solicitar que el otro sitio se elimine del índice de Google.