Como todos sabemos, google hace muchas de sus cosas arbitrariamente sin dar explicaciones ya que es el rey monopolico de internet. No se sabe exactamente como calcula el pagerank, no se sabe bien que parametros usa para penalizar una web o dar de baja una cuenta adsense. Si buscas un tutorial redactado por el mismo google en el cual te diga asi es duplicado, asi no, seguramente no lo encontraras. Todas las penalizaciones se "infieren" a partir de algunas pistas como las que te dan en el post que deje el link anteriormente.
El procedimiento de google seria mas o menos asi:
Google saca como unas radiografias de las webs donde aparte de ver formato (codigo fuente), texto y otras cosas, se guarda la fecha de indexacion. Por ende todo el contenido igual indexado en otros sitios con posterioridad a esa fecha lo toma como duplicado.
Tener algo de contenido duplicado en un sitio no deviene en una penalizacion sistematicamente, ya que es normal que los usuarios copien y peguen cosas de otras webs. Citando la fuente no habria problemas.
El problema empieza cuando se usa alguna herramienta duplicadora (como los feeds rss de vbulletin), la cual pone miles de post clonados. Si tienes el 30% de tu sitio clonado de otras webs ya puede ser un problema en cualquier momento.
Puede pasar que en foros nuevos o mal posicionados esto tarde mucho mas en ser notado por google, ya que como todos sabemos, intensifica mas los escaneos sobre sitios top que sobre sitios con poca relevancia.
De lo dicho anteriormente podemos darnos cuenta rapidamente que es muy factible que durante un tiempo no tengamos problemas y despues sin haber hecho nada nuevo aparezcan las penalizaciones de golpe (google se dio cuenta)
Esto tambien se aplica a la publicidad adsense, al principio webmasters usan warez y tambien tienen google adsense en la misma pagina donde ponen el contenido. Al cabo de trabajar 8 o 9 meses le dan de baja la cuenta sin explicacion y van a todos los portales a quejarse del bendito google, que no hicieron nada nuevo y ahora se ensañaron con ellos.
Simplemente fue que antes no facturaban lo necesario para que google los controle con el ojo mas fino, y despues cuando crecieron recibieron la cancelacion de la cuenta.
Resumiendo, hay cuestiones que sabemos de entrada que no se pueden hacer, no esperemos a tener una penalizacion o una baja de cuenta para empezar a hacer algo.
Googles es como la humedad, parece que se va y no esta pero siempre vuelve a aparecer por algun lado ^^
Nota: las penalizaciones no siempre son totales, pueden ser solo parte de un sitio web donde esta el contenido duplicado y parte no, haciendo mucho mas dificil detectarlo hasta que no se sufre una penalizacion total.