
Conteúdo Duplicado - Punição ou não?
Publicado por Frank Marcel em 16 de Junho 2008 | Categoria: Conteudo DuplicadoRecentemente tenho lido diversos posts em blogs do google, em especial o Google Webmaster Central Blog, e alguns outros blogs de SEO tratando do seguinte tema: conteúdo duplicado.
Aqui no blog da MestreSEO nós já tratamos do tema em alguns posts sobre casos e soluções de conteúdo duplicado, como evitar conteúdo duplicado com robots.txt, como identificar e corrigir conteúdo duplicado e um post ilustrado explicando como uma search engine identifica o conteúdo original.
O que nós ainda não falamos por aqui é uma questão relativamente subjetiva:
Conteúdo Duplicado: É Punição ou Não?
Na semana passada, estivemos discutindo sobre conteúdo duplicado aqui na MestreSEO e se este filtro seria uma punição ou simplesmente um filtro. Neste post eu trago as minhas impressões e conclusões.
Primeiro de tudo, no caso mais geral, quando uma página da web cai no filtro de conteúdo duplicado ela é colocada nos resultados similares (ou suplementares) do Google e não aparece no Ãndice principal da busca, esta página somente seria acessada no link da mensagem:
Para mostrar os resultados mais relevantes, omitimos algumas entradas bastante semelhantes a 57 já exibidas.
Se quiser, você pode repetir a consulta, incluindo os resultados omitidos.
quando a mensagem aparece.
Conteúdo duplicado tem certa semelhança com indexação de conteúdo em flash. Como o Google não entende corretamente sites que são feitos inteiramente em flash, ele também não rankeia corretamente esses sites. Ele não aplica uma punição a esses sites, ele simplesmente não entende. No caso de conteúdo duplicado, o Google também não pune o site, ele simplesmente não repete na sua busca uma informação que já está lá - Isso seria bem chato.
Punição
Uma punição acontece quando um site que anteriormente possuia um bom posicionamento, comete algum erro (leia-se: webspam, técnicas black hat, link farm, …) e sofre o que o Google chama de “Ranking adjustment” (ajustes no ranking) - uma punição. Enquanto conteúdo duplicado simplesmente não é rankeado.
Um site que publique conteúdo duplicado não recebe punição. O site pode ser relevante, possuir conteúdo original (nem tudo precisa ser duplicado), não usar nenhuma técnica black hat e ainda assim, se lançar uma página que contenha conteúdo duplicado, não aparecer em uma busca pelo tema desta página, pois, obviamente, alguma outra página com a mesma informação (texto idêntico) já está rankeando, não faz sentido mostrar as duas.
Conteúdo Duplicado
O que pode levar alguém a acreditar que conteúdo duplicado seja de fato uma punição é a sensação que o dono de tal página fica em relação à sensação de ter uma página penalizada, ou seja, tanto para uma página penalizada, quanto para uma página filtrada por conteúdo duplicado, as visitas não vêm com tanta intensidade e a página não aparece no topo das buscas. Qual a diferença então?
Conteúdo Duplicado Não é Punição
Uma razão, entre outras, pela qual eu não considero que conteúdo duplicado seja uma punição é o que a Vanessa Fox (ex-Google, desenvolvedora do Webmasters Central) cita em um post do Blog do Webmasters Central:
“Bear in mind that you can add the “&filter=0″ parameter to the end of a Google web search URL to see additional results which might be similar.”
Tenha em mente que você pode adicionar ao final de uma URL de busca do Google o parâmetro ‘&filter=0′ para ver resultados adicionais que podem ser similares
Ou seja, usando este parâmetro, os resultados que foram considerados duplicados aparecem nas buscas. Contudo, não existe um parâmetro “&filter=-30″ para que sejam mostrados os resultados que foram penalizados no seu posicionamento anterior à punição.
Outro ponto interessante é o citado no post Duplicate Content Due to Scrapers, por
O Google, de certa forma, admite a falha e Sven Naumann escreveu que simplesmente existir uma cópia de um conteúdo não implica em uma violação de webmaster guidelines proposta pelo Google, e que casos assim requerem mais avaliação para definir qual realmente é o original:
“… identical content showing up on several sites in itself is not inherently regarded as a violation of our webmaster guidelines. This simply leads to further processes with the intent of determining the original source of the content.”
Neste mesmo post, ele também afirma que conteúdo duplicado somente é uma quebra das guidelines do Google se ficar caracterizada a intenção de causar algum prejuÃzo ou conseguir benefÃcios através do conteúdo que foi roubado, o que de fato pode levar a uma punição:
“Only when there are signals pointing to deliberate and malicious intent, occurrences of duplicate content might be considered a violation of the webmaster guidelines.”
Sim, punição sim, neste caso, pois o Google realizaria o seu “Ranking Adjustment”. Mas no caso geral, não se trata de punição.
Conteúdo Duplicado, Spam e Punição
Lançar conteúdo duplicado e não conseguir um bom ranking é a mesma coisa de lançar site spam e não rankear, ou seja, o site não será punido, pois o site nem sequer será indexado ou rankeado receberá um bom ranking (posicionamento) para ser punido. Já nasceu errado. O webmaster que copiou o conteúdo ou lançou um site spam terá sensação de estar punido, mas o google não fez isso, o webmaster é quem fez - lançou um site de baixa qualidade e não está rankeado. Melhore a qualidade do site e bons rankings virão em seguida.
Deixe a sua opinião nos comentários! Abraços e até a próxima!
Sugerimos a leitura destes outros artigos...
- O que Não é Conteúdo Duplicado
- Casos e soluções de conteúdo duplicado
- Encontre Conteúdo Duplicado Com o Google
- Conteúdo Duplicado - E agora?
- Evitando o Conteúdo Duplicado Acidental






16 de Junho de 2008 às 8:23 am
Eu concordo que conteúdo duplicado não chega a ser uma punição do Google mas discordo (ou não compreendi direito) quando você diz que o Google simplesmente não adiciona oa indice pois não faz sentido já que ele já possui o mesmo conteúdo.
Ficou parecendo, pra mim, que os robôs do google ao encontrar uma página varrem suas bases para ver se o conteúdo já existe por lá e caso sim joga a página duplicada no sumplemental index. Se isso for verdadeiro como explicariamos páginas com conteúdo duplicado que normalmente aparecem melhor posicionadas que o conteúdo original?
Se fosse desta forma (se o google levasse em conta apenas a data do conteúdo assumindo que o primeiro é o original e jogando o outro para o conteúdo supolementar) não seria possivel que páginas como Rec6 por exemplo aparecessem primeiro que o conteúdo original nos resultados do google a não ser que fosse indexada primeiro pelo robô. O que não é verdade pois já passei por casos onde só cadastrei o texto no rec6 depois de ter o conteúdo original indexado e posicionado pelo google e foi só a cópia indexar para tomar posição.
Acredito que outros fatores são observados e que o google não trata o conteúdo duplicado de forma tão simples (já temos isso na base, manda este pro suplemental).
16 de Junho de 2008 às 9:11 am
E aà Leo! Frente ao seu comentário, resolvi me expressar melhor ali no final do post. Veja se ficou melhor.
O que você disse é exatamente o que eu apontei ali nas palavras do Sven Naumann e que eu acho que seja justo mesmo.
O Google, ao encontrar conteúdo duplicado, “nem sequer rankeia” (não dá um bom raking - posicionamento) para tal duplicata. No princÃpio, é isso que ele faz sim. Contudo, como o Sven Naumann fez a ressalva, conteúdo duplicado leva o Google a maiores avaliações para definir o original.
Veja bem, o caso geral que eu cito tanto de conteúdo duplicado é: Existe um conteúdo, ele já é tido como original e é mesmo o original. Alguém copia e lança.
Casos particulares como o seu (e outros que eu também li a respeito), demandam até mesmo um pedido de consideração ao Google, quando então ele avalia melhor as páginas envolvidas.
Mas acho que a minha alteração no texto ali já esclarece a questão. =)
Por fim, a idéia que eu pretendi passar, compreende também o fato de que punição implica em perda de ranking quando a página tem ranking a perder. Se a página não tem ranking, ela não é punida, pois ela nem sequer “estava rankeada” (não tinha um bom posionamento/ranking) para ser punida.
Casos como o seu são na verdade uma falha do Google, e Sven Naumann assume essa falha.
Concordamos agora? =)
16 de Junho de 2008 às 12:10 pm
Como suspeitei na verdade o problema foi de entendimento.
Veja se concorda, sendo o REC6 e os diggs em sà um sistema que simplesmente duplica conteúdo nõa deveria nunca aparecer na frente do conteúdo original nas buscas do Google. Teoricamente, porém na pratica não é bem assim que funciona.
16 de Junho de 2008 às 1:13 pm
Então Leo, a princÃpio, o rec6 e os demais nem tem o conteúdo todo pra sequer aparecer na frente do post em si. O que pesa aà é mesmo o valor do domÃnio e, no caso do rec6 pelo menos, os relacionados que eles citam fazer enriquecer a página do seu post.
Mas é isso mesmo. Não fosse pelo domÃnio e confiança desses sistemas, os que tem a confiança do Google pelo menos, eles não apareceriam. Mas embora eles apareçam na frente, o tráfego acaba indo todo para o post original porque eles não publicam o conteúdo inteiro, somente tÃtulo e descrição, nem vem a ser conteúdo duplicado propriamente.
Pelo menos as descrições que eu uso não contêm partes do texto.
17 de Junho de 2008 às 8:50 am
Olá Frank.
Um site com vários idiomas é considerado conteúdo duplicado, ou seja, mesmo conteúdo porém em idiomas diferentes.
17 de Junho de 2008 às 1:49 pm
Olá Luis!
Essa é uma questão bem controversa, especialmente, porque passsa por outros fatores como localização do site e TLD do site, ou seja, em que paÃs está o servidor do seu site e qual o formato do domÃnio (.com, .com.br, .co.uk, etc).
De modo geral, a resposta é não. Mesmo conteúdo em diferentes idiomas dificilmente implica em conteúdo duplicado quando o site está hospedado no paÃs que fala tal idioma, possui a TLD correta (dominio.com.br no Brasil, dominio.fr na França, dominio.de na Alemanha, etc). Isso não só não implica em conteúdo duplicado como torna o GeoTargeting e IP Delivery menos conflitante com as guidelines do Google.
Quando são usadas
dominio.com, dominio.com/br, dominio.com/fr (pastas)
ou
dominio.com, br.dominio.com, de.dominio.com, es.dominio.com (subdomÃnios)
o Google já sofre um pouco mais para entender… não é muito bom arriscar.
Seguidos alguns cuidados, diferentes idiomas para um mesmo conteúdo não costuma implicar em conteúdo duplicado.
Esclareci? Criei mais dúvidas??
Abraços!
E obrigado pela participação!
18 de Junho de 2008 às 8:05 am
Olá Frank.
Então, a situação é a seguinte: Eu tenho um blog ( http://www.evangelizacao.blog.br ) e pretendo criar nele pelo menos uma página em cada idioma. Na verdade vou pegar uma página (não o site todo) e fazer versões em vários idiomas. porém, tudo vai ficar hospedado no mesmo domÃnio.
O que você acha disso?
20 de Junho de 2008 às 4:54 pm
Olha Luis, para ficar dentro das guidelines do Google, vc pode usar o geotargeting ou ip delivery para mostrar conteúdos diferentes a partir de uma mesma URL. O Google afirma que isso não fere suas guidelines, desde q o googlebot receba o mesmo conteúdo que uma pessoa receberia partindo do mesmo IP de origem. Mas é um tanto quanto arriscado.
Uma alternativa é colocar nofollow nas páginas q são copiadas.
Agora, se vc pretende rankear uma página em cada lÃngua, trabalhe de forma que o google identifique a lÃngua corretamente.
Na Espanha, México, Argentina, …, rankeie a versão em espanhol e se for acontecer filtro para conteúdo duplicado, que sejam as lÃnguas estrangeiras ao paÃs.
No Brasil, rankeie a página em português corretamente, e que as outras caiam em conteúdo duplicado.
Etc.
Trabalhando corretamente com dedicação é possÃvel rankear uma página em cada lÃngua, mas seria mais fácil hospedando em locais apropriados.
Abraços!
27 de Junho de 2008 às 2:34 pm
Oi andei analizando meu site na ferramenta do google e diz que tem conteudo duplicado que é referente ao titulo e as tags que sao as mesmas para todas as paginas, como eu resolvo esse problema?
28 de Junho de 2008 às 10:57 am
Olá Diego!
A resposta para a sua pergunta embora simples e óbvia, é a resposta exata para o seu problema: altere todos os tÃtulos e tags das suas páginas para que nenhuma seja igual a outra.
Por que fazer isso? Suas páginas não devem ser todas sobre o mesmo assunto, correto? Não são todas com o mesmo conteúdo dentro delas. Para que o visitante do seu site, seja um bot (Google, Yahoo, etc.) ou uma pessoa, entenda qual o tema de cada página, dê um tÃtulo para cada uma referente ao assunto.
O Blog de SEO do MestreSEO é um blog sobre SEO, mas nem por isso todas as páginas e posts têm o tÃtulo “Blog de SEO” porque cada um trata de um assunto diferente dentro do SEO. E esse assunto diferente, ou abordagem diferente sobre um assunto, é que vai para o tÃtulo e tags de cada página/post.
Assim, fica bem claro sobre o que cada página é. Pode ser trabalhoso mudar todos tÃtulos e tags, mas tenha certeza de que vale a pena!
Abraços!
02 de Julho de 2008 às 8:37 pm
Dúvida:
Como funciona o lance de uma mesma notÃcia espalhada por diversos portais (uol, terra ig…)?
Todos colocam a mesma noticias e no final o crédito para o autor, porém o Google não sabe que está notÃcia esta sendo apenas compartilhada e por isso não deve fazer punições (pelo menos na minha opinião).
Eu sei que se eu quiser colocar uma notÃcia no meu site e não ser considerado como duplicado tenho que escrever com as minhas próprias palavras, mas como saberei o quanto terei que modificar o texto original para não ser considerado página duplicada?????
O google leva em consideração o restante do site (menus, topo, rodape, bannes) para decidir se a página é duplicada?
18 de Julho de 2008 às 3:44 pm
Mesmo existindo 2 links praticamente iguais em paginas do mesmo site,sejão eles em fotos os em textos?Não resultará numa punição do ggogle?
18 de Julho de 2008 às 4:23 pm
Demétrios: você chegou exatamente no cerne da discussão - Nem sempre conteúdo duplicado resulta em punição. Este caso dos portais de notÃcia é um exemplo - Não faz sentido punir, mas também não faz sentido exibir, no resultado de uma pesquisa, a mesma notÃcia 10 vezes. Quem publicar primeiro leva, o resto vai pros resultados otimidos.
2ª pergunta: a questão é ser original - reescrever um conteúdo também é de certa forma copiar. Ao invés de copiar, escreva um pequeno sumário da notÃcia, dê uma opinião se for o caso, e faça o link para o original - a opinião vai fazer com que seus visitantes voltem mais vezes, além de buscar informação.
brasilportais - você misturou um bocado de idéias diferentes nessa sua pergunta. O que resulta em punição do Google é toda forma de black hat, spam e tentativa de manipulação agressiva dos resultados de pesquisa.
21 de Julho de 2008 às 10:03 am
Olá Frank!
Estou com dúvidas com metas duplicadas, tenho dois blogs no blogguer, em ambos coloquei a meta descrption, só que o google começou a considerar metas duplicadas em um deles, troquei a descrição e começou a duplicar, retirei a meta, e o google parou de indexar.
Enquanto o outro blog que tem meta description está com boas visitas o google nem publica sua descrição.
obs:Ambos estão com os códigos iguais.
Agradeço a ajuda!
21 de Julho de 2008 às 6:46 pm
E aà Derleit!
Eu tenho um blog no blogger também, e minha principal recomendação é: não use o blogger! =)
sério..
Bom, eu não sei bem como você está trabalhando as meta description, mas até onde eu sei, o blogger não permite que sejam adicionadas meta descriptions individuais por post, apenas uma que se repetiria em todos os posts e na página inicial, portanto, o jeito de não ter meta duplicadas no blogger, é não ter meta informação, ou ralar bastante no código pra aparecer a meta certa no post certo, o que eu acho que não vale a pena.
Você tirou a meta e o google parou de indexar o blog? Isso é muito estranho. Se o blog for muito novo, pode ser que ele esteja no chamado sandbox, basta fazer um bom trabalho e limpo (sem black hat e spam) e aguardar.
Mas o melhor mesmo é procurar uma plataforma melhor para blogs…
Abraços!