Conteúdo Duplicado - Casos e Soluções
Olá leitores da MestreSEO,
A web é um conglomerado de informação, interconectado, e que em muitas vezes é repete-se como se fosse uma xerox de um livro. Pois bem, quando se encontram páginas em URLs (endereços) diferentes que possuem o mesmo conteúdo, diz-se, popularmente, que você encontrou um conteúdo duplicado.
O trabalho dos mecanismos de busca, tais como Google, Yahoo e MSN, é indexar todo o tipo de informação, tornando-a acessível através de seus websites de busca, mas e quando eles se deparam com a mesma “página” de um livro várias vezes? Neste caso, eles aplicam algortimos para eliminar duplicadas, limpando o seu índice de busca de resultados repetidos.
Meu site possui conteúdo duplicado?
Uma das maiores dúvidas quando você ler este artigo é “Meu site possuí conteúdo duplicado?”. Esta dúvida assola grande parte dos desenvolvedores web e profissionais de SEO pois detectar conteúdo duplicado não é uma tarefa simples, mas também não é impossível. Vejamos alguns casos clássicos, que cobrem cerca de 90% dos problemas de conteúdo duplicado:
Múltiplos Domínios - O mesmo conteúdo
Em seu artigo mais recente, Pedro Dias, chefe do time do Google de Webspam da língua portuguesa, ilustrou dois casos muito interessantes. Os casos são de dois bancos que compraram diversos domínios, com a provável idéia de se proteger a sua marca, e ao acessar as suas URLs, você se deparava sempre com o mesmo conteúdo. Por exemplo, você pode acessar qualquer URL abaixo que encontrará o mesmo conteúdo:
http://www.millenniumbcp.pt/
http://www.bpatlantico.pt/
http://www.cidadebcp.pt/
http://www.bcp.pt/
http://www.banco-comercial-portugues.org/
http://www.banco-portugues-atlantico.info/
Este controle de domínios ilustrado no exemplo é completamente errado pois os usuários podem se confundir na hora de acessar o site do banco, além de criarem uma linkagem cada vez para um dos domínios, assim, os mecanismos de busca identificam todos os domínios como concorrentes, prejudicando a sua aparição nos resultados da busca.
A solução para este problema é simples: basta adicionar um redirecionamento 301 de todos os domínios para apenas um, assim ao acessar as URLs, o usuário e conseqüentemente todo o link juice será direcionado para o domínio correto.
Domínios com www vs Domínios sem www
Este é um dos casos mais comuns de problemas com conteúdo duplicado. Faça v0cê o teste: tente acessar o seu domínio com e sem www na URL. Se você obtiver o mesmo conteúdo com as URLs diferentes então você corre o risco de estar com uma grande quantidade de conteúdo duplicado.
Isto acontece pois alguns usuários podem linkar para suas páginas com a URL meusite.com/pagina.html e outros podem linkar para suas páginas com a URL www.meusite.com/pagina.html. Qual é a correta?
Os mecanismos de busca identificam estas páginas como diferentes e assim decidem escolher uma das duas como o conteúdo original.
Para solucionar este problema, utilize-se novamente do redirecionamento 301, fazendo com que ao acessar o seu website, todas as páginas sejam direcionadas com OU sem www. É importante escolher apenas um modo.
Páginas com URLs diferentes mas conteúdo igual
Este tipo de problema é muito comum em sites de ecommerce, onde consegue-se acessar duas páginas que possuem o mesmo conteúdo, através de caminhos diferentes. Por exemplo:
Página Inicial > Televisores > 42″ > LG
Página Inicial > Televisores > LG > 42″
Imagine que fazendo os caminhos ilustrados acima, produzam as seguintes URLs:
http://www.meusite.com/televisores/42/LG
http://www.meusite.com/televisores/LG/42
Desta forma, podemos acessar o mesmo conteúdo através de duas URLs distintas, resultando em um conteúdo duplicado. O correto neste caso é fazer uso da Canonical Tag, que garante que os mecanismos de busca não irá caracterizar as duas páginas como iguais, mas sim identificar apenas uma como sendo o conteúdo original.
Títulos e Meta Tags duplicadas
Páginas com title tags e meta description idênticas, fato que além de poder ser interpretado como conteúdo duplicado também pode gerar competição desnecessária entre páginas de conteúdo diferente.
O Google possui uma área no Google Webmaster Tools que mostra os problemas com títulos e meta descriptions duplicadas. Para acessar esta área siga o caminho:

Nesta área o Google mostra a quantidade de meta descriptions duplicadas, além de mostrar quais são estas páginas. O mesmo é válido para títulos, onde ele indica ainda se existem títulos longos de mais.
Ferramentas úteis para detectar conteúdo duplicado
Existem algumas boas ferramentas gratuitas, que podem ajudar a identificar se o seu site tem conteúdo duplicado:
1. Duplicate content tool: uma ferramenta gratuita bastando se cadastrar e usar. Com ela é possível determinar:
- A existência de versões com www e sem www da sua página;
- Verificar o cache do Google;
- Verificar o nível de similaridade entre as páginas do seu site;
- Checagem da dispersão do Pagerank ( se versões com www e sem www das suas páginas caso existam contém diferentes PRs );
2. Xenu: Verifica o seu site e retorna uma tabela contendo todas as URLs disponíveis no seu site, tudo o que você tem que fazer é verificar as meta tags e ver se elas não estão duplicadas.
3. Google Webmaster Tools: Também pode ser usado para encontrar e identificar títulos e meta tags duplicadas.
Guia Rápido para Detectar Conteúdo Duplicado
Vimos acima como o Google Webmaster Tools pode nos ajudar com isso, mas o próprio Google também é muito útil para isso e veremos agora como utiliza-lo para verificar se você tem um problema de conteúdo duplicado.
O que faremos é simplesmente olhar no index do Google para ver está indexado, identificando o que é duplicado.
Use seu bom senso
Comece fazendo uma busca do tipo site:exemplo.com.br.
Dica: após fazer a busca, adicione &filter=0 no fim da URL que foi gerada na barra de endereço do seu navegador para que o Google não omita nenhum resultado.

Preste atenção na quantidade de páginas indexadas. Você realmente tem esse número de páginas ou o número está muito alto? Se estiver, você tem conteúdo duplicado.
Percorra os resultados
Provavelmente foi a primeira coisa que você pensou, e se ainda não fez, percorra as páginas para ver os resultados.
Procure por URLs parecidas, mal formadas, com query strings (como ?=sessionid ou ?first_page etc.), que levem a páginas idênticas. Preste mais atenção nas ultimas páginas, é lá que geralmente ficam escondidos os erros. Veja se os títulos e descrições não são os mesmos.
Verifique os resultados suspeitos
Pegue alguma query string encontrada nos resultados, por exemplo:
?atributo_valor
Será que essa string vai te causar problema? Cheque o que está indexado (página no cache do Google) para ver se há algum problema.
Mesmo que a versão sem a string apresente um conteúdo diferente, ela pode ter as mesmas meta tags e title. Ou seja, conteúdo duplicado.
Descubra quantas páginas estão duplicadas
Não é muito difícil. Utilize o modelo para fazer uma busca:
site:exemplo.com.br inurl:atributo_valor (exemplo que vimos acima)
Aqui você vai ver exatamente quais páginas duplicadas estão sendo geradas por algum atributo.
Conclusões
Cada vez mais a web cresce em conteúdo, seja em conteúdo duplicado ou em conteúdo “original”. A questão é não dar abertura para que o seu website sofra de conteúdo duplicado, dividindo todo o seu juice e fazendo com que as suas páginas concorram entre si.
Inclua no seu Checklist de SEO a verificação de conteúdo duplicado, pois isto pode fazer com que você ganhe uma melhor visibilidade.
Um abraço!








Interessante Fábio.
A pergunta que tenho pra te fazer talvez não se enquadre diretamente no conteúdo abordado, mas se puderes responder, agradeço.
Permitir que as tags (tag cloud) de um blog sejam indexadas pode me trazer algum problema? Sempre tive esta dúvida mas nunca fui atrás e acho que a oportunidade de saber chegou
Abraço
Nossa, gostei muito desse post. Foi bem útil porque várias coisas que foram tratadas eu ainda não tinha conhecimento. Como por exemplo, as ferramentas gratuitas que podemos utilizar para identificar os conteúdos duplicados.
Parabéns!
@Jackson, eu não costumo deixar a tag cloud indexar. Ela gera um enorme grupo de conteúdo duplicado. A questão é deixar as categorias em aberto e aplicar nofollow na tag cloud juntamente com as metas noindex e nofollow dentro das páginas de tag.
@Mariana, que bom que gostou! Fico muito feliz. Quaisquer sugestões de conteúdo serão bem-vindas.
Excelente texto…como sempre…eu tenho um problema grande, pois tenho que colocar várias fotos de noivas em várias páginas…cada foto uma página…mudar meta tag, e titulos de uma por uma é punk, mas pelo visto não tenho saída né?
Será que é por isso que o google, simplesmente não indexa nenhuma foto do meu site?????
O meu dominio pode se acessar com ou sem o http://www. e para adicionar o redirecionamento em apenas um, como que faço?
Fala Fábio blza?
Muito bom seu artigo, muito completo, parabéns.
Tenho uma dúvida, no caso se você ver que o seu site está mesmo com conteúdo duplicado.
Para resolver, só tirar pelo robots.txt as páginas duplicadas? Ou aguarda?
E se você estiver punido, ao corrigir o conteúdo duplicado você perde a punição?
Não tive nenhuma experiência com conteúdo dúplicado ainda, por isso tenho essas dúvidas. Valeu!
Olá Fábio, tudo bem?
Olha só, primeiro parabéns pelo texto e grato pela ajuda, já tinha lido sobre o assunto, mas não tinha conseguido entender bem, até agora!
Só uma dúvida, você sabe me dizer se o uso do canonical link que você indica no outro texto pode ser usado no blogger, se tem o mesmo resultado?
Um abraço!
Via: Master New Media
Análisei meu site, obtive muito conteúdo dúplicado por causa da tag cloud, vou seguir as suas dicas.
Dúvida: Tenho um post no blog, contendo título e um texto resumido com um link “saiba mais”, neste caso eu tenho conteúdo duplicado ? se sim, é porque ambos os links irão chegar na mesma url ?
Bom dia nu meu marca realmente que a meta tag duplicado tem algum problema eu posso perder posição por isso?