Conteúdo duplicado é algo muito comum e que muitas vezes é gerado devido a erros simples dos webmasters e profissionais de SEO. Claro existem também espertalhões que propositalmente copiam conteúdo alheio e publicam como se fosse próprio, mas esse não é o caso, nesse artigo falarei um pouco de sobre como evitar a geração de conteúdo duplicado por você mesmo, dentro do seu próprio site e de maneira não proposital.

Alguns casos em que conteúdo duplicado acidental é gerado:
- Problemas com canonização de páginas, tais como a existência e possibilidade de uso da URL com e sem o www sem redirecionamento
- Páginas com title tags e meta description idênticas, fato que além de poder ser interpretado como conteúdo duplicado também pode gerar competição desnecessária entre páginas de conteúdo diferente.
- Home page não canonizada ( exemplo.: www.seusite.com.br e www.seusite.com.br/index.php )
- Desconhecimento por parte dos desenvolvedores de sites do fato que as URLs são case sensitive ( as maiúsculas e minúsculas são levadas em conta ). As URLs, www.seusite.com.br/Carros e www.seusite.com.br/carros por exemplo embora referenciem a mesma página e sejam de um certo modo a mesma URL, para o crawler são URLs diferentes por temos “C” minúsculo e maiúsculo.
O Google vem se esforçando para desenvolver o algoritmo do Googlebot de modo que ele identifique as páginas duplicadas e indexe as páginas certas dentro do seu site, mas no entanto, sempre é bom evitar o conteúdo duplicado porque podem ocorrer os seguintes casos:
- A taxa de web crawl pode cair, o Googlebot pode perder tempo identificando ou até indexando páginas erradas e pular as páginas que deveriam realmente ser lidas.
- O Googlebot pode errar e dar uma página pior como a página oficial e a página correta como conteúdo duplicado.
Ferramentas úteis para detectar conteúdo duplicado
Existem algumas boas ferramentas gratuitas, que podem ajudar a identificar se o seu site tem conteúdo duplicado:
1. Duplicate content tool: Tool gratuita bastando se cadastrar e usar. Com ela é possivel determinar:
- A existencia de versões com www e sem www da sua Página
- Verificar o cache do Google
- Verificar o nível de similaridade entre as páginas do seu site
- Checagem da dispersão do Pagerank ( se versões com www e sem www das suas páginas caso existam contém diferentes PRs )
2. Xenu: Verifica o seu site e retorna uma tabela contendo todas as URLs disponíveis no seu site, tudo o que você tem que fazer é verificar as meta tags e ver se elas não estão duplicadas.
3. Google Webmaster Tools: Também pode ser usado para encontrar e identificar meta tags duplicadas.







06 de agosto de 2008 às 9:11 am
O que é uma homepage “canonizada”? Homepages evangélicas podem ser canonizadas? ;o)
Falando sério: sempre tive essa dúvida. No sitemap, por exemplo, qual URL devo listar? http://www.meusite.com ou http://www.meusite.com/index.php?
[Responder]
06 de agosto de 2008 às 4:24 pm
Dica muito boa, melhor ainda a ferramenta de Duplicate.
[Responder]
13 de agosto de 2008 às 8:38 am
Olá Leonardo Antoniolli bom dia
Dizer que uma URL do seu site está canonizada significa dizer que só exisite uma URL válida para aquela determinada página, ou seja, não é possivel por exemplo acessar esta página usando http://www.meusite.com ou http://www.meusite.com/index.php, apenas usando um dos dois modos.
Recomendamos que você utilize sempre a forma http://www.meusite.com.br no seu sitemap por se tratar de uma forma mais simples, prática e funcional.
[Responder]
26 de outubro de 2008 às 10:54 am
Olá Luis, tudo bem?
Bem legal a matéria. Sempre to aqui no MestreSeo aprendendo!
Ainda não achei o vídeo do “mindubim”… hehehe
Seguinte, meu site tá com esse problema de home “não-canonizada”, mesmo já tendo colocado recentemente no sitemap só a url ” http://www.meusite.com.br “. Será que o Google vai excluir a URL “http://www.meusite.com/index.php” com o tempo, ou existe outra forma de canonizar a home?
Um abraço e obrigado!
[Responder]
28 de outubro de 2008 às 1:12 pm
E aí Carlos! O mindubim vai virar folclore hehehehe
Você já viu algum destes nossos posts:
Redicionamento 301
Canonizaçao de URLs
eles explicam outros detalhes para a canonizaçao de URLs.
Abraços!
[Responder]
08 de fevereiro de 2010 às 2:37 am
Olá Frank,
Outra dúvida.
Digamos que possuo um conteúdo duplicado em:
http://www.site.com.br/exemplo.html
Ele caiu no filtro do google, passado alguns meses eu modifico o conteúdo para um original e ele passa a ter um conteúdo único.
Há chances desse caso o google indexar a página? ou terei que aplicar um novo nome para que a página seja adicionada pelo robo do google?
Agradeço
[Responder]
Frank Marcel disse,
fevereiro 11th, 2010 às 9:41 am
Você consegue que ela seja indexada na URL antiga sim. Basta conseguir novos links. Quando o Google descobrir o novo conteúdo, ele atualiza o seu índice.
[Responder]