Canonical Tag – Acabe com o Conteúdo Duplicado

AutorPublicado por em 18 de fevereiro 2009

Todos já ouviram falar da última revolução entre as principais Search Engines: a Canonical Tag, ou, mais propriamente, o canonical link element. A sua estrutura também já é conhecida:

<head>

<link rel=”canonical” href=”url-canonica.html” />

</head>

O que venho trazer de novidade é um estudo mais a fundo sobre conteúdo duplicado e o uso do canonical link element para resolver esse problema.

Conteúdo Duplicado

Por definição, um conteúdo é considerado duplicado quando ele é encontrado em duas URLs distintas, por exemplo:

  • meusite.com.br/index.html
  • meusite.com.br/

Este exemplo de conteúdo duplicado é o mais comum: a maioria dos sites tem sua página inicial acessada por mais de uma URL. Em grande parte dos sites, a seguinte relação de URLs todas permitem o acesso à página inicial:

  • meusite.com.br
  • meusite.com.br/
  • www.meusite.com.br
  • www.meusite.com.br/
  • meusite.com.br/index.html
  • www.meusite.com.br/index.html
  • meusite.com.br/home.aspx
  • meusite.com.br/Home.aspx

Pois é, conseguem imaginar todas as formas de acesso à página inicial de um site? Todas representam conteúdo duplicado, sem excessão, até mesmo a simples diferença do caracter “/” já resulta em conteúdo duplicado. Entrando na área dos sites que usam variáveis de controle de sessão, o problema continua:

  • meusite.com.br/index.jsp?jsessid=141513512mOI909afe
  • meusite.com.br/index.jsp?jsessid=jjaoafsa999a8s9fyasha

Mudou apenas o valor atribuído à variável jssesid, mas isso já é suficiente para duplicar conteúdo, pois a cada novo acesso do bot de busca no site, a variável recebe um novo valor, gerando uma nova URL que possui o mesmo conteúdo que meusite.com.br/index.jsp.

Outras páginas, além da inicial, também podem ser fontes de conteúdo duplicado, por exemplo:

  • meusite.com.br/produtos.php?ver=mesa&tipo=mogno
  • meusite.com.br/produtos.php?ver=mesa&tipo=marfim

Considerando que ambas sejam a mesma mesa, mudando somente a imagem, teremos 2 URLs com 99% de conteúdo duplicado. Ainda, a inversão da ordem dos parâmetros também é fonte de conteúdo duplicado, por exemplo:

  • meusite.com.br/lugar.php?cidade=Itajuba&estado=MG
  • meusite.com.br/lugar.php?estado=MG&cidade=Itajuba

Só isso já enche um post e te dá bastante trabalho na otimização de sites, não é? Mas não acabou, vamos ao:

Canonical Link Element – Fim do Conteúdo Duplicado

Recaptulando, o canonical link é especificado da seguinte maneira:

<head>

<link rel=”canonical” href=”url-canonica.html” />

</head>

Atenção para a “/” final ao fechar a tag link, ela é importante! Vamos ver a teoria por trás deste elemento.

O canonical link tem seu funcionamento muito similar ao de um redirecionamento 301, mas é condicional: somente se a search engine considerar que a página visitada (A) e o link referenciado na tag canonical (B) são relativamente iguais é que ela vai trabalhar como um redirecionamento 301, ou seja, transferir os méritos (PageRank, inlinks, etc.) de A (duplicada) para B (versão preferencial).

Essa é a principal diferença do canonical link para o redirecionamento 301:

  • Canonical link: a search engine decide se as páginas são duplicadas e repassa parte da força para a versão preferencial;
  • Redirecionamento 301: a search engine passa parte da força de uma URL para outra incondicionalmente.

A vantagem de usar a tag link com o rel=”canonical” é que você especifica isso diretamente na página, sem se preocupar com configuração no servidor. E, na verdade, usando o canonical link, você dá uma forte dica para a search engine de qual é a URL original. Para os exemplos citados anteriormente, funciona perfeitamente:

Canonização de URL www vs. non-www vs. /  vs.  non-/

  • meusite.com.br/
  • www.meusite.com.br
  • canonical: <link rel=”canonical” href=”http://www.meusite.com.br/” />

Canonização de URL com variável de sessão:

  • meusite.com.br/index.php?jsessid=141513512mOI909afe
  • meusite.com.br/index.php?jsessid=jjaoafsa999a8s9fyasha
  • canonical: <link rel=”canonical” href=”http://www.meusite.com.br/index.php” />

Canonização de URL com um parâmetro importante e outros complementares:

  • meusite.com.br/produtos.php?ver=mesa&tipo=mogno
  • meusite.com.br/produtos.php?ver=mesa&tipo=marfim
  • canonical: <link rel=”canonical” href=”http://www.meusite.com.br/produtos.php?ver=mesa” />

Você deve utilizar o link que melhor lhe convir, estes são apenas exemplos. Existem, ainda, outras formas de indicar para a search engine qual a sua versão preferencial de URL:

  • Utilizar uma linkagem interna consistente – utilizar sempre a mesma URL nos links internos
  • Utilizar o sitemap.xml – sim, ele é um forte indicativo de qual a URL correta

Mais Detalhes Sobre Canonical Links

Este novo elemento visa ajudar os menos experientes, ou com menos prática, a resolver problemas simples de conteúdo duplicado. Usuários mais experientes não devem abandonar os outros métodos. Ainda, as search engines (Google com o sistema implementado e Live e Yahoo! ainda por vir) prometem não perdoar abusos no uso da tag.

É importante notificar que este elemento não funciona entre domínios diferentes (meusite.com.br/page1.html para outrosite.com.br/page1.html), mas funciona entre subdomínios (sub.meusite.com.br/page3.html para meusite.com.br/page3.html) e protocolos de segurança (http://meusite.com.br/login para https://meusite.com.br/login).

Por último, lembre-se que as páginas não precisam ser absolutamente idênticas para que o canonical link funcione, pequenas diferenças são ignoradas. E deixo a recomendação para que sejam sempre usados links absolutos para especificar as URLs. Mais informações você consegue com o Blog do Google, o Matt Cutts, SEOmoz e conosco: deixe um comentário! Até a próxima.

Update: O Fábio Ricotta perguntou no Grupo do Google para Ajuda à Webmasters se o correto é utilizar & ou &amp na url utilizada no href da tag link, a resposta do Pedro Dias é que deve ser utilizada a forma como se digita na barra de endereço do browser: &. Visite o tópico para mais detalhes! =)

Divulgue este artigo!




Autor Frank Marcel


Trabalha com SEO desde 2007 e foi o primeiro Analista de SEO da MestreSEO, em 2008. Em 2012, tem definido o cargo de Diretor e é firmado como o Segundo no Comando, participando ativamente junto dos fundadores da MestreSEO nas decisões da empresa e ainda com a orientação para os times de SEO, time comercial e supervisão de contas. Entre em contato no twitter: @frankmarcel; Ou no Google Plus: +Frank Marcel


120 Respostas à este post


Deixe um ComentárioDeixe um Comentário

(obrigatório)

(não será publicado)(obrigatório)


Nota: A moderação de comentários pode estar ativa, então não há necessidade de re-enviar o seu comentário.