Problemas de Conteúdo Duplicado com a Busca Interna

AutorPublicado por em 23 de fevereiro 2010

Olá leitores da MestreSEO,

Conteúdo Duplicado

Quando pensamos em otimizar um website já relacionamos uma lista de tarefas a fazer, tais como re-ajustar títulos, criar novas meta descriptions chamativas, organizar a arquitetura interna, fazer seleção de palavras-chave, pensar em idéias de linkbait, repensar e analisar os seus links externos ou ainda analisar a concorrência. Mas uma técnica pouco explorada é observar bem o comportamento da sua busca interna.

A Busca Interna

Basicamente, a busca interna do website é um recurso muito utilizado pelos usuários de um e-Commerce ou ainda um website comum para encontrar a informação que eles desejam. Através dela, o usuário espera encontrar uma informação relevante, pontual, ou no mínimo similar ao que deseja.

Pois bem, com uma busca interna bem robusta você consegue atender estes requisitos, mas estamos falando de SEO correto? E um problema bem comum quando se possui um sistema de busca interna é gerar conteúdo duplicado, ou melhor, criar páginas infinitas. Mas aí vem o seu pensamento, essas páginas indexam? Sim, se você não fizer um controle dessas páginas, você pode produzir uma página para cada termo diferente que os usuários digitarem no seu website.

Páginas Que Não Exibem Nada

Para entender o problema de conteúdo duplicado, vamos tomar como exemplo um dos maiores website de e-Commerce brasileiro: o Submarino.com.br. Com um sistema de busca incrível, o Submarino consegue encontrar em toda a sua base produtos que contenham a palavra-chave definida pelo usuário. Mas e quando ele não encontra? Um exemplo bem claro é quando pesquisamos pelo nosso termo favorito “nanuni kokoritu“.

Pesquisa Interna do Submarino

Aqui entra o trabalho de um profissional de SEO, onde você deve reparar por padrões e de posse destes padrões, você deve tentar identificar problemas na página. Alguns me chamaram a atenção:

  1. O diretório da URL de busca não é bloqueado no robots.txt, logo pode ser lida pelos mecanismos de busca;
  2. A página não possui meta noindex, logo pode ser indexada;
  3. O título se mantém o mesmo para qualquer busca não encontrada;
  4. A única porção de conteúdo que se altera é “Sua pesquisa por * encontrou nenhum resultado;

Entenda a proporção do problema: caso alguém resolva criar uma série de links para os resultados não existentes do Submarino, a quantidade de conteúdo duplicado gerado será gigantesco. Como podemos analisar, o Submarino já está com um grupo de páginas definidas como duplicadas, como podemos notar através da consulta site:http://www.submarino.com.br/busca/giro “encontrou nenhum resultado”:

Busca no Google

Qual a Solução?

Na minha visão, uma solução simples para o caso é a utilização da meta tag noindex. Com essa meta tag, o mecanismo de busca irá ler a página e não irá exibi-la nos seus resultados de busca. Você pode ainda perguntar, mas e a canonical tag, não deveria ser utilizada nesse caso? Eu lhe afirmo que não, pois nesse caso, você não possui uma “versão” ou “página” que represente a versão única do conteúdo, mas sim um grupo de páginas que existem mas são tecnicamente independentes.

Conclusão

O problema aqui relatado partiu de um problema que encontramos em um dos nossos clientes de consultoria em SEO, mostrando que isso realmente acontece no mundo real e não apenas em teoria. Entender todo o funcionamento interno de um website ou e-Commerce é fundamental para que você não seja surpreendido com problemas de conteúdo duplicado.

Espero que vocês tenham gostado desse artigo e até a próxima!

Crédito da Imagem: (cc) where are the joneses’

Divulgue este artigo!




Autor Fábio Ricotta


Bacharel em Ciência da Computação pela Universidade Federal de Itajubá, é Co-Fundador da MestreSEO e trabalha em otimização de sites desde 2005. Me siga no Twitter, no Facebook, Google+ ou ainda visite o meu blog de SEO.


16 Respostas à este post


Deixe um ComentárioDeixe um Comentário

(obrigatório)

(não será publicado)(obrigatório)


Nota: A moderação de comentários pode estar ativa, então não há necessidade de re-enviar o seu comentário.