O que Não é Conteúdo Duplicado

AutorPublicado por em 23 de junho 2008

Dando continuidade ao tema Conteúdo Duplicado, neste post trago o que não é considerado conteúdo duplicado pelo Google e um pouco mais sobre a questão de ter um mesmo texto em diversos idiomas.

No meu último post sobre conteúdo duplicado: Conteúdo Duplicado: Punição ou Não?, eu apontei algumas razões pelas quais o filtro de conteúdo duplicado do Google não deve ser considerado uma punição, em especial, uma punição, ou “ajustes no ranking” como eles dizem, só é executada quando são quebradas as guidelines do Google, e, no caso geral, conteúdo duplicado não é uma quebra dessas guidelines.

Como já foi visto, também, conteúdo duplicado pode sugir tanto quando alguém copia o seu conteúdo, ou quando o próprio webmaster publica o mesmo conteúdo em mais de um lugar (Social Media), ou dentro do próprio site.

Contudo, existem alguns itens e tipos de páginas que o Google não considera como conteúdo duplicado.

The Big Google Dupe

O que não é Conteúdo Duplicado?

Muitos webmasters se preocupam com a apresentação de um mesmo texto em diversos idiomas, inclusive o Luis, que me fez uma pergunta interessante no meu post sobre a discussão se Conteúdo Duplicado é uma punição ou não. Ele pretende criar uma determinada página em mais de um idioma e ficou em dúvida se isso geraria conteúdo duplicado ou não.

Aí vem um esclarecimento do Adam Lasnik (Google’s Search Quality Team), explicando o que não é conteúdo duplicado:

Though we do offer a handy translation utility, our algorithms won’t view the same article written in English and Spanish as duplicate content. Similarly, you shouldn’t worry about occasional snippets (quotes and otherwise) being flagged as duplicate content.

Multiplos Idiomas não é Conteúdo Duplicado

Pois bem, ali está a resposta. Tipicamente o Google não considera o mesmo conteúdo em diversos idiomas dentro de um site como duplicado. Mas se você pretende lançar um site inteiro em outro idioma, é extremamente recomendado que você hospede o site no país que fala tal idioma e aplique a TLD correta (TLD – .fr para França, .com.br para o Brasil, etc). A Nathalia, aqui do MestreSEO, publicou um post com dicas de como ter um bom posicionamento em um país específico. Evite subdomínios ou pastas (/mestreseo.com.br/en, /mestreseo.com.br/es, /mestreseo.com.br/fr) para separar os idiomas.

Blockquotes Evitam Conteúdo Duplicado

O uso das tags <blockquote> evita que um documento seja filtrado por conteúdo duplicado. Como eu fiz neste post, e no post com a discussão sobre conteúdo duplicado e punição, os trechos que eu achei em outros sites e blogs, e que achei importante incluir dentro do meu post, foram colocados em tags <blockquote>, entre àspas, pois as citações não são minhas, são copiadas de outros locais, cuja origem está devidamente especificada, e eu não quero ser filtrado por conteúdo duplicado.

Neste caso, seria muito improvável que os meus posts fossem considerados conteúdo duplicado, pois as páginas com as citações que eu incluí não rankeiam no Brasil, e nem as minhas páginas rankeiam nos EUA. Mas de qualquer maneira, esta é a forma correta de fazer as coisas.

Conteúdo Duplicado – Eu Não

É isso aí, acho que este post esclarece a questão levantada pelo Luis e ainda indica formas de citar conteúdo de outros sites sem gerar conteúdo duplicado e ficar fora das principais páginas de resultados de pesquisa.

De modo geral, além das tags <blockquote>, simplesmente citar trechos de outros sites, mesmo sem usar as tags, também não implica em conteúdo duplicado, desde que tenha bastante conteúdo original junto e, o principal, cite (link para) a origem.

Para o caso de publicar o mesmo texto em vários idiomas, considere a possibilidade de lançar sites com a TLD correta, hospedados em servidores no país correto.

Pois bem, ao longo do seu trabalho de SEO, fique atento à mais esses detalhes para a otimização do site não ir por água a baixo. Comente, levante novas questões que nós vamos ajudar o quanto for possível. Abraços, assinem o nosso feed e até a próxima!

Divulgue este artigo!




Autor Frank Marcel


Trabalha com SEO desde 2007 e foi o primeiro Analista de SEO da MestreSEO, em 2008. Em 2012, tem definido o cargo de Diretor e é firmado como o Segundo no Comando, participando ativamente junto dos fundadores da MestreSEO nas decisões da empresa e ainda com a orientação para os times de SEO, time comercial e supervisão de contas. Entre em contato no twitter: @frankmarcel; Ou no Google Plus: +Frank Marcel


34 Respostas à este post


  • Interessante ter falado da tag BLOCKQUOTE, em HTML pelo menos eu sempre achei ela tão inútil hehe.

    Vou passar a aplicar isso…

    Quanto as traduções, acho que um domínio geral .com dê conta, afinal conseguir algumas TLDs pode sair um tanto caro ou mais difícil dependendo do país.

    [ Responder este comentário ]

  • E aí Marcos!

    Pois é, a tag blockquote serve para, entre outros, deixar explicito que tal trecho foi copiado mesmo e você não está assumindo a autoria, pelo contrário, está informando seus leitores que foi copiado de outro local e, de preferência, citando a fonte.

    TLDs podem ser um problema mesmo. Até bem pouco tempo, no Brasil, era necessário ter CNPJ (ser uma empresa) para poder comprar um domínio .com.br. Agora CPF é suficiente.

    Quanto a traduções, eu acho nofollow uma boa saída para rankear a versão certa no país de origem, que é o mais importante.

    Abraços! Obrigado pelo comentário!

    [ Responder este comentário ]

  • Desculpe a pergunta… Estou começando agora com esse negócio de tentar monetizar o blog e aplicar SEO (faz umas 2 semanas que tirei o blog do wordpress.com e mandei pra outro lugar para ter mais flexibilidade – não se preocupe, fiz domain mapping já faz tempo)…

    Ainda tenho poucas visitas… Ontem consegui 875, geralmente tenho umas 700 por dia segundo o plugin WordPress stats.. Não sei se meus ganhos com o Adsense estão bons… Acho que estão meio baixos… ontem consegui US$3,60 mais ou menos no Adsense, e já teve dia que consegui apenas US$0,80

    Vi que palavras chaves em inglês pagam mais e ando pensando em tentar abrir um blog em inglês… Você falou nesse artigo para evitar diretórios como /en, mas e se eu criasse um subdomínio e meu blog ficasse algo como english.terramel.org

    O que acha??

    Aguardo respostas
    Abraços
    Terramel

    [ Responder este comentário ]

  • Olá Terramel (?)! Como eu disse no post, subdiretórios também devem ser evitados. Isso não significa que você não vai conseguir, mas a probabilidade de sucesso é muito maior quando você, pelo menos, utiliza a TLD do país onde pretende lançar o seu site/blog.

    Os buscadores se baseiam em IP e/ou TLD para identificar em qual país você vai aparecer. Com IP e TLD apropriados, suas chances de aparecer aumentam.

    O que eu acho é que você pode arriscar lançar o seu blog como subdomínio e ver o que acontece, ou se estiver mesmo decidida a vencer no Google US, comprar um domínio TLD .com e hospedar o site em um servidor por lá. Leve em consideração que o SEO por lá está mais avançado do que aqui e que a concorrência será mais alta também.

    Abraços!

    [ Responder este comentário ]

  • Olá! Parabéns pelo site! Uma pergunta.. O que ocorre em casos de lojas virtuais (sobretudo as de pequenas empresas) que alimentam sua páginas com a transcrição literal das informações dos produtos dos sites dos fabricantes? Por exemplo, uma loja virtual de uma empresa que comercializa equipamentos eletrônicos de diversas marcas e que tem em seu site mais de 1000 produtos. Acredito que a maioria dos lojistas simplesmente copia e cola esses textos no site sem nenhuma ‘personalização’, o que é até compreensível em se tratando se ‘especificações e caracterísitcas técnicas’. E, em se falando de pequenas lojas virtuais, o conteúdo desses sites, na maioria dos casos, é basicamente a soma desses textos copiados. Abraço!

    [ Responder este comentário ]

  • Olá Fernandez! Obrigado pelo parabéns e pela visita.
    Muito boa essa sua pergunta. Vamos lá…

    Bom, quanto aos dados precisamente, não tem muito o que fazer, ou você vai acabar transformando seu produto em um outro. O ponto é que eu vejo muitas páginas com bom posicionamento não apresentarem as especificações técnicas, ou seja, uma página para o produto e outra para as especificações do produto. Assim você consegue ter uma página do produto original e diferente das outras. Mas mesmo a página de especificações é possível diferenciar, organizando as informações de forma diferente, mudando a apresentação dos dados. Se você realmente só copiar e colar, aí não tem como mesmo, o Google vai filtrar.

    Então é isso, você pode ou separar página do produto x página de especificações do produto; ou não copiar e colar, mas re-organizar as informações sobre especificações do produto. Pode gastar um pouco de criatividade aí! =)

    Abraços! Nos visite mais vezes!

    [ Responder este comentário ]

  • Concordo com o Frank, se você organizar melhor a informação e fazer uma busca por outras informações complementares você pode conseguir um bom rankeamento no Google. Se for igual aos outros é o que o Frank falou, o seu site cairá no filtro.

    Abraços

    [ Responder este comentário ]

  • [...] O que não é conteúdo duplicado Sem palavras! A partir do momento que li esse artigo no Seo Dicas (opa, ah eh, mudou: Mestre SEO) passei a usar a antiga e conhecida tag <blockquote>, até então inútil pra mim, exceto pela formatação em alguns estilos. [...]

  • Anúncios em outros sites:
    Na maioria das vezes você tem um único texto espalhado por diversos portais de classificados. Aí vem a dúvida:
    Ao divulgar um mesmo texto falando sobre seu produto/empresa e linkando as mesmas palavras-chaves para seu site é considerado como SPAM ou conteúdo duplicado?
    Isto pode aumentar o page rank e posicionamento ou pode acontecer o contrário?

    [ Responder este comentário ]

  • Vai depender da qualidade, idoneidade, relevância, etc, desses portais e diretórios. Preferencialmente que não fosse divulgado precisamente o mesmo texto também, pois isso pode caracterizar conteúdo duplicado sim, mas essa seria uma “briga” entre os portais e classificados para saber quem publicou primeiro, o site, a princípio, não teria nada a ver com a história.
    SPAM: pode parecer spam sim sempre o mesmo texto, sempre a mesma âncora, sempre o mesmo site linkado, sempre sites duvidosos linkando, …

    SE não ocorrer nada black hat, sim, pode aumentar o posicionamento e o PageRank. SE houver algo black hat, o contrário acontece.

    [ Responder este comentário ]

  • Fala aí Frank Marcel !!!
    Hoje surgiu uma dúvida interessante:
    Criei uma nova página de minha autoria, coloquei no meu sitemap e feed e pra agilizar a indexação cadastrei uma prévia (resumo) da página em uns 6 Social Bookmarks, mais uns 4 portais de classificados.
    Minha dúvida é: Como nesses portais a indexação é sempre mais rápida do que meu site o google não pode identificar como “autor” algum desses portais e não o meu site ? (embora todos estão likando para o meu site.)

    [ Responder este comentário ]

  • E aí Demétrios! Muito boa a sua pergunta. E a resposta é sim.

    Sim, mas depende, como sempre!
    Se a sua divulgação por esses social bookmarks e classificados acontece de modo que você publique todo o conteúdo, deixando-o idêntico ao original do seu site, sim, o seu pode ser considerado conteúdo duplicado se os bots encontrarem um dos outros primeiro.
    Se você colocar um link nos outros apontando o seu como original, você pode escapar e o google te reconhecer como dono do conteúdo.

    Se você não divulgou todo o conteúdo (apenas resumo ou excerpt ou description, etc) e ainda fez o link para sua página, não tem o risco de o original ser considerado duplicado. Ou, pelo menos, as chances ficam muito reduzidas.

    Abraços! E participe da nossa promoção para ir ao SMX!

    [ Responder este comentário ]

  • Dúvida:
    Tenho e domínios com “nomes iguais”, porém um é .COM.BR e o outro é .COM.
    O .COM tem uma especie de espelho para o .COM.BR feito pelo própria sistema que hospeda os site. Fiz todo o trabalho de SEO no .COM.BR, porém o google indexou o .COM também, seu eu pedir. Se digitar no google “site:nomedosite.com.br” e site:”nomedosite.com” Aparecem todas as páginas com seus respectivos títulos, descrição e URL, só que o 1º com “extensão” .COM.BR e o outro com .COM.

    Minha dúvida é se isto pode ser considerado pelo Google sites diferentes com conteúdo duplicados e futuramente ser punido. Não sei o que realmente a hospedagem usa pra fazer este “espelho”, mas estou preocupado com uma possível punição.

    [ Responder este comentário ]

  • Olha Demétrios, dependendo de como isso estiver ocorrendo, pode sim ser considerado conteúdo duplicado e até mesmo black hat.

    Utilizar o .com.br para rankear no Brasil é melhor sim, mas isso não quer dizer que seja impossível rankear com um domínio .com. Mas não faz o menor sentido ter 2 sites com o mesmo conteúdo, diferenciando-se unicamente pela TLD – .com.br ou .com.

    E o Google é o Google – bobeou, indexou. Seria necessário um bloqueio explícito por robots, meta informação e tudo mais para impedir mesmo a indexação por parte do Google…

    [ Responder este comentário ]

  • O que é uma TLD?
    Quanto ao bloqueio por robots, se for fazer isso terei que fazer pelo .COM.BR, já que na hospedagem .COM não tem nada lá…e se eu fizer pelo .COM.BR vou bloquear em ambos….

    Bom antes de mais nada vou entrar em contato com o servidor pra ver como estão fazendo isso.

    [ Responder este comentário ]

  • TLD é a “extensão” de um domínio – .com; .com.br; .co.uk; .us; .es, etc.

    Olha, eu não entendi muito bem que confusão é essa que está armada no seu servidor. Mas se o mesmo conteúdo puder ser encontrado em 2 URLs diferentes, isso é conteúdo duplicado. “Feche” um dos sites e ofereça somente o outro.

    [ Responder este comentário ]

  • Olá.
    Eu antigamente possuia o meu blog hospedado no blogger, depois fiz um teste no wordpress.com e agora estou com domínio próprio.
    Só fui me interessar por Seo com esse novo domínio. Nisso eu já tinha criado trocentas cópias de meus conteúdos em blogs de teste diferentes. Após ler aqui saí deletando tudo que foi cópia dos meus conteúdos, pois tinha notado q meu blog só tava exibindo os conteúdos mais novos. Nenhum daqueles conteúdos antigos eu acho nas buscas.
    A questão é: o google vai indexar essas páginas mais antigas com o tempo? Pq ainda existem resultados desses blogs antigos nas pesquisas do google. Ele vai ver que eu apaguei tudo e vai indexar somente o meu blog?

    A propósito, estou reformulando todas essas páginas: tags, categorias, editando um ou outro texto, aplicando umas keywords no meio do caminho… Isso ajuda?

    [ Responder este comentário ]

  • Então, se você conseguisse redirecionar o conteúdo antigo com redirect 301 para o novo local do conteúdo antigo, seria perfeito.

    Senão, com o tempo o Google vai ver q as páginas antigas não existem mais e vai achar as novas páginas com o tal conteúdo.

    A sua reformulação nas páginas ajuda sim. Siga as dicas de SEO que a gente passa por aqui e você vai conseguir rankear o seu novo blog numa posição melhor que o antigo!

    [ Responder este comentário ]

  • Como poderia ser feito para os sites de busca indexarem páginas iguais de sistemas como por exemplo um sistema de afiliados em php onde todas as páginas são iguais somente diferindo nos endereços de URL ?

    Exemplo:

    http://www.dominio.com.br/?id=123695
    http://www.dominio.com.br/?id=123547
    http://www.dominio.com.br/?id=956134
    http://www.dominio.com.br/?id=596423
    http://www.dominio.com.br/?id=135556

    Ou /?ref=id-do-usuario

    Gostaria que alguém pudesse me ajudar com relação a isso

    [ Responder este comentário ]

  • Olha Sidiney, diz o Google que reconhece quando uma variável é Session ID, mas não é 100% garantido.

    O Yahoo! tem uma ferramenta que permite ajustar isso se não me engano, no Site Explorer. E acho que já vi algo parecido no Webmasters Tools do Google. Mas não tenho certeza se foi lá.

    Você não consegue trabalhar de outra forma que não seja na URL? Será bem mais amigável, e provável, que as search engines compreendam corretamente o que acontece.

    [ Responder este comentário ]

  • Olá… bom ai vai uma pergunta ao mestre! nada melhor do que sair da dúvida de maneira correta e confiável não? =)
    Seguinte, estou montando um blog/site com o WordPress MU O http://personaltrainerbrazil.com será um tipo de “portal fitness” e pretendo utilizar subdomínios para incluir conteúdo sobre assuntos específicos, exemplo:

    dieta.personaltrainerbrazil.com (informações somente sobre dietas)
    suplemento.personaltrainerbrazil.com (informações somente sobre suplementos alimentares) e assim por diante.
    Tenho intenção de disponibilizar o conteúdo em inglês também para rankear “mundialmente” e garantir mais visitas. Para isso eu precisaria somente criar os os subdomínios em inglês e postar o conteúdo traduzido?

    O que achou da idéia?

    [ Responder este comentário ]

  • E ai Alvaro! Acho que a resposta para a sua pergunta está no post mesmo. O Google nao considera conteudos em linguas diferentes dentro de um site como conteudo duplicado, mas o melhor é separar os conteudos em sites diferentes e hospedados nos referentes países-alvo de cada lingua diferente, da melhor forma possível, as vezes sao muitos países…

    Abraços!

    [ Responder este comentário ]

  • E ai Frank… tô um pouco atrasado aí no post, mas espero que leiam, hehe

    Quando comecei a trabalhar com SEO a dois anos, conteúdo duplicado era um fantasma que me perseguia constantemente, hoje, depois de muito estudo e uma ajuda aqui do Mestre SEI, já não tenho mais pesadelos com isso :)

    Mas ainda tenho uma dúvida que me persegue. Vejam essas páginas:

    http://assinebandalarga.uol.com.br/banda-larga-joinville-sc/
    http://assinebandalarga.uol.com.br/banda-larga-londrina-pr/

    Como elas podem não ser conteúdo duplicado, se a única diferença é o nome da cidade?
    E outra, faz alguma diferença para o Google a página ser gerada dinamicamente? Seria essa a questão??

    Abraços

    [ Responder este comentário ]

  • Olha Guto, essencialmente as páginas são iguais mesmo. As meta tags, pelo menos, são diferentes e isso dá alguma diferença.

    Mas o fato é que as páginas não competem entre si, não é mesmo? Acredito que apenas uma delas vai aparecer em uma busca nas palavras-chave que elas possam atender.

    O Google não se importa com geração dinâmica, desde que não quebre as suas guidelines.

    [ Responder este comentário ]

  • Olá Frank,

    Muito bom seu artigo, estou estudando através do MestreSEO e tenho conseguido ótimos resultados.

    Bem Frank tenho uma dúvida possuo um portal voltado para o setor farmacêutico e todos os dias recebo Press releases da qual publico em minha seção de notícias, sendo que a mesma é a mesma é publicada em outros sites de notícias.

    Minha dúvida é posso ser punido por isso?

    A única seção que possui conteúdo duplicado é essa, sendo as demais possuem apenas conteúdos próprios e original. O conteúdo duplicado pode atrapalhar o rankeamento das demais páginas?

    Agradeço.

    [ Responder este comentário ]

    Fábio, o filtro de conteúdo duplicado não é bem uma punição. O Google costuma penalizar, sim, site que somente copia conteúdo, que não é o seu caso.

    Ainda, você não precisa ser o conteúdo filtrado, se o seu site tiver a página mais relevante, os outros é que serão filtrados. Para isso, procure ganhar muitos links para a sua página.

    [ Responder este comentário ]

    Olá Frank,

    Agradeço, realmente vi que em alguns Press Releases além de outros portais grandes terem publicados como o G1 o meu aparece em primeiro lugar no google, talvez pela relevancia do conteúdo com o tema do site ou por ter publicado primeiro.

    Obrigado pela resposta Frank.

    [ Responder este comentário ]

  • Olá, se eu tenho um site de venda de camisetas, tenho estampas diferentes, mas as especificações do produto como a malha e o processo de estampas são as mesmas e eu preciso por estas informações em cada uma, se eu uso esse mesmo texto em todos os anúncios isto é conteúdo duplicado?

    [ Responder este comentário ]

    Sim, Jaqueline. Você descreveu precisamente o que é conteúdo duplicado: o mesmo texto em várias páginas diferentes.

    [ Responder este comentário ]

    Então, quando eu tenho que colocar a mesma informação em vários produtos diferentes, uma alternativa seria colocar essas informações em forma de imagem? Eu estou usando a loja pronta do Mercadoshop, não tenho tanta flexibilidade lá, ouvi falar do magento, mas não sei usá-lo ainda e como meu orçamento é baixo ainda não posso pagar um programador, mas mesmo assim gostaria de configurar a minha loja no mercadoshop da melhor maneira possível para subir minha posição nas buscas, já que não quero ficar sempre comprando links no adwords.

    Ha e parabéns pelo site, é super agradável a leitura tanto visualmente quanto a leveza do texto, e também tem muita informação, já adicionei aos meus favoritos. Obrigada!

    [ Responder este comentário ]

  • O ideal é ter um conteúdo diferente em cada página. Se possível, a própria descrição do produto. Mas também são válidas outras informações, como reviews, comentários de consumidores e outros que enriqueçam a página.

    [ Responder este comentário ]

    Para finalizar uma alternativa em que pensei foi criar uma página em um blog com as informações, e quando precisar repetir o texto eu colocar um link para a esta página, aí a dúvida é: se eu tenho várias páginas no mesmo site apontando para o mesmo link também é duplicação de conteúdo?

    [ Responder este comentário ]

    Jaqueline, veja que sua alternativa não resolve o problema. Agora ao invés de ter a descrição duplicada, a página de produto tem muito menos conteúdo (sem a descrição) e um link que se repete em todas elas, sendo, de certa forma, conteúdo duplicado.

    Acredite, a melhor solução para conteúdo duplicado é colocar mais conteúdo diferente em cada página, seja na ideia de comentários e reviews, ou na própria produção de descrições diferentes (minha solução preferida e mais recomendada).

    [ Responder este comentário ]

Deixe um ComentárioDeixe um Comentário

(obrigatório)

(não será publicado)(obrigatório)


Nota: A moderação de comentários pode estar ativa, então não há necessidade de re-enviar o seu comentário.