<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	>
<channel>
	<title>Coment&aacute;rios em: Como Evitar Conteúdo Duplicado Utilizando o Robots.txt</title>
	<atom:link href="http://www.mestreseo.com.br/blog/seo/robots-txt/feed" rel="self" type="application/rss+xml" />
	<link>http://www.mestreseo.com.br/blog/seo/robots-txt</link>
	<description>Blog de SEO com informações sobre Otimização de Sites(SEO), Pagerank, Google e Search Engine Marketing (SEM). Aprenda a otimizar o seu site e blog!</description>
	<pubDate>Mon, 08 Sep 2008 00:58:36 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.6</generator>
		<item>
		<title>Por: Designer Demétrios</title>
		<link>http://www.mestreseo.com.br/blog/seo/robots-txt#comment-2344</link>
		<dc:creator>Designer Demétrios</dc:creator>
		<pubDate>Fri, 05 Sep 2008 19:46:53 +0000</pubDate>
		<guid isPermaLink="false">http://www.mestreseo.com.br/blog/?p=213#comment-2344</guid>
		<description>Eu entendi mais ou menos no final....No robots eu não estou usando o #.
Deixa eu explicar mais um detalhe que esqueci. Eu quero indexar apenas a páginas, ou seja:

Enable: /pagina.php (que no caso nem precisa já que por default o google vai indexar)
e:
disallow: /#imagens/foto-1.jpg (desabilitar a URL gerada pelo link dos thumbnails)

O arquivo "pagina.php" fica na raiz do site, e as imagens ficam no diretório "imagens/sub-pasta/". Ao clicar nos thumbnails o link vai buscar a imagem ampliada em "imagens/sub-pasta/nome-foto.jpg" e gera uma URL assim: www.site.com.br/pagina.php#imagens/sub-pasta/nome-foto-1.jpg, que antes era mostrada apenas www.site.com.br/pagina.php. Nessa situação o ideal para o Google não considerar URL duplicada (já que o conteúdo texto sera o mesmo, mudando apenas a foto 1, 2, 3 etc...) seria como?</description>
		<content:encoded><![CDATA[<p>Eu entendi mais ou menos no final&#8230;.No robots eu não estou usando o #.<br />
Deixa eu explicar mais um detalhe que esqueci. Eu quero indexar apenas a páginas, ou seja:</p>
<p>Enable: /pagina.php (que no caso nem precisa já que por default o google vai indexar)<br />
e:<br />
disallow: /#imagens/foto-1.jpg (desabilitar a URL gerada pelo link dos thumbnails)</p>
<p>O arquivo &#8220;pagina.php&#8221; fica na raiz do site, e as imagens ficam no diretório &#8220;imagens/sub-pasta/&#8221;. Ao clicar nos thumbnails o link vai buscar a imagem ampliada em &#8220;imagens/sub-pasta/nome-foto.jpg&#8221; e gera uma URL assim: <a href="http://www.site.com.br/pagina.php#imagens/sub-pasta/nome-foto-1.jpg" rel="nofollow">http://www.site.com.br/pagina.php#imagens/sub-pasta/nome-foto-1.jpg</a>, que antes era mostrada apenas <a href="http://www.site.com.br/pagina.php" rel="nofollow">http://www.site.com.br/pagina.php</a>. Nessa situação o ideal para o Google não considerar URL duplicada (já que o conteúdo texto sera o mesmo, mudando apenas a foto 1, 2, 3 etc&#8230;) seria como?</p>
]]></content:encoded>
	</item>
	<item>
		<title>Por: Frank Marcel</title>
		<link>http://www.mestreseo.com.br/blog/seo/robots-txt#comment-2343</link>
		<dc:creator>Frank Marcel</dc:creator>
		<pubDate>Fri, 05 Sep 2008 18:34:31 +0000</pubDate>
		<guid isPermaLink="false">http://www.mestreseo.com.br/blog/?p=213#comment-2343</guid>
		<description>Olha Demétrios, se você está mesmo usando o caracter # na sua URL vc entrou em uma boa agora, porque esse caracter é usado para indicar um comentário no robots.txt, ou seja, tudo que estiver na mesma linha do # e depois dele, torna-se um comentário, e não uma regra:

disallow: /demetrios #comentario - nao permitir acessar URLs que comecem com demetrios
ou
#a regra abaixo serve para impedir que
#URLs que comecem com demetrios nao sejam acessadas
disallow: /demetrios

Mas, supondo que você não está de fato utilizando esse caracter no robots.txt, 
disallow: /pagina.php #bloquear pagina.php
ou
disallow: /pagina.php?imagem= #bloquear pagina.php com parametro imagem
ou
disallow: /pagina/imagem/foto #bloquear url...

são formatos válidos...</description>
		<content:encoded><![CDATA[<p>Olha Demétrios, se você está mesmo usando o caracter # na sua URL vc entrou em uma boa agora, porque esse caracter é usado para indicar um comentário no robots.txt, ou seja, tudo que estiver na mesma linha do # e depois dele, torna-se um comentário, e não uma regra:</p>
<p>disallow: /demetrios #comentario - nao permitir acessar URLs que comecem com demetrios<br />
ou<br />
#a regra abaixo serve para impedir que<br />
#URLs que comecem com demetrios nao sejam acessadas<br />
disallow: /demetrios</p>
<p>Mas, supondo que você não está de fato utilizando esse caracter no robots.txt,<br />
disallow: /pagina.php #bloquear pagina.php<br />
ou<br />
disallow: /pagina.php?imagem= #bloquear pagina.php com parametro imagem<br />
ou<br />
disallow: /pagina/imagem/foto #bloquear url&#8230;</p>
<p>são formatos válidos&#8230;</p>
]]></content:encoded>
	</item>
	<item>
		<title>Por: Designer Demétrios</title>
		<link>http://www.mestreseo.com.br/blog/seo/robots-txt#comment-2339</link>
		<dc:creator>Designer Demétrios</dc:creator>
		<pubDate>Fri, 05 Sep 2008 01:05:24 +0000</pubDate>
		<guid isPermaLink="false">http://www.mestreseo.com.br/blog/?p=213#comment-2339</guid>
		<description>Dúvida:
Criei uma galeria de imagem que ao clicar nos thumbnail ele gera uma url assim:

wwww.site.com.br/pagina.php#imagens/foto-1.jpg
wwww.site.com.br/pagina.php#imagens/foto-2.jpg
wwww.site.com.br/pagina.php#imagens/foto-3.jpg

Como devo desabilitar a parte "#imagens/foto-x.jpg" no Robots.txt? Por acaso seria:
Disallow: /#imagens=
ou
Disallow: /#=

Não tenho certeza se estou fazendo certo...</description>
		<content:encoded><![CDATA[<p>Dúvida:<br />
Criei uma galeria de imagem que ao clicar nos thumbnail ele gera uma url assim:</p>
<p>wwww.site.com.br/pagina.php#imagens/foto-1.jpg<br />
wwww.site.com.br/pagina.php#imagens/foto-2.jpg<br />
wwww.site.com.br/pagina.php#imagens/foto-3.jpg</p>
<p>Como devo desabilitar a parte &#8220;#imagens/foto-x.jpg&#8221; no Robots.txt? Por acaso seria:<br />
Disallow: /#imagens=<br />
ou<br />
Disallow: /#=</p>
<p>Não tenho certeza se estou fazendo certo&#8230;</p>
]]></content:encoded>
	</item>
	<item>
		<title>Por: Fábio Ricotta</title>
		<link>http://www.mestreseo.com.br/blog/seo/robots-txt#comment-1943</link>
		<dc:creator>Fábio Ricotta</dc:creator>
		<pubDate>Tue, 22 Jul 2008 01:34:31 +0000</pubDate>
		<guid isPermaLink="false">http://www.mestreseo.com.br/blog/?p=213#comment-1943</guid>
		<description>Demétrios, eu acho que eu não me expliquei bem....

Colocando no robots, você bloqueia o acesso à página, mas não remove ela do índice. Para remover você tem que usar a Google Webmaster Tools ou inserir a meta tag "NOINDEX".

Certo?</description>
		<content:encoded><![CDATA[<p>Demétrios, eu acho que eu não me expliquei bem&#8230;.</p>
<p>Colocando no robots, você bloqueia o acesso à página, mas não remove ela do índice. Para remover você tem que usar a Google Webmaster Tools ou inserir a meta tag &#8220;NOINDEX&#8221;.</p>
<p>Certo?</p>
]]></content:encoded>
	</item>
	<item>
		<title>Por: Web Designer Demétrios</title>
		<link>http://www.mestreseo.com.br/blog/seo/robots-txt#comment-1942</link>
		<dc:creator>Web Designer Demétrios</dc:creator>
		<pubDate>Tue, 22 Jul 2008 00:39:20 +0000</pubDate>
		<guid isPermaLink="false">http://www.mestreseo.com.br/blog/?p=213#comment-1942</guid>
		<description>Para utilizar a ferramenta "remover URLs" do Google Webmaster precisa que as páginas não esteja dora ar (404) segundo o Google. No meu caso as páginas continuarão no ar, quero apenas tirar a indexação, já faz tempo que coloquei no robots e até agora nada.</description>
		<content:encoded><![CDATA[<p>Para utilizar a ferramenta &#8220;remover URLs&#8221; do Google Webmaster precisa que as páginas não esteja dora ar (404) segundo o Google. No meu caso as páginas continuarão no ar, quero apenas tirar a indexação, já faz tempo que coloquei no robots e até agora nada.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Por: Fábio Ricotta</title>
		<link>http://www.mestreseo.com.br/blog/seo/robots-txt#comment-1934</link>
		<dc:creator>Fábio Ricotta</dc:creator>
		<pubDate>Mon, 21 Jul 2008 22:25:15 +0000</pubDate>
		<guid isPermaLink="false">http://www.mestreseo.com.br/blog/?p=213#comment-1934</guid>
		<description>Olá Demétios,

O tempo varia dependendo do crawl rate do seu site. Ao bloquear do robots, você não deixa o Google indexar a sua página, mas se já estiver indexada, a sua página leva um tempo para ser indexada.

Se quiser remover a página rapidamente, use o Google Webmaster Tools.

O que sempre predomina é o robots, pois o sitemap só mostra a URL, mas o robots dita as regras se o bot pode ou não indexar a página.

Abraços</description>
		<content:encoded><![CDATA[<p>Olá Demétios,</p>
<p>O tempo varia dependendo do crawl rate do seu site. Ao bloquear do robots, você não deixa o Google indexar a sua página, mas se já estiver indexada, a sua página leva um tempo para ser indexada.</p>
<p>Se quiser remover a página rapidamente, use o Google Webmaster Tools.</p>
<p>O que sempre predomina é o robots, pois o sitemap só mostra a URL, mas o robots dita as regras se o bot pode ou não indexar a página.</p>
<p>Abraços</p>
]]></content:encoded>
	</item>
	<item>
		<title>Por: Web Designer Demétrios</title>
		<link>http://www.mestreseo.com.br/blog/seo/robots-txt#comment-1920</link>
		<dc:creator>Web Designer Demétrios</dc:creator>
		<pubDate>Sun, 20 Jul 2008 16:06:02 +0000</pubDate>
		<guid isPermaLink="false">http://www.mestreseo.com.br/blog/?p=213#comment-1920</guid>
		<description>Outra dúvida:
Se o site tiver uma página no sitemap e a mesma estiver desabilitada no robots.txt o que predomina ? a indexação do sitemap ou o Disallow do robots?</description>
		<content:encoded><![CDATA[<p>Outra dúvida:<br />
Se o site tiver uma página no sitemap e a mesma estiver desabilitada no robots.txt o que predomina ? a indexação do sitemap ou o Disallow do robots?</p>
]]></content:encoded>
	</item>
	<item>
		<title>Por: Web Designer Demétrios</title>
		<link>http://www.mestreseo.com.br/blog/seo/robots-txt#comment-1919</link>
		<dc:creator>Web Designer Demétrios</dc:creator>
		<pubDate>Sun, 20 Jul 2008 16:03:12 +0000</pubDate>
		<guid isPermaLink="false">http://www.mestreseo.com.br/blog/?p=213#comment-1919</guid>
		<description>Dúvida:
Quanto tempo leva para o google tirar a indexação de uma página após ter lido o robots.txt?
Tenho páginas que desabilitei a meses e até agora não site da indexação do google!
OBS: as página existem porém não quero que fique visível para o google.</description>
		<content:encoded><![CDATA[<p>Dúvida:<br />
Quanto tempo leva para o google tirar a indexação de uma página após ter lido o robots.txt?<br />
Tenho páginas que desabilitei a meses e até agora não site da indexação do google!<br />
OBS: as página existem porém não quero que fique visível para o google.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Por: SEO: Erros Fatais para o Sucesso &#124; Mestre SEO</title>
		<link>http://www.mestreseo.com.br/blog/seo/robots-txt#comment-1526</link>
		<dc:creator>SEO: Erros Fatais para o Sucesso &#124; Mestre SEO</dc:creator>
		<pubDate>Tue, 17 Jun 2008 13:03:15 +0000</pubDate>
		<guid isPermaLink="false">http://www.mestreseo.com.br/blog/?p=213#comment-1526</guid>
		<description>[...] faça seu site de modo que os crawlers não possam ver: Isso pode acontecer quando o arquivo robots.txt é usado incorretamente ou quando um site é todo em Flash ou em [...]</description>
		<content:encoded><![CDATA[<p>[...] faça seu site de modo que os crawlers não possam ver: Isso pode acontecer quando o arquivo robots.txt é usado incorretamente ou quando um site é todo em Flash ou em [...]</p>
]]></content:encoded>
	</item>
	<item>
		<title>Por: Conteúdo Duplicado - Punição ou não? &#124; Mestre SEO</title>
		<link>http://www.mestreseo.com.br/blog/seo/robots-txt#comment-1506</link>
		<dc:creator>Conteúdo Duplicado - Punição ou não? &#124; Mestre SEO</dc:creator>
		<pubDate>Mon, 16 Jun 2008 12:59:08 +0000</pubDate>
		<guid isPermaLink="false">http://www.mestreseo.com.br/blog/?p=213#comment-1506</guid>
		<description>[...] nós já tratamos do tema em alguns posts sobre casos e soluções de conteúdo duplicado, como evitar conteúdo duplicado com robots.txt, como identificar e corrigir conteúdo duplicado e um post ilustrado explicando como uma search [...]</description>
		<content:encoded><![CDATA[<p>[...] nós já tratamos do tema em alguns posts sobre casos e soluções de conteúdo duplicado, como evitar conteúdo duplicado com robots.txt, como identificar e corrigir conteúdo duplicado e um post ilustrado explicando como uma search [...]</p>
]]></content:encoded>
	</item>
</channel>
</rss>
