<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
		xmlns:itunes="http://www.itunes.com/dtds/podcast-1.0.dtd"
	xmlns:media="http://search.yahoo.com/mrss/"
>

<channel>
	<title>Mestre SEO &#187; Robots txt</title>
	<atom:link href="http://www.mestreseo.com.br/category/robots-txt/feed" rel="self" type="application/rss+xml" />
	<link>http://www.mestreseo.com.br</link>
	<description>Blog de SEO com informações sobre Otimização de Sites(SEO), Pagerank, Google e Search Engine Marketing (SEM). Aprenda a otimizar o seu site e blog!</description>
	<lastBuildDate>Fri, 10 Feb 2012 13:39:52 +0000</lastBuildDate>
	<language>pt-br</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
<xhtml:meta xmlns:xhtml="http://www.w3.org/1999/xhtml" name="robots" content="noindex" />
	<copyright>Copyright © Mestre SEO 2011 </copyright>
	<managingEditor>blog@mestreseo.com.br (MestreSEO)</managingEditor>
	<webMaster>blog@mestreseo.com.br (MestreSEO)</webMaster>
	<ttl>1440</ttl>
	<image>
		<url>http://www.mestreseo.com.br/mestrecast/logo-mestreseo-300x300.png</url>
		<title>Mestre SEO</title>
		<link>http://www.mestreseo.com.br</link>
		<width>144</width>
		<height>144</height>
	</image>
	<itunes:subtitle></itunes:subtitle>
	<itunes:summary>MestreCast, o podCast da MestreSEO sobre assuntos relacionados a Search, SEO, Links Patrocinados e Social Media. Conta sempre com a participação do Ique Muniz e Fábio Ricotta.</itunes:summary>
	<itunes:keywords></itunes:keywords>
	<itunes:category text="Business">
		<itunes:category text="Management &#38; Marketing" />
	</itunes:category>
	<itunes:category text="Technology" />
	<itunes:category text="Technology">
		<itunes:category text="Tech News" />
	</itunes:category>
	<itunes:author>MestreSEO</itunes:author>
	<itunes:owner>
		<itunes:name>MestreSEO</itunes:name>
		<itunes:email>blog@mestreseo.com.br</itunes:email>
	</itunes:owner>
	<itunes:block>no</itunes:block>
	<itunes:explicit>no</itunes:explicit>
	<itunes:image href="http://www.mestreseo.com.br/mestrecast/logo-mestreseo-300x300.png" />
		<item>
		<title>Robots.txt: 4 Coisas Que Você Deve Saber</title>
		<link>http://www.mestreseo.com.br/robots-txt/robotstxt-4-coisas-que-voce-deve-saber?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=robotstxt-4-coisas-que-voce-deve-saber</link>
		<comments>http://www.mestreseo.com.br/robots-txt/robotstxt-4-coisas-que-voce-deve-saber#comments</comments>
		<pubDate>Fri, 15 Aug 2008 13:24:26 +0000</pubDate>
		<dc:creator>Leandro Riolino</dc:creator>
				<category><![CDATA[Robots txt]]></category>
		<category><![CDATA[dicas robots]]></category>
		<category><![CDATA[dicas robots.txt]]></category>
		<category><![CDATA[robots]]></category>
		<category><![CDATA[Robots.txt]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[Tutorial Robots]]></category>
		<category><![CDATA[tutorial robots.txt]]></category>

		<guid isPermaLink="false">http://www.mestreseo.com.br/?p=445</guid>
		<description><![CDATA[<p>Dicas, Tutorial, Coisas que você deve saber a repeito do robots.txt</p><p>Artigo produzido por MestreSEO, empresa especializada em <a target="_blank" href="http://www.mestreseo.com.br/">Otimiza&ccedil;&atilde;o de Sites</a>. N&atilde;o perca a oportunidade de conferir as nossas <a target="_blank" href="http://www.mestreseo.com.br/ferramentas-de-seo">ferramentas de SEO</a>.
<br/>
Artigo Original: <a href="http://www.mestreseo.com.br/robots-txt/robotstxt-4-coisas-que-voce-deve-saber">Robots.txt: 4 Coisas Que Você Deve Saber</a>

<h2>Curso de SEO</h2>
Aproveite a oportunidade para participar do nosso <a target="_blank" href="http://www.mestreseo.com.br/curso-de-seo">Curso de SEO</a>. Garanta j&aacute; a sua vaga: <a target="_blank" href="http://www.mestreseo.com.br/curso-de-seo">http://www.mestreseo.com.br/curso-de-seo</a></p>]]></description>
			<content:encoded><![CDATA[<p>Olá leitores da MestreSEO, </p>
<p>Semana passada estivemos no <a href="http://www.mestreseo.com.br/eventos-seo/smx-2008-sao-paulo-mestreseo-foi"><strong>SMX Brasil</strong></a> realizado na cidade de São Paulo, gostaria de deixar aqui um abraço a todos que eu encontrei por lá que estão lendo este artigo. Seguindo um pouco a linha do evento, hoje daremos 4 dicas BÁSICAS, ou 4 coisas que você deve saber a respeito do <a href="http://www.mestreseo.com.br/robots-txt/tutorial-de-robotstxt"><strong>robots.txt</strong></a>.</p>
<p>O uso do robots.txt se tornou amplamente utilizado para um método de controle e rastreamento do seu site. Assim tornou-se uma das primeiras coisas que você deve verificar para diagnosticar problemas de indexação ou algum outro problema no seu site. Embora quase todos os webmasters já utilizem esse arquivo, ainda há algumas coisas que causam mal entendidos, vamos a elas:</p>
<h2>Robots.txt não dizem que a página será removida do índice dos search engines</h2>
<p>A utilização do robots.txt pode evitar que os bots entrem em uma determinada página ou diretório, mas se a url já foi indexada anteriormente a partir de fontes externas, ela usará essas informações para fazer o julgamento da página e formular os snippet (título e descrição que aparecerá nos players de busca).</p>
<h2>O robotôs de busca seguem apenas o que você especifica para eles no robots.txt</h2>
<p>Se você usa uma definição geral para todos os bots (ou seja: user-agent: *) e uma definição para um bot específico (por exemplo: User-agent: googlebot) nas seções de User-agent, tenha em mente que o Google (e outros indexadores) só seguirá as seções mais específicas e irá ignorar todas as outras seções (incluindo a geral). Ex:</p>
<p><a href="http://www.mestreseo.com.br/wp-content/uploads/2008/08/robots-txt.jpg"><img class="size-full wp-image-642" title="robots-txt" src="http://www.mestreseo.com.br/wp-content/uploads/2008/08/robots-txt.jpg" alt="Funcionamento Robots TXT" width="400" height="253" /></a></p>
<h2>Dê instruções claras no seu arquivo robots.txt</h2>
<p>Dentro do arquivo robots.txt os bots lêem uma instrução em uma url a partir da esquerda para a direita, o que significa que eles bloqueiam ou permitem tudo após o “/” em uma url, por exemplo se você colocar: “Disallow: /a” tudo que começa com “a” será descartado pelos bots, neste caso a página www.seudominio.com.br/about.html será descartada pelo user-agent.</p>
<h2>Proteja os seus arquivos com o robots.txt</h2>
<p>Pensando no lado da segurança e SEO, seu site DEVE ter esse arquivo robots.txt mesmo que você não queira deixar nenhuma direção para o bot, neste caso faça o arquivo e deixe o padrão:</p>
<p>User-agent: *</p>
<p>Disallow:</p>
<p>Por isto, tenha a certeza de que:</p>
<p>•	Todos os indexadores buscam entender o que você quer dizer corretamente.</p>
<p>•	Os indexadores sempre consigam acessar o seu robots.txt, por isso, sempre olhe o log do <a href="http://www.mestreseo.com.br/google-seo/otimizando-o-site-com-o-google-webmaster-tools"><strong>Google Webmaster Tools</strong></a> para ver se o Google bot encontrou seu arquivo corretamente.</p>
<p>•	Bots não irão esperar para indexar seu site em caso de não poderem atingir seu Robots.txt (um caso muito improvável, mas pode acontecer assim mesmo).</p>
<p>Espero que tenham gostado destas dicas sobre o robots.txt e não deixem de conferir nossa ferramenta para <a target="_blank" href="http://www.mestreseo.com.br/ferramentas-seo/gerador-robots-txt/">geração de robots.txt</a>.</p>
<p>Um abraço a todos!</p>
<p>Artigo produzido por MestreSEO, empresa especializada em <a target="_blank" href="http://www.mestreseo.com.br/">Otimiza&ccedil;&atilde;o de Sites</a>. N&atilde;o perca a oportunidade de conferir as nossas <a target="_blank" href="http://www.mestreseo.com.br/ferramentas-de-seo">ferramentas de SEO</a>.
<br/>
Artigo Original: <a href="http://www.mestreseo.com.br/robots-txt/robotstxt-4-coisas-que-voce-deve-saber">Robots.txt: 4 Coisas Que Você Deve Saber</a>

<h2>Curso de SEO</h2>
Aproveite a oportunidade para participar do nosso <a target="_blank" href="http://www.mestreseo.com.br/curso-de-seo">Curso de SEO</a>. Garanta j&aacute; a sua vaga: <a target="_blank" href="http://www.mestreseo.com.br/curso-de-seo">http://www.mestreseo.com.br/curso-de-seo</a></p>]]></content:encoded>
			<wfw:commentRss>http://www.mestreseo.com.br/robots-txt/robotstxt-4-coisas-que-voce-deve-saber/feed</wfw:commentRss>
		<slash:comments>13</slash:comments>
		</item>
		<item>
		<title>Tutorial de robots.txt</title>
		<link>http://www.mestreseo.com.br/robots-txt/tutorial-de-robotstxt?utm_source=rss&#038;utm_medium=rss&#038;utm_campaign=tutorial-de-robotstxt</link>
		<comments>http://www.mestreseo.com.br/robots-txt/tutorial-de-robotstxt#comments</comments>
		<pubDate>Mon, 28 Jul 2008 12:33:57 +0000</pubDate>
		<dc:creator>Heron Inouye</dc:creator>
				<category><![CDATA[Robots txt]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[Tutorial de Robots.txt]]></category>

		<guid isPermaLink="false">http://www.mestreseo.com.br/?p=503</guid>
		<description><![CDATA[<p>Olá leitores da MestreSEO! Como muitos de vocês sabem, os mecanismos de busca utilizam-se de robôs de busca, também conhecidos como webcrawlers, para percorrer toda a web, indexando todo ou quase todo o conteúdo disponível. Diante disto, foi criado um padrão onde cada website pode incluir na raíz do seu website um arquivo chamado robots.txt [...]</p><p>Artigo produzido por MestreSEO, empresa especializada em <a target="_blank" href="http://www.mestreseo.com.br/">Otimiza&ccedil;&atilde;o de Sites</a>. N&atilde;o perca a oportunidade de conferir as nossas <a target="_blank" href="http://www.mestreseo.com.br/ferramentas-de-seo">ferramentas de SEO</a>.
<br/>
Artigo Original: <a href="http://www.mestreseo.com.br/robots-txt/tutorial-de-robotstxt">Tutorial de robots.txt</a>

<h2>Curso de SEO</h2>
Aproveite a oportunidade para participar do nosso <a target="_blank" href="http://www.mestreseo.com.br/curso-de-seo">Curso de SEO</a>. Garanta j&aacute; a sua vaga: <a target="_blank" href="http://www.mestreseo.com.br/curso-de-seo">http://www.mestreseo.com.br/curso-de-seo</a></p>]]></description>
			<content:encoded><![CDATA[<p>Olá leitores da MestreSEO!</p>
<p>Como muitos de vocês sabem, os mecanismos de busca utilizam-se de robôs de busca, também conhecidos como webcrawlers, para percorrer toda a web, indexando todo ou quase todo o conteúdo disponível. Diante disto, foi criado um padrão onde cada website pode incluir na raíz do seu website um arquivo chamado <strong>robots.txt</strong> que diz aos robôs de busca quais páginas eles não podem visitar.</p>
<p>Pois bem, aprender como funciona o robots.txt é muito importante no processo de <a href="http://www.mestreseo.com.br">otimização de sites</a>, evitando assim que algum conteúdo restrito fique disponível na web ou ainda que você sofra de conteúdo duplicado.</p>
<p>Vejamos abaixo mais alguns detalhes sobre o padrão robots.txt:</p>
<h2>Como Criar um Arquivo robots.txt</h2>
<p>Existem diversas maneiras de criar um arquivo robots.txt, como por exemplo, abrir o bloco de notas e criar a partir de lá. Mas aqui na MestreSEO disponibilizamos uma ferramenta online e gratuita onde você pode inserir quais páginas você deseja bloquear dos robôs de busca e ele simplesmente fornece todo o código necessário para <a href="http://www.mestreseo.com.br/ferramentas-seo/gerador-robots-txt/" target="_blank">gerar o seu arquivo robots.txt.</a> Vale apena testar.</p>
<h2>Exemplos de Formatação do robots.txt</h2>
<p>Permite que todos os arquivos sejam indexados</p>
<blockquote><p>User-agent: *</p>
<p>Disallow:</p></blockquote>
<p>Não permite que nenhum arquivo seja indexado</p>
<blockquote><p>User-agent: *</p>
<p>Disallow: /</p></blockquote>
<p>Não permite que uma pasta seja indexada, com aexceção do arquivo myfile.html que está dentro da pasta</p>
<blockquote><p>User-agent: Googlebot</p>
<p>Disallow: /folder1/</p>
<p>Allow: /folder1/myfile.html</p></blockquote>
<h2>Informação Contida no robots.txt</h2>
<p>Os search engines são vorazes por padrão. Eles querem indexar o máximo de informação de qualidade que conseguirem, e eles presumem que podem indexar tudo, a menos que alguém diga para eles pararem.</p>
<p>Se você especificar dados para todos os bots (*)  e dados para bots específicos (como o Googlebot), então os comandos específicos para bots serão seguidos enquanto o bot especificado (no nosso exemplo o Googlebot) irá ignorar os comandos globais. Logo, se você fizer um comando global que queira aplicar para um bot específico, então você deverá colocar o comando para o bot específico também.<br />
<img class="alignnone size-full wp-image-504" title="robotstxt" src="http://www.mestreseo.com.br/wp-content/uploads/2008/07/googlebot1.jpg" alt="" width="500" height="225" /></p>
<p>Quando você bloqueia URLs para que elas não sejam indexadas no Google pelo robots.txt, ele (o Google) pode ainda mostrar estas URLs nos resultados das pesquisas. Uma solução completa é bloquear usando as meta tags:</p>
<ul>
<li> &lt;meta name=&#8221;robots&#8221; content=&#8221;noindex&#8221;&gt;</li>
<li>&lt;meta name=&#8221;robots&#8221; content=&#8221;noindex,nofollow&#8221;&gt;</li>
</ul>
<p>Se você não tem um arquivo robots.txt, os logs dos servidores irão retornar erros 404 sempre que um bot tentar acessar o arquivo. Você pode fazer upload do arquivo em branco com o nome robots.txt na pasta raiz do seu site.</p>
<p>Alguns search engines também permitem que você especifique o endereço de um sitemap XML no arquivo robots.txt.</p>
<h2>Caracteres Especiais</h2>
<p>Google, Yahoo! e MSN permitem o uso de caracteres especiais no arquivo robots.txt.</p>
<p>Para bloquear acesso para todas as URLs que incluem uma interrogação (? &#8211; URLs com parâmetros via GET), você deve usar o seguinte código:</p>
<blockquote><p>User-agent: *</p>
<p>Disallow: /*?</p></blockquote>
<p>Você pode também especificar arquivos com determinadas extensões usando o cifrão ($). Por exemplo: se você quer bloquear todas as páginas com extensão .asp, coloque no robots.txt :</p>
<blockquote><p>User-agent: Googlebot</p>
<p>Disallow: /*.asp$</p></blockquote>
<h2>Excentricidades</h2>
<p>Sabemos que o Google vem &#8220;preenchendo&#8221;  formulários de pesquisa e indexando as páginas geradas. Para evitar que tais páginas sejam indexadas, bloqueie pelo robots.txt. Suponha que a variável de pesquisa na URL seja &#8220;search&#8221;. Então você poderia por:</p>
<blockquote><p>User-agent: *</p>
<p>Disallow: /?search=</p></blockquote>
<p>para evitar que as páginas geradas por pesquisa sejam geradas.</p>
<h2>Analisando o robots.txt</h2>
<p>No Google Webmaster Central, existe uma ferramenta de análise muito eficiente, que mostra os erros que o crawler encontrou durante a anáise do seu site. Mais detalhes podem ser encontrados no meu artigo de <a href="http://www.mestreseo.com.br/google-seo/otimizando-o-site-com-o-google-webmaster-tools-parte-final"><strong>otimização de sites usando o google webmaster tools</strong></a>.</p>
<h2>Conclusões</h2>
<p>O uso do robots.txt  é uma importante técnica para controle de indexação do seu site e é uma dos primeiros itens a se verificar quando se realiza uma consultoria de SEO. Então fique de olho e não se esqueça de testar o seu robots.txt.</p>
<p>Artigo produzido por MestreSEO, empresa especializada em <a target="_blank" href="http://www.mestreseo.com.br/">Otimiza&ccedil;&atilde;o de Sites</a>. N&atilde;o perca a oportunidade de conferir as nossas <a target="_blank" href="http://www.mestreseo.com.br/ferramentas-de-seo">ferramentas de SEO</a>.
<br/>
Artigo Original: <a href="http://www.mestreseo.com.br/robots-txt/tutorial-de-robotstxt">Tutorial de robots.txt</a>

<h2>Curso de SEO</h2>
Aproveite a oportunidade para participar do nosso <a target="_blank" href="http://www.mestreseo.com.br/curso-de-seo">Curso de SEO</a>. Garanta j&aacute; a sua vaga: <a target="_blank" href="http://www.mestreseo.com.br/curso-de-seo">http://www.mestreseo.com.br/curso-de-seo</a></p>]]></content:encoded>
			<wfw:commentRss>http://www.mestreseo.com.br/robots-txt/tutorial-de-robotstxt/feed</wfw:commentRss>
		<slash:comments>45</slash:comments>
		</item>
	</channel>
</rss>

