亚洲VA成无码人在线观看天堂,久久久久亚洲av无码专区桃色,98色婷婷在线,成人吸奶大片在线观看

>> 微信網(wǎng)站-自助建站

關(guān)于玖佰網(wǎng)絡(luò)

知識(shí)中心

服務(wù)指南

最新文章

	西安學(xué)校教育行業(yè)網(wǎng)站建設(shè)方案
	西安電子商務(wù)網(wǎng)站建設(shè)解決方案
	西安酒店餐飲行業(yè)網(wǎng)站建設(shè)方案
	西安旅游服務(wù)行業(yè)網(wǎng)站建設(shè)方案
	西安醫(yī)院醫(yī)療行業(yè)網(wǎng)站建設(shè)方案
	西安政府電子政務(wù)網(wǎng)站建設(shè)方案
	西安生產(chǎn)制造行業(yè)網(wǎng)站建設(shè)方案
	做好網(wǎng)站原創(chuàng)內(nèi)容設(shè)計(jì)的五大要點(diǎn)

您現(xiàn)在的位置：西安做網(wǎng)站_西安玖佰網(wǎng)絡(luò) > 知識(shí)中心 > 網(wǎng)站建設(shè)推廣 > 正文

如何正確配置Robots.txt？

西安玖佰網(wǎng)絡(luò) www.ksblcw.cn 點(diǎn)擊數(shù)：更新時(shí)間：2009/4/28 11:00:07

新站上線(xiàn)，最希望能夠盡快被搜索引擎收錄。只有收錄，才有后面的許許多多網(wǎng)站優(yōu)化。

一般來(lái)說(shuō)，Baidu對(duì)于新站是來(lái)者不拒，有很多都是濫竽充數(shù)，而Google相對(duì)較慢了，原因是Google對(duì)于新站都有一定的審核機(jī)制，防止一些新站利用黑帽網(wǎng)站優(yōu)化手段短時(shí)期內(nèi)即取得較好排名，這是一個(gè)最重要的可能原因。

當(dāng)然，我們并不希望搜索引擎收錄網(wǎng)站中的任何頁(yè)面。其中某些頁(yè)面——由于隱私、管理等等——并不希望被收錄。

當(dāng)搜索引擎來(lái)網(wǎng)站抓取頁(yè)面時(shí)，它們會(huì)先查看該站的robots.txt文件，以了解你所允許它抓取的范圍，包括哪些文件，哪些目錄。

正確的配置網(wǎng)站的robots.txt非常重要，錯(cuò)誤的配置會(huì)導(dǎo)致搜索引擎不能很好的收錄甚至無(wú)法收錄，這種案例現(xiàn)在仍有發(fā)生，有的博客建立以后長(zhǎng)達(dá)幾個(gè)月沒(méi)有被收錄。

各個(gè)搜索引擎都有自己的搜索機(jī)器人（Robots）在為他們工作，這些Robots在網(wǎng)絡(luò)上沿著網(wǎng)頁(yè)上的鏈接（一般是http和src鏈接）不斷抓取資料建立自己的數(shù)據(jù)庫(kù)，正是得益于這些機(jī)器人的勤勞工作，才有如此海量的數(shù)據(jù)供我們檢索。

下面是一些搜索引擎的機(jī)器人名稱(chēng)：

機(jī)器人名稱(chēng)	搜索引擎
Baiduspider	http://www.baidu.com
Googlebot	http://www.google.com/
MSNBOT	http://search.msn.com/
FAST-WebCrawler	http://www.alltheweb.com/
ia_archiver	http://www.alexa.com/
Scooter	http://www.altavista.com/
Slurp	http://www.inktomi.com

為了防止自己的網(wǎng)頁(yè)被搜索到，Robots開(kāi)發(fā)界提出了兩個(gè)方法：一個(gè)是robots.txt，另一個(gè)是The Robots META標(biāo)簽。

Robot.txt
簡(jiǎn)單的說(shuō)，Robot.txt就是一個(gè)純文本文檔，里面包含一些命令，當(dāng)Robots來(lái)網(wǎng)站時(shí)，就會(huì)首先檢查該網(wǎng)站上是否有Robot.txt，若有，則一般會(huì)根據(jù)這些命令來(lái)執(zhí)行；若無(wú)，則會(huì)自動(dòng)抓取網(wǎng)頁(yè)或網(wǎng)站。Robots.txt 文件應(yīng)放于網(wǎng)站根目錄下，并且該文件是可以通過(guò)互聯(lián)網(wǎng)進(jìn)行訪(fǎng)問(wèn)的。如Google的robot.txt：http://www.google.com/robots.txt

下面看一個(gè)具體的實(shí)例（#后面的內(nèi)容是為方便閱讀而設(shè)）：

# robots.txt file start

# Exclude Files From All Robots:

User-agent: *
Disallow: /security/
Disallow: /admin/
Disallow: /admin

# End robots.txt file

User-agent：用于描述搜索引擎蜘蛛的名字，在 Robots.txt 文件中，如果有多條User-agent記錄說(shuō)明有多個(gè)搜索引擎蜘蛛會(huì)受到該協(xié)議的限制，對(duì)該文件來(lái)說(shuō)，至少要有一條User-agent記錄。如果該項(xiàng)的值設(shè)為*，則該協(xié)議對(duì)任何搜索引擎蜘蛛均有效，在”Robots.txt 文件中，“User-agent:*”這樣的記錄只能有一條。

Disallow：就表示不允許蜘蛛訪(fǎng)問(wèn)，你可以根據(jù)自己的需要設(shè)立后面的目錄或者是文件，比如管理員后臺(tái)登陸的頁(yè)面或者目錄等。

Disallow: /admin/：是指允許搜索引擎蜘蛛抓取/admin.html，而不能抓取/admin/index.html。

Disallow: /admin：是指/admin.html 和/admin/index.html都不允許搜索引擎蜘蛛抓取。

下面有四個(gè)舉例：
例一：通過(guò)”/robots.txt”禁止所有搜索引擎蜘蛛抓取”/bin/cgi/”目錄，以及 “/tmp/”目錄和 /foo.html 文件，設(shè)置方法如下：
User-agent: *
Disallow: /bin/cgi/
Disallow: /tmp/
Disallow: /foo.html

例二：通過(guò)”/robots.txt”只允許某個(gè)搜索引擎抓取，而禁止其他的搜索引擎抓取。
如：只允許名為”slurp”的搜索引擎蜘蛛抓取，而拒絕其他的搜索引擎蜘蛛抓取 “/cgi/” 目錄下的內(nèi)容，設(shè)置方法如下：
User-agent: *
Disallow: /cgi/

User-agent: slurp
Disallow:

例三：禁止任何搜索引擎抓取我的網(wǎng)站，設(shè)置方法如下：
User-agent: *
Disallow: /

例四：只禁止某個(gè)搜索引擎抓取我的網(wǎng)站
如：只禁止名為“slurp”的搜索引擎蜘蛛抓取，設(shè)置方法如下：
User-agent: slurp
Disallow: /

Robots Meta標(biāo)簽
robot.txt主要是針對(duì)整個(gè)網(wǎng)站而言，相比之下，Robots Meta標(biāo)簽則是針對(duì)某個(gè)具體的網(wǎng)頁(yè)不希望被搜索到。

需要注意的是：上述的robots.txt和Robots META標(biāo)簽限制搜索引擎機(jī)器人（Robots）抓取站點(diǎn)內(nèi)容的辦法只是一種規(guī)則，需要搜索引擎機(jī)器人的配合才行，并不是每個(gè)Robots都遵守的，這方面百度似乎做得不是很好。

我們專(zhuān)注于：西安網(wǎng)站建設(shè),網(wǎng)站制作,網(wǎng)頁(yè)設(shè)計(jì),網(wǎng)站推廣,網(wǎng)站改版,網(wǎng)站維護(hù),域名注冊(cè),網(wǎng)站空間等服務(wù)
[西安玖佰網(wǎng)絡(luò)：http://www.ksblcw.cn/] 專(zhuān)業(yè)的西安做網(wǎng)站公司。

上一篇文章： web設(shè)計(jì)中巧妙地使用CSS選擇器

下一篇文章：有效增加網(wǎng)站反向鏈接和外部鏈接的方法

西安做網(wǎng)站 西安建網(wǎng)站電話(huà)：15339190980 / 029-85535950 Email：900c@163.com

西安網(wǎng)站建設(shè) 西安做網(wǎng)站公司 西安網(wǎng)站制作 西安做網(wǎng)站的公司