无遮挡色视频真人免费-国产男女性潮高清免费网站-久久国产精品二国产精品-色老二导航

專注抖音視頻、谷歌推廣20年
證券簡稱:思億歐 證券代碼:839255
1對1的貼心服務13603054593

您當前的位置:首頁 >> SEO知識 >> 網(wǎng)站幫助

搜索引擎的Robots協(xié)議

發(fā)布時間:2020-06-22 00:52:50瀏覽次數(shù):

Robots協(xié)議是Web站點和搜索引擎爬蟲交互的一種方式,Robots.txt是存放在站點根目錄下的一個純文本文件。該文件可以指定搜索引擎爬蟲只抓取指定的內(nèi)容,或者是禁止搜索引擎爬蟲抓取網(wǎng)站的部分或全部內(nèi)容。當一個搜索引擎爬蟲訪問一個站點時,它會首先檢查該站點根目錄下是否存在robots.txt,如果存在,搜索引擎爬蟲就會按照該文件中的內(nèi)容來確定訪問的范圍;如果該文件不存在,那么搜索引擎爬蟲就沿著鏈接抓取。

另外,robots.txt必須放置在一個站點的根目錄下,而且文件名必須全部小寫。

如果搜索引擎爬蟲要訪問的網(wǎng)站地址是http://www.w3.org/,那么robots.txt文件必須能夠通過http://www.w3.org/robots.txt打開并看到里面的內(nèi)容。

具體使用格式如下:

(1)User-agent:

用于描述搜索引擎爬蟲的名字。在Robots.txt文件中,如果有多條User-agent記錄,說明有多個搜索引擎爬蟲會受到該協(xié)議的限制,對該文件來說,至少要有一條User-agent記錄。如果該項的值設為*,則該協(xié)議對任何搜索引擎爬蟲均有效,在Robots.txt文件中,“User-agent:*”這樣的記錄只能有一條。

(2)Disallow:

用于描述不希望被訪問到的一個URL。這個URL可以是一條完整的路徑,也可以是部分路徑,任何以Disallow開頭的URL均不會被Robot訪問到。

下面舉例來說明robots.txt的具體用法:

【例1】通過/robots.txt禁止所有搜索引擎爬蟲抓取/bin/cgi/目錄,以及/tmp/目錄和/foo.html文件,設置方法如下:

User-agent:*

Disallow:/bin/cgi/

Disallow:/tmp/

Disallow:/foo.html

【例2】通過/robots.txt只允許某個搜索引擎抓取,而禁止其他的搜索引擎抓取。如:只允許名為slurp的搜索引擎爬蟲抓取,而拒絕其他的搜索引擎爬蟲抓取/cgi/目錄下的內(nèi)容,設置方法如下:

User-agent:*

Disallow:/cgi/

User-agent:slurp

Disallow:

【例3】禁止任何搜索引擎抓取我的網(wǎng)站,設置方法如下:

User-agent:*

Disallow:/

【例4】只禁止某個搜索引擎抓取我的網(wǎng)站。如:只禁止名為slurp的搜索引擎蜘蛛抓取,設置方法如下:

User-agent:slurp

Disallow:/

搜索引擎爬蟲必須要遵守Robots協(xié)議并執(zhí)行Web站點的要求。因此搜索引擎爬蟲需要有一個分析Robots協(xié)議的模塊,并嚴格按照Robots協(xié)議的規(guī)定抓取Web主機允許訪問的目錄和網(wǎng)頁。

當然,Robots.txt只是一個協(xié)議,如果搜索引擎爬蟲的設計者不遵循這個協(xié)議,網(wǎng)站管理員也無法阻止搜索引擎爬蟲對于某些頁面的訪問,但一般的搜索引擎爬蟲都會遵循這些協(xié)議,而且網(wǎng)站管理員還可以通過其他方式來拒絕網(wǎng)絡蜘蛛對某些網(wǎng)頁的抓取。

搜索引擎爬蟲在下載網(wǎng)頁的時候,會去識別網(wǎng)頁的HTML代碼,在其代碼部分會有META標識。通過這些標識,可以告訴搜索引擎爬蟲本網(wǎng)頁是否需要被抓取,還可以告訴搜索引擎爬蟲本網(wǎng)頁中的鏈接是否需要被繼續(xù)跟蹤。例如:表示本網(wǎng)頁不需要被抓取,但是網(wǎng)頁內(nèi)的鏈接需要被跟蹤。

現(xiàn)在一般的網(wǎng)站都希望搜索引擎能更全面地抓取自己網(wǎng)站的網(wǎng)頁,因為這樣可以讓更多的訪問者能通過搜索引擎找到此網(wǎng)站。為了讓本網(wǎng)站的網(wǎng)頁更全面地被抓取到,網(wǎng)站管理員可以建立一個網(wǎng)站地圖,即Site Map。許多搜索引擎爬蟲會把sitemap.html文件作為一個網(wǎng)站網(wǎng)頁爬取的入口,網(wǎng)站管理員可以把網(wǎng)站內(nèi)部所有網(wǎng)頁的鏈接放在這個文件里面,那么搜索引擎爬蟲可以很方便地把整個網(wǎng)站抓取下來,避免遺漏某些網(wǎng)頁,也會減小對網(wǎng)站服務器的負擔。

聯(lián)系我們
地址:深圳市龍崗區(qū) 龍城大道85號萬科龍崗云中心16層
13603054593
版權(quán)所有:深圳市西企網(wǎng)科技有限公司|抖音短視頻推廣_抖音短視頻運營_深圳SEO公司,技巧,效果怎么樣 粵ICP備15110110號
X

截屏,微信識別二維碼

微信號:13603054593

(點擊微信號復制,添加好友)

打開微信

主站蜘蛛池模板: 性欧美丰满熟妇xxxx性| 国产精品日韩欧美一区二区三区 | 亚洲精品无码乱码成人| 中文字幕日韩一区二区三区不卡| 欧美一区二区三区成人片在线| 亚洲人成在线观看| 国产真人作爱免费视频道歉| 中文字幕亚洲欧美专区| 日韩高清在线中文字带字幕| 久别的草原在线影院观看中文| 看av免费毛片手机播放| 国产熟女高潮视频| 成人小说亚洲一区二区三区| 亚洲精品无码专区在线在线播放| 吃奶呻吟打开双腿做受视频| 7777精品伊人久久久大香线蕉| 免费a级毛片无码a∨男男| 好大好硬好爽免费视频| 日本边添边摸边做边爱边| 欧洲女同同性videos| 久久综合精品国产丝袜长腿| 国产成人无码区免费网站| 亚洲av无码不卡在线播放| 蜜臀av在线播放| 国产精品无码专区在线观看| 国产精品色内内在线播放| 伊人久久一区二区三区无码| 亚洲欧美中文字幕日韩一区二区| 全免费a级毛片免费看无码| 免费a级毛片无码视频| 久久无码字幕中文久久无码| 成人精品视频一区二区| 欧美xxxx18性欧美| 亚洲xxxx做受欧美| 色偷偷88888欧美精品久久久| 永久黄网站色视频免费直播| 亚洲国产激情一区二区三区| 人妻夜夜爽天天爽三区麻豆av网站 | 最近2018中文字幕在线高清第一页 | 上司揉捏人妻丰满双乳电影| 久久精品亚洲精品国产色婷|