日本少妇高潮久久久久久_东京热一区二区三区无码视频_国内精品人妻久久毛片app_男人撕开奶罩揉吮奶头视频_少妇交换做爰做到高潮_睡错了人妻公h_国产男女猛烈无遮挡a片漫画_男女啪啪做爰高潮全过有多钱_国产猛男猛女超爽免费视频

Categories


Tags


robots.txt文件的格式

robots文件往往放置于根目錄下,包含一條或更多的記錄,這些記錄通過(guò)空行分開(kāi)(以CR,CR/NL, or NL作為結(jié)束符),每一條記錄的格式如下所示:

"<field>:<optional space><value><optionalspace>"

在該文件中可以使用#進(jìn)行注解,具體使用方法和UNIX中的慣例一樣。該文件中的記錄通常以一行或多行User-agent開(kāi)始,后面加上若干Disallow和Allow行,詳細(xì)情況如下:

User-agent:該項(xiàng)的值用于描述搜索引擎robot的名字。在"robots.txt"文件中,如果有多條User-agent記錄說(shuō)明有多個(gè)robot會(huì)受到"robots.txt"的限制,對(duì)該文件來(lái)說(shuō),至少要有一條User-agent記錄。如果該項(xiàng)的值設(shè)為*,則對(duì)任何robot均有效,在"robots.txt"文件中,"User-agent:*"這樣的記錄只能有一條。如果在"robots.txt"文件中,加入"User-agent:SomeBot"和若干Disallow、Allow行,那么名為"SomeBot"只受到"User-agent:SomeBot"后面的 Disallow和Allow行的限制。

Disallow:該項(xiàng)的值用于描述不希望被訪問(wèn)的一組URL,這個(gè)值可以是一條完整的路徑,也可以是路徑的非空前綴,以Disallow項(xiàng)的值開(kāi)頭的URL不會(huì)被 robot訪問(wèn)。例如"Disallow:/help"禁止robot訪問(wèn)/help.html、/helpabc.html、/help/index.html,而"Disallow:/help/"則允許robot訪問(wèn)/help.html、/helpabc.html,不能訪問(wèn)/help/index.html。"Disallow:"說(shuō)明允許robot訪問(wèn)該網(wǎng)站的所有url,在"/robots.txt"文件中,至少要有一條Disallow記錄。如果"/robots.txt"不存在或者為空文件,則對(duì)于所有的搜索引擎robot,該網(wǎng)站都是開(kāi)放的。

Allow:該項(xiàng)的值用于描述希望被訪問(wèn)的一組URL,與Disallow項(xiàng)相似,這個(gè)值可以是一條完整的路徑,也可以是路徑的前綴,以Allow項(xiàng)的值開(kāi)頭的URL 是允許robot訪問(wèn)的。例如"Allow:/hibaidu"允許robot訪問(wèn)/hibaidu.htm、/hibaiducom.html、/hibaidu/com.html。一個(gè)網(wǎng)站的所有URL默認(rèn)是Allow的,所以Allow通常與Disallow搭配使用,實(shí)現(xiàn)允許訪問(wèn)一部分網(wǎng)頁(yè)同時(shí)禁止訪問(wèn)其它所有URL的功能。

使用"*"and"$":Baiduspider支持使用通配符"*"和"$"來(lái)模糊匹配url。

"*" 匹配0或多個(gè)任意字符

"$" 匹配行結(jié)束符。

最后需要說(shuō)明的是:百度會(huì)嚴(yán)格遵守robots的相關(guān)協(xié)議,請(qǐng)注意區(qū)分您不想被抓取或收錄的目錄的大小寫(xiě),百度會(huì)對(duì)robots中所寫(xiě)的文件和您不想被抓取和收錄的目錄做精確匹配,否則robots協(xié)議無(wú)法生效。

robots.txt文件用法舉例

來(lái)源:百度搜索資源平臺(tái) 百度搜索學(xué)堂


Public @ 2012-09-17 16:08:56

相對(duì)路徑的優(yōu)點(diǎn)和缺點(diǎn)

相對(duì)路徑的優(yōu)點(diǎn)和缺點(diǎn): 優(yōu)點(diǎn): 1. 相對(duì)路徑相對(duì)于當(dāng)前目錄,因此可以方便地指向同一目錄下的其他文件或目錄。 2. 相對(duì)路徑比絕對(duì)路徑更短,更易于輸入和閱讀。 3. 相對(duì)路徑的可移植性更強(qiáng),因?yàn)樗鼈儾灰蕾?lài)于特定的文件系統(tǒng)或服務(wù)器配置。 缺點(diǎn): 1. 如果文件或目錄被移動(dòng)到其他目錄中,相對(duì)路徑可能無(wú)法正常工作。 2. 對(duì)于嵌套較深的目錄結(jié)構(gòu),相對(duì)路徑會(huì)變得較復(fù)雜。 3. 如果有多個(gè)文件夾中命名相

Public @ 2023-04-06 11:50:12

什么是死鏈接?

簡(jiǎn)單地講,死鏈接指原來(lái)正常,后來(lái)失效的鏈接。死鏈接發(fā)送請(qǐng)求時(shí),服務(wù)器返回404錯(cuò)誤頁(yè)面。在這些情況下出現(xiàn)死鏈接:動(dòng)態(tài)鏈接在數(shù)據(jù)庫(kù)不再支持的條件下,變成死鏈接。某個(gè)文件或網(wǎng)頁(yè)移動(dòng)了位置,導(dǎo)致指向它的鏈接變成死鏈接。網(wǎng)頁(yè)內(nèi)容更新并換成其他的鏈接,原來(lái)的鏈接變成死鏈接。網(wǎng)站服務(wù)器設(shè)置錯(cuò)誤。從用戶的角度來(lái)看,死鏈接和錯(cuò)誤鏈接的表現(xiàn)是一樣的,所以一般我們并不需要區(qū)別死鏈接和錯(cuò)誤鏈接。作為SEO人員或網(wǎng)站管理

Public @ 2021-12-09 15:56:17

搜索問(wèn)答劇場(chǎng)【七】“robots文件”常見(jiàn)問(wèn)題解析

哈嘍大家好!【搜索問(wèn)答劇場(chǎng)】最新一集如期而至,平小雕又帶著滿滿的知識(shí)干貨回來(lái)啦!準(zhǔn)備好迎接知識(shí)的洗禮了嘛?第五集【搜索問(wèn)答劇場(chǎng)】中,跟大家提到了【Robots】工具。本期就來(lái)詳細(xì)教大家如何靈活地使用【Robots】工具,以及如何正確設(shè)置網(wǎng)站整體的抓取范圍。一、了解robots文件1、Q:什么是robots文件?A:robots文件用于指定spider在網(wǎng)站上的抓取范圍,在文件中可以聲明網(wǎng)站中不想被

Public @ 2015-05-15 15:16:25

頭條搜索Robots匹配說(shuō)明

頭條搜索Robots匹配說(shuō)明是指在頭條搜索過(guò)程中,搜索引擎會(huì)先根據(jù)用戶的搜索關(guān)鍵詞和搜索歷史等信息,匹配出相關(guān)內(nèi)容并展示給用戶。而在這個(gè)過(guò)程中,搜索引擎會(huì)使用一種名為Robots的自動(dòng)化程序來(lái)對(duì)網(wǎng)站進(jìn)行定期的抓取和索引,以保持搜索結(jié)果的實(shí)時(shí)性和準(zhǔn)確性。Robots程序會(huì)自動(dòng)遵循搜索引擎協(xié)議和規(guī)則,對(duì)網(wǎng)站進(jìn)行掃描和抓取,同時(shí)遵循相關(guān)網(wǎng)站的robots.txt文件中的規(guī)則來(lái)限制抓取行為。因此,網(wǎng)站發(fā)布

Public @ 2023-06-11 03:50:12

更多您感興趣的搜索

0.662728s