国产 直播 无码_中文字幕久精品免费_久久亚洲国产视频91视频_在线观看无码av网址

免費(fèi)注冊(cè) 登錄

超過(guò)1000,000域名在迅速網(wǎng)絡(luò)注冊(cè)

<    >

什么是robots文件?robots.txt文件的格式有哪些




什么是robots文件?robots.txt文件的格式有哪些?相信很多人都會(huì)有這樣疑問(wèn),下面
聚名網(wǎng)
為您詳解一下。

什么是robots文件?

Robots是站點(diǎn)與spider溝通的重要渠道,站點(diǎn)通過(guò)robots文件聲明本網(wǎng)站中不想被搜索引擎收錄的部分或者指定搜索引擎只收錄特定的部分。

9月11日,百度搜索robots全新升級(jí)。升級(jí)后robots將優(yōu)化對(duì)網(wǎng)站視頻URL收錄抓取情況。僅當(dāng)您的網(wǎng)站包含不希望被視頻搜索引擎收錄的內(nèi)容時(shí),才需要使用robots.txt文件。如果您希望搜索引擎收錄網(wǎng)站上所有內(nèi)容,請(qǐng)勿建立robots.txt文件。

如您的網(wǎng)站未設(shè)置robots協(xié)議,百度搜索對(duì)網(wǎng)站視頻URL的收錄將包含視頻播放頁(yè)URL,及頁(yè)面中的視頻文件、視頻周邊文本等信息,搜索對(duì)已收錄的短視頻資源將對(duì)用戶呈現(xiàn)為視頻極速體驗(yàn)頁(yè)。此外,綜藝影視類長(zhǎng)視頻,搜索引擎僅收錄頁(yè)面URL
robots.txt文件的格式有哪些

robots文件往往放置于根目錄下,包含一條或更多的記錄,這些記錄通過(guò)空行分開(kāi)(以CR,CR/NL, or NL作為結(jié)束符),每一條記錄的格式如下所示:

? ? ? ? ":"

?在該文件中可以使用#進(jìn)行注解,具體使用方法和UNIX中的慣例一樣。該文件中的記錄通常以一行或多行User-agent開(kāi)始,后面加上若干Disallow和Allow行,詳細(xì)情況如下:

User-agent:該項(xiàng)的值用于描述搜索引擎robot的名字。在"robots.txt"文件中,如果有多條User-agent記錄說(shuō)明有多個(gè)robot會(huì)受到"robots.txt"的限制,對(duì)該文件來(lái)說(shuō),至少要有一條User-agent記錄。如果該項(xiàng)的值設(shè)為*,則對(duì)任何robot均有效,在"robots.txt"文件中,

"User-agent:*"這樣的記錄只能有一條。如果在"robots.txt"文件中,加入"User-agent:SomeBot"和若干Disallow、Allow行,那么名為"SomeBot"只受到"User-agent:SomeBot"后面的 Disallow和Allow行的限制。

Disallow:該項(xiàng)的值用于描述不希望被訪問(wèn)的一組URL,這個(gè)值可以是一條完整的路徑,也可以是路徑的非空前綴,以Disallow項(xiàng)的值開(kāi)頭的URL不會(huì)被 robot訪問(wèn)。例如"Disallow:/help"禁止robot訪問(wèn)/help.html、/helpabc.html、/help/index.html,而"Disallow:/help/"則允許robot訪問(wèn)/help.html、/helpabc.html,不能訪問(wèn)/help/index.html。

"Disallow:"說(shuō)明允許robot訪問(wèn)該網(wǎng)站的所有url,在"/robots.txt"文件中,至少要有一條Disallow記錄。如果"/robots.txt"不存在或者為空文件,則對(duì)于所有的搜索引擎robot,該網(wǎng)站都是開(kāi)放的。

Allow:該項(xiàng)的值用于描述希望被訪問(wèn)的一組URL,與Disallow項(xiàng)相似,這個(gè)值可以是一條完整的路徑,也可以是路徑的前綴,以Allow項(xiàng)的值開(kāi)頭的URL 是允許robot訪問(wèn)的。例如"Allow:/hibaidu"允許robot訪問(wèn)/hibaidu.htm、/hibaiducom.html、/hibaidu/com.html。一個(gè)網(wǎng)站的所有URL默認(rèn)是Allow的,所以Allow通常與Disallow搭配使用,實(shí)現(xiàn)允許訪問(wèn)一部分網(wǎng)頁(yè)同時(shí)禁止訪問(wèn)其它所有URL的功能。

使用"*"and"$":Baiduspider支持使用通配符"*"和"$"來(lái)模糊匹配url。

"*" 匹配0或多個(gè)任意字符

"$" 匹配行結(jié)束符。

最后需要說(shuō)明的是:百度會(huì)嚴(yán)格遵守robots的相關(guān)協(xié)議,請(qǐng)注意區(qū)分您不想被抓取或收錄的目錄的大小寫(xiě),百度會(huì)對(duì)robots中所寫(xiě)的文件和您不想被抓取和收錄的目錄做精確匹配,否則robots協(xié)議無(wú)法生效。

以上就是對(duì)什么是robots文件?robots.txt文件的格式有哪些的全部介紹,如果您想了解更多
seo
知識(shí),請(qǐng)關(guān)注
聚名網(wǎng)
。

迅速域名注冊(cè)    2020-02-25 18:20:49



上一篇 (什么是索引量?百度索引量是什么意思)   下一篇 (為什么我的網(wǎng)站收錄量下降?網(wǎng)站收錄下降如何分析)


產(chǎn)品優(yōu)勢(shì)

迅速域名注冊(cè)始終以滿足顧客為己任

特點(diǎn)功能

為更多企業(yè)提供強(qiáng)有力的技術(shù)支持,助力業(yè)務(wù)飛速拓展

域名資訊

我們誠(chéng)心邀您分享我們的成長(zhǎng)經(jīng)歷

域名常見(jiàn)問(wèn)題

讓您進(jìn)一步深入了解域名常見(jiàn)問(wèn)題

合作伙伴

15年不間斷服務(wù),更值得信賴