欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

Robots.txt協(xié)議的寫(xiě)法及屏蔽文件

2014-10-12    分類: 網(wǎng)站建設(shè)

網(wǎng)站的robots.txt文件設(shè)置是不是合理,哪些文件或許目錄需求屏蔽、哪些設(shè)置辦法對(duì)網(wǎng)站運(yùn)營(yíng)有優(yōu)點(diǎn)?有人復(fù)制出相同的內(nèi)容以應(yīng)付不同搜索引擎的排名規(guī)則。然而,一旦搜索引擎發(fā)現(xiàn)站內(nèi)有大量“克隆”的頁(yè)面,就會(huì)給以懲罰,不收錄這些重復(fù)的頁(yè)面。

另一方面,我們網(wǎng)站的內(nèi)容屬于個(gè)人私密文件,不想暴露在搜索引擎中。這時(shí),robot.txt就是為了解決這兩個(gè)問(wèn)題。

一、什么是robots.txt?



robots.txt 是網(wǎng)站和搜索引擎的協(xié)議的純文本文件。當(dāng)一個(gè)搜索引擎蜘蛛來(lái)訪問(wèn)站點(diǎn)時(shí),它首先爬行來(lái)檢查該站點(diǎn)根目錄下是否存在robots.txt,

如果存在,根據(jù)文件內(nèi)容來(lái)確定訪問(wèn)范圍,如果沒(méi)有,蜘蛛就沿著鏈接抓取。robots.txt 放在項(xiàng)目的根目錄下。

二、 robots.txt基本語(yǔ)法:

1) 、允許所有搜索引擎訪問(wèn)網(wǎng)站的所有部分

robots.txt寫(xiě)法如下:

User-agent: *

Disallow:

或者

User-agent: *

Allow: /

注意: 1. ****個(gè)英文要大寫(xiě),冒號(hào)是英文狀態(tài)下,冒號(hào)后面有一個(gè)空格,這幾點(diǎn)一定不能寫(xiě)錯(cuò)。

2) 、禁止所有搜索引擎訪問(wèn)網(wǎng)站的所有部分

robots.txt寫(xiě)法如下:

User-agent: *

Disallow: /

3) 、只需要禁止蜘蛛訪問(wèn)某個(gè)目錄,比如禁止admin、css、images等目錄被索引

robots.txt寫(xiě)法如下:

User-agent: *

Disallow: /css/

Disallow: /admin/

Disallow: /images/

注意:路徑后面有斜杠和沒(méi)有斜杠的區(qū)別:比如Disallow: /images/ 有斜杠是禁止抓取images整個(gè)文件夾,Disallow: /images 沒(méi)有斜杠意思是凡是路徑里面有/images關(guān)鍵詞的都會(huì)被屏蔽

4)、屏蔽一個(gè)文件夾/templets,但是又能抓取其中一個(gè)文件的寫(xiě)法:/templets/main

robots.txt寫(xiě)法如下:

User-agent: *

Disallow: /templets

Allow: /main

5)、 禁止訪問(wèn)/html/目錄下的所有以”.php”為后綴的URL(包含子目錄)

robots.txt寫(xiě)法如下:

User-agent: *

Disallow: /html/*.php


6)、 僅允許訪問(wèn)某目錄下某個(gè)后綴的文件,則使用“$”

robots.txt寫(xiě)法如下:

User-agent: *

Allow: .html$

Disallow: /

7)、禁止索引網(wǎng)站中所有的動(dòng)態(tài)頁(yè)面

比如這里限制的是有“?”的域名,例如index.php?id=1

robots.txt寫(xiě)法如下:

User-agent: *

Disallow: /*?*

8)、 禁止搜索引擎抓取我們網(wǎng)站上的所有圖片(如果你的網(wǎng)站使用其他后綴的圖片名稱,在這里也可以直接添加)

有些時(shí)候,我們?yōu)榱斯?jié)省服務(wù)器資源,需要禁止各類搜索引擎來(lái)索引我們網(wǎng)站上的圖片,這里的辦法除了使用“Disallow: /images/”這樣的直接屏蔽文件夾的方式之外,還 可以采取直接屏蔽圖片后綴名的方式。

robots.txt寫(xiě)法如下:

User-agent: *

Disallow: .jpg$

Disallow: .jpeg$

Disallow: .gif$

Disallow: .png$

Disallow: .bmp$

三、寫(xiě)robots.txt要注意的地方:

1)、 ****個(gè)英文要大寫(xiě),冒號(hào)是英文狀態(tài)下,冒號(hào)后面有一個(gè)空格,這幾點(diǎn)一定不能寫(xiě)錯(cuò)。

2.)、斜杠:/ 代表整個(gè)網(wǎng)站

3)、如果“/”后面多了一個(gè)空格,則屏蔽整個(gè)網(wǎng)站

4)、不要禁止正常的內(nèi)容

5)、生效時(shí)間是幾天到兩個(gè)月

四、robots.txt文件對(duì)網(wǎng)站優(yōu)化有什么作用?

1、疾速增加網(wǎng)站權(quán)重和拜訪量;

2、制止某些文件被查找引擎索引,能夠節(jié)約服務(wù)器帶寬和網(wǎng)站拜訪速度;

3、為查找引擎供給一個(gè)簡(jiǎn)潔明了的索引環(huán)境

五、哪些網(wǎng)站的目錄需求運(yùn)用robots.txt文件制止抓取?

1)、圖像目錄

圖像是構(gòu)成網(wǎng)站的首要組成元素。跟著現(xiàn)在建站越來(lái)越便利,許多cms的呈現(xiàn),真實(shí)做到了會(huì)打字就會(huì)建網(wǎng)站,而正是由于如此便利,網(wǎng)上呈現(xiàn)了許多的同質(zhì)化模板網(wǎng)站,被重復(fù)運(yùn)用,這樣的網(wǎng)站查找引擎是必定不喜愛(ài)的,就算是你的網(wǎng)站被錄入了,那你的作用也是很差的。若是你非要用這種網(wǎng)站的話,主張你大概在robots.txt文件中進(jìn)行屏蔽,一般的網(wǎng)站圖像目錄是:imags 或許 img;

2)、網(wǎng)站模板目錄

cms的強(qiáng)大和靈敏,也致使了許多同質(zhì)化的網(wǎng)站模板的呈現(xiàn)和亂用,高度的重復(fù)性模板在查找引擎中形成了一種冗余,且模板文件常常與生成文件高度類似,相同易形成相同內(nèi)容的呈現(xiàn)。對(duì)查找引擎很不友愛(ài),嚴(yán)峻的直接被查找引擎打入冷宮,不得翻身,許多cms有具有獨(dú)立的模板寄存目錄,因而,大概進(jìn)行模板目錄的屏蔽。一般模板目錄的文件目錄是:templets

3)、css、js目錄的屏蔽

css目錄文件在查找引擎的抓取中沒(méi)有用途,也無(wú)法供給有價(jià)值的信息。所以強(qiáng)烈主張?jiān)趓obots.txt文件中將其進(jìn)行屏蔽,以進(jìn)步查找引擎的索引質(zhì)量。為查找引擎供給一個(gè)簡(jiǎn)潔明了的索引環(huán)境更易晉升網(wǎng)站友愛(ài)性。css款式的目錄一般情況下是:css 或許 style,

js文件在查找引擎中無(wú)法進(jìn)行辨認(rèn),這里僅僅主張,能夠?qū)ζ溥M(jìn)行屏蔽,這樣做也有一個(gè)優(yōu)點(diǎn):為查找引擎供給一個(gè)簡(jiǎn)潔明了的索引環(huán)境;

4)、屏蔽雙頁(yè)面的內(nèi)容

這里拿dedecms來(lái)舉例吧。dedecms能夠運(yùn)用靜態(tài)和動(dòng)態(tài)url進(jìn)行同一篇內(nèi)容的拜訪,若是你生成全站靜態(tài)了,那你有必要屏蔽動(dòng)態(tài)地址的url連接。

這里有兩個(gè)優(yōu)點(diǎn):

①、查找引擎對(duì)靜態(tài)的url比動(dòng)態(tài)的url更友愛(ài)、更簡(jiǎn)單錄入;

②、避免靜態(tài)、動(dòng)態(tài)url能拜訪同一篇文章而被查找引擎判為重復(fù)內(nèi)容。這樣做對(duì)查找引擎友愛(ài)性來(lái)說(shuō)是有益無(wú)害的。

5)、模板緩存目錄

許多cms程序都有緩存目錄,這種緩存目錄的優(yōu)點(diǎn)我想不用說(shuō)我們也明白了吧,能夠十分有用的晉升網(wǎng)站的拜訪速度,削減網(wǎng)站帶寬,對(duì)用戶體會(huì)也是極好的。不過(guò),這樣的緩存目錄也有必定的缺陷,那就是會(huì)讓查找引擎進(jìn)行重復(fù)的抓取,一個(gè)網(wǎng)站中內(nèi)容重復(fù)也是大祭,對(duì)網(wǎng)站百害而無(wú)一利。許多運(yùn)用cms建站的兄弟都沒(méi)有注意到,有必要要導(dǎo)致注重。

6)、被刪去的目錄

死鏈過(guò)多,對(duì)查找引擎優(yōu)化來(lái)說(shuō),是喪命的。不能不導(dǎo)致站長(zhǎng)的高度注重,。在網(wǎng)站的開(kāi)展過(guò)程中,目錄的刪去和調(diào)整是不可避免的,若是你的網(wǎng)站當(dāng)時(shí)目錄不存在了,那有必要對(duì)此目錄進(jìn)行robots屏蔽,并回來(lái)正確的404過(guò)錯(cuò)頁(yè)面。

這里有一個(gè)爭(zhēng)議性的疑問(wèn),關(guān)于網(wǎng)站后臺(tái)辦理目錄是不是需求進(jìn)行屏蔽,其實(shí)這個(gè)可有可無(wú)。在能確保網(wǎng)站安全的情況下,若是你的網(wǎng)站運(yùn)營(yíng)規(guī)劃較小,就算網(wǎng)站目錄呈現(xiàn)在robots.txt文件中,也沒(méi)有多大疑問(wèn),這個(gè)我也見(jiàn)過(guò)許多網(wǎng)站這樣設(shè)置的;但若是你的網(wǎng)站運(yùn)營(yíng)規(guī)劃較大,對(duì)手過(guò)多,強(qiáng)烈主張千萬(wàn)別呈現(xiàn)網(wǎng)站后臺(tái)管理目錄的信息,以防被心懷叵測(cè)的人使用,危害你的利益;引擎越來(lái)越智能,關(guān)于網(wǎng)站的管理目錄仍是能極好的辨認(rèn),并拋棄索引的。別的,我們?cè)?a href="http://aaarwkj.com/" target="_blank">做網(wǎng)站后臺(tái)的時(shí)分,也能夠在頁(yè)面元標(biāo)簽中增加:進(jìn)行查找引擎的屏蔽抓取。

網(wǎng)頁(yè)題目:Robots.txt協(xié)議的寫(xiě)法及屏蔽文件
當(dāng)前URL:http://aaarwkj.com/news/12409.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供面包屑導(dǎo)航做網(wǎng)站、手機(jī)網(wǎng)站建設(shè)小程序開(kāi)發(fā)、用戶體驗(yàn)定制網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

微信小程序開(kāi)發(fā)
国产亚洲综合久久系列| 91久久精品91久久性色| 国产精品果亚洲av无人区一区| 中文字幕av在线有码| 亚洲一区欧美二区日韩| 国产成人精品免费视频大| 亚洲精品国产av成人网| 97视频在线观看观看| 国产不卡一区不卡二区| 熟妇人妻中文字幕在线| 欧美视频在线免费观看黄片| 亚洲国产精品一区一区 | 成年视频免费观看视频| 69人妻一区二区三区蜜桃| 成人日韩av免费在线观看| 国产亚洲精品免费视频| 说中文字幕的黄色大网站| 18岁未成年禁止观看视频| 日进去了啊内射视频| 成人午夜欧美熟妇小视频| 91在线视频国产网站| 日本在线人妻中文字幕| 妇女自拍偷自拍亚洲精品| 人妻少妇偷人精品免费看| 99精品热这里只有精品| 午夜福利中文字幕在线亚洲| 国产精品久久久久精品爆| 日韩黄色一级片在线观看| 国产精品久久久久久老熟女| 午夜日本大胆裸体艺术| 蜜臀国产午夜在线视频| 国产在线自拍一区二区| 日本成人大片在线观看| 亚洲一区乱码精品中文| 午夜少妇福利在线观看| 一区二区在线日韩视频| 伊人亚洲中文一区二区| 日本国产精品久久一线| 精华国产一区二区三区| 尤物视频最新在线观看| 久久精品中文字幕人妻|