這篇文章給大家介紹如何使用User Agent和代理IP隱藏身份,內(nèi)容非常詳細(xì),感興趣的小伙伴們可以參考借鑒,希望對(duì)大家能有所幫助。
10年積累的成都網(wǎng)站建設(shè)、做網(wǎng)站經(jīng)驗(yàn),可以快速應(yīng)對(duì)客戶對(duì)網(wǎng)站的新想法和需求。提供各種問題對(duì)應(yīng)的解決方案。讓選擇我們的客戶得到更好、更有力的網(wǎng)絡(luò)服務(wù)。我雖然不認(rèn)識(shí)你,你也不認(rèn)識(shí)我。但先網(wǎng)站設(shè)計(jì)后付款的網(wǎng)站建設(shè)流程,更有萬載免費(fèi)網(wǎng)站建設(shè)讓你可以放心的選擇與我們合作。
一、為何要設(shè)置User Agent
有一些網(wǎng)站不喜歡被爬蟲程序訪問,所以會(huì)檢測(cè)連接對(duì)象,如果是爬蟲程序,也就是非人點(diǎn)擊訪問,它就會(huì)不讓你繼續(xù)訪問,所以為了要讓程序可以正常運(yùn)行,需要隱藏自己的爬蟲程序的身份。此時(shí),我們就可以通過設(shè)置User Agent的來達(dá)到隱藏身份的目的,User Agent的中文名為用戶代理,簡(jiǎn)稱UA。
User Agent存放于Headers中,服務(wù)器就是通過查看Headers中的User Agent來判斷是誰在訪問。在Python中,如果不設(shè)置User Agent,程序?qū)⑹褂媚J(rèn)的參數(shù),那么這個(gè)User Agent就會(huì)有Python的字樣,如果服務(wù)器檢查User Agent,那么沒有設(shè)置User Agent的Python程序?qū)o法正常訪問網(wǎng)站。
Python允許我們修改這個(gè)User Agent來模擬瀏覽器訪問,它的強(qiáng)大毋庸置疑。
二、常見的User Agent
1.Android
Mozilla/5.0 (Linux; Android 4.1.1; Nexus 7 Build/JRO03D) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.166 Safari/535.19
Mozilla/5.0 (Linux; U; Android 4.0.4; en-gb; GT-I9300 Build/IMM76D) AppleWebKit/534.30 (KHTML, like Gecko) Version/4.0 Mobile Safari/534.30
Mozilla/5.0 (Linux; U; Android 2.2; en-gb; GT-P1000 Build/FROYO) AppleWebKit/533.1 (KHTML, like Gecko) Version/4.0 Mobile Safari/533.1
2.Firefox
Mozilla/5.0 (Windows NT 6.2; WOW64; rv:21.0) Gecko/20100101 Firefox/21.0
Mozilla/5.0 (Android; Mobile; rv:14.0) Gecko/14.0 Firefox/14.0
3.Google Chrome
Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/27.0.1453.94 Safari/537.36
Mozilla/5.0 (Linux; Android 4.0.4; Galaxy Nexus Build/IMM76B) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.133 Mobile Safari/535.19
4.iOS
Mozilla/5.0 (iPad; CPU OS 5_0 like Mac OS X) AppleWebKit/534.46 (KHTML, like Gecko) Version/5.1 Mobile/9A334 Safari/7534.48.3
Mozilla/5.0 (iPod; U; CPU like Mac OS X; en) AppleWebKit/420.1 (KHTML, like Gecko) Version/3.0 Mobile/3A101a Safari/419.3
上面列舉了Andriod、Firefox、Google Chrome、iOS的一些User Agent,直接copy就能用。
四、IP代理的使用
1.為何使用IP代理
UA已經(jīng)設(shè)置好了,但是還應(yīng)該考慮一個(gè)問題,程序的運(yùn)行速度是很快的,如果我們利用一個(gè)爬蟲程序在網(wǎng)站爬取東西,一個(gè)固定IP的訪問頻率就會(huì)很高,這不符合人為操作的標(biāo)準(zhǔn),因?yàn)槿瞬僮鞑豢赡茉趲譵s內(nèi),進(jìn)行如此頻繁的訪問。所以一些網(wǎng)站會(huì)設(shè)置一個(gè)IP訪問頻率的閾值,如果一個(gè)IP訪問頻率超過這個(gè)閾值,說明這個(gè)不是人在訪問,而是一個(gè)爬蟲程序。
.代理IP選取
在寫代碼之前,先在代理IP網(wǎng)站選好一個(gè)IP地址,這里推介億牛云代理。他們家產(chǎn)品比較齊全,api接口調(diào)用和動(dòng)態(tài)轉(zhuǎn)發(fā)調(diào)用都支持,而且代理是自營(yíng)線路,電信專線。我穩(wěn)定性,可用性,速度嗎,延遲都是非常好的。這里就展示下他們的動(dòng)態(tài)轉(zhuǎn)發(fā)代理進(jìn)行示例,動(dòng)態(tài)轉(zhuǎn)發(fā)就是他們會(huì)提供一個(gè)固定的ip地址給你,,直接配置到程序里面就可以使用,不需要自己去調(diào)用ip,也不需要自己管理ip池,使用起來超級(jí)方便簡(jiǎn)單,對(duì)于懶人來說絕對(duì)是最好的選擇。
代碼示例,這里是以python為例子
1、Python?
requests
#! -*- encoding:utf-8 -*-
import requests
import random
# 要訪問的目標(biāo)頁面
targetUrl = "http://httpbin.org/ip"
# 要訪問的目標(biāo)HTTPS頁面
# targetUrl = "https://httpbin.org/ip"
# 代理服務(wù)器
proxyHost = "t.16yun.cn"
proxyPort = "31111"
# 代理隧道驗(yàn)證信息
proxyUser = "username"
proxyPass = "password"
proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {
"host" : proxyHost,
"port" : proxyPort,
"user" : proxyUser,
"pass" : proxyPass,
}
# 設(shè)置 http和https訪問都是用HTTP代理
proxies = {
"http" : proxyMeta,
"https" : proxyMeta,
}
# 設(shè)置IP切換頭
tunnel = random.randint(1,10000)
headers = {"Proxy-Tunnel": str(tunnel)}
resp = requests.get(targetUrl, proxies=proxies, headers=headers)
print resp.status_code
print resp.text
關(guān)于如何使用User Agent和代理IP隱藏身份就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到。
新聞標(biāo)題:如何使用UserAgent和代理IP隱藏身份
新聞來源:http://aaarwkj.com/article16/ijpsdg.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供小程序開發(fā)、品牌網(wǎng)站建設(shè)、商城網(wǎng)站、python、品牌網(wǎng)站制作、外貿(mào)網(wǎng)站建設(shè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)