這篇文章主要講解了“怎么用Python爬取天氣并且語言播報(bào)”,文中的講解內(nèi)容簡(jiǎn)單清晰,易于學(xué)習(xí)與理解,下面請(qǐng)大家跟著小編的思路慢慢深入,一起來研究和學(xué)習(xí)“怎么用Python爬取天氣并且語言播報(bào)”吧!
公司主營(yíng)業(yè)務(wù):做網(wǎng)站、網(wǎng)站設(shè)計(jì)、移動(dòng)網(wǎng)站開發(fā)等業(yè)務(wù)。幫助企業(yè)客戶真正實(shí)現(xiàn)互聯(lián)網(wǎng)宣傳,提高企業(yè)的競(jìng)爭(zhēng)能力。創(chuàng)新互聯(lián)建站是一支青春激揚(yáng)、勤奮敬業(yè)、活力青春激揚(yáng)、勤奮敬業(yè)、活力澎湃、和諧高效的團(tuán)隊(duì)。公司秉承以“開放、自由、嚴(yán)謹(jǐn)、自律”為核心的企業(yè)文化,感謝他們對(duì)我們的高要求,感謝他們從不同領(lǐng)域給我們帶來的挑戰(zhàn),讓我們激情的團(tuán)隊(duì)有機(jī)會(huì)用頭腦與智慧不斷的給客戶帶來驚喜。創(chuàng)新互聯(lián)建站推出石景山免費(fèi)做網(wǎng)站回饋大家。
一、 預(yù)備知識(shí)
此案例實(shí)現(xiàn)功能:利用網(wǎng)絡(luò)爬蟲,爬取某地的天氣,并打印和語音播報(bào) 。 要用到requests庫,lxml庫,pyttsx3庫,沒有的,可以先安裝一下,都可以通過pip安裝:
pip install requests pip install lxml pip install pyttsx3
Requests庫是個(gè)功能很強(qiáng)大的網(wǎng)絡(luò)請(qǐng)求庫,可以實(shí)現(xiàn)跟瀏覽器一樣發(fā)送各種HTTP請(qǐng)求來獲取網(wǎng)站的數(shù)據(jù)。
Lxml庫是處理XML和HTML功能最豐富,最易于使用的庫,通常用lxml庫中的etree使HTML轉(zhuǎn)化為文檔。
Pyttsx3庫是一個(gè)很簡(jiǎn)單的播放語音的庫,你給它什么,它就讀什么,當(dāng)然別在意生硬的語氣。 基本用法如下:
import pyttsx3 word = pyttsx3.init() word.say('你好') # 關(guān)鍵一句,沒有這行代碼,不會(huì)播放語音 word.runAndWait()
碼字不易廢話兩句:有需要學(xué)習(xí)資料的或者有技術(shù)問題交流可以私信小編發(fā)送“01”即可
爬蟲是爬取網(wǎng)頁的相關(guān)內(nèi)容,了解HTML能夠幫助你更好的理解網(wǎng)頁的結(jié)構(gòu)、內(nèi)容等。 TCP/IP協(xié)議,HTTP協(xié)議這些知識(shí)了解一下就可以,能夠讓你了解在網(wǎng)絡(luò)請(qǐng)求和網(wǎng)絡(luò)傳輸上的基本原理,這次的小案例用不到。
二、 詳細(xì)說一說
2.1. get請(qǐng)求目標(biāo)網(wǎng)址
我們首先導(dǎo)入requests庫,然后就用它來獲取目標(biāo)的網(wǎng)頁,我們請(qǐng)求的是天氣網(wǎng)站中的北京天氣。
import requests # 向目標(biāo)url地址發(fā)送請(qǐng)求,返回一個(gè)response對(duì)象 req = requests.get('https://www.tianqi.com/beijing/') # .text是response對(duì)象的網(wǎng)頁html print(req.text)
打印出的結(jié)果就是網(wǎng)站上顯示的內(nèi)容,瀏覽器就是通過這些內(nèi)容“解析”出來我們看到的結(jié)構(gòu)如下:
我們請(qǐng)求后的獲得的數(shù)據(jù)
注意啦,小伙伴們有很大可能運(yùn)行之后得不到網(wǎng)頁代碼,而是顯示403,這是什么意思呢?
403錯(cuò)誤是一種在網(wǎng)站訪問過程中,常見的錯(cuò)誤提示,表示資源不可用。服務(wù)器理解客戶的請(qǐng)求,但拒絕處理它。
我們寫的爬蟲一般會(huì)默認(rèn)告訴服務(wù)器,自己發(fā)送一個(gè)Python爬取請(qǐng)求,而很多的網(wǎng)站都會(huì)設(shè)置反爬蟲的機(jī)制,不允許被爬蟲訪問的。
所以,我們想讓目標(biāo)服務(wù)器響應(yīng),那就把我們的爬蟲進(jìn)行一下偽裝。此小案例就用常用的更改User-Agent字段進(jìn)行偽裝。
改一下之前的代碼,將爬蟲偽裝成瀏覽器請(qǐng)求,這樣就可以進(jìn)行正常的訪問了。
import requests headers = {'content-type':'application/json', 'User-Agent':'Mozilla/5.0 (Xll; Ubuntu; Linux x86_64; rv:22.0) Gecko/20100101 Firefox/22.0'} # 向目標(biāo)url地址發(fā)送請(qǐng)求,返回一個(gè)response對(duì)象 req = requests.get('https://www.tianqi.com/beijing/',headers=headers) # .text是response對(duì)象的網(wǎng)頁html print(req.text)
User-Agent字段怎么來的呢?我們以Chrome瀏覽器為例子,先隨便打開一個(gè)網(wǎng)頁,按鍵盤的F12或在空白處點(diǎn)擊鼠標(biāo)右鍵選擇“檢查”;然后刷新網(wǎng)頁,點(diǎn)擊“Network”再點(diǎn)擊“Doc”,點(diǎn)擊Headers,在信息欄查看Request Headers的User-Agent字段,直接復(fù)制,咱們就可以用啦。
2.2. lxml.etree登場(chǎng)
我們從網(wǎng)頁請(qǐng)求獲得的數(shù)據(jù)繁雜,其中只有一部分是我們真正想得到的數(shù)據(jù),例如我們從天氣的網(wǎng)站中查看北京的天氣,只有下圖中使我們想要得到的,我們?nèi)缛绾翁崛∧?這就要用到lxml.etree。
整個(gè)代碼中只有一小部分我們想要的信息,我們發(fā)現(xiàn)想要的天氣、溫度啊都在“class='weather_info'”這一層級(jí)下,那這就好辦了。我們?cè)谡?qǐng)求的代碼的后面加上:
html_obj = etree.HTML(html) html_data = html_obj.xpath("//d1[@class='weather_info']//text()")
我們print(html_data)一下看看提取是不是我們想要的數(shù)據(jù)。
發(fā)現(xiàn)連網(wǎng)頁中換行符啊什么的也都提取出來了,還有,別忘了,提取出來的是列表哦。我們還要做一下處理。
word = "歡迎使用天氣播報(bào)助手" for data in html_data: word += data
處理完我們打印一下看看,嗯,我們想要的都有了。不過還多了一個(gè)[切換城市],我們精益求精,最后把這個(gè)最后再去掉。
2.3. 把結(jié)果說出來
我們想要的數(shù)據(jù)都在word變量里啦,現(xiàn)在就讓他讀出來,用pyttsx3這個(gè)庫,
ptt = pyttsx3.init() ptt.say(word) ptt.runAndWait()
好的,現(xiàn)在都已完成。 我們一步一步都摸索過來,現(xiàn)在整合在一起,最后播放效果還是不錯(cuò)的,這是一次很美好的爬蟲之旅,期待下次爬取!
感謝各位的閱讀,以上就是“怎么用Python爬取天氣并且語言播報(bào)”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對(duì)怎么用Python爬取天氣并且語言播報(bào)這一問題有了更深刻的體會(huì),具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是創(chuàng)新互聯(lián),小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章,歡迎關(guān)注!
本文名稱:怎么用Python爬取天氣并且語言播報(bào)
本文來源:http://aaarwkj.com/article48/pdeghp.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供搜索引擎優(yōu)化、Google、做網(wǎng)站、網(wǎng)站排名、外貿(mào)網(wǎng)站建設(shè)、網(wǎng)站營(yíng)銷
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)