這篇文章主要講解了“怎么運(yùn)用Python進(jìn)行數(shù)據(jù)分析房地產(chǎn)市場(chǎng)”,文中的講解內(nèi)容簡(jiǎn)單清晰,易于學(xué)習(xí)與理解,下面請(qǐng)大家跟著小編的思路慢慢深入,一起來研究和學(xué)習(xí)“怎么運(yùn)用Python進(jìn)行數(shù)據(jù)分析房地產(chǎn)市場(chǎng)”吧!
創(chuàng)新互聯(lián)公司是一家專注于網(wǎng)站設(shè)計(jì)制作、網(wǎng)站設(shè)計(jì)與策劃設(shè)計(jì),朝陽縣網(wǎng)站建設(shè)哪家好?創(chuàng)新互聯(lián)公司做網(wǎng)站,專注于網(wǎng)站建設(shè)十年,網(wǎng)設(shè)計(jì)領(lǐng)域的專業(yè)建站公司;建站業(yè)務(wù)涵蓋:朝陽縣等地區(qū)。朝陽縣做網(wǎng)站價(jià)格咨詢:13518219792
土地市場(chǎng)數(shù)據(jù)一般會(huì)公示在當(dāng)?shù)氐?strong>公共資源交易中心,但經(jīng)常會(huì)出現(xiàn)只公示當(dāng)周或當(dāng)月數(shù)據(jù)的情況,因此,我們可以去找專業(yè)的土地網(wǎng)站獲取交易數(shù)據(jù)。
本文以土流網(wǎng)為例,這個(gè)網(wǎng)站結(jié)構(gòu)簡(jiǎn)單,簡(jiǎn)單的url翻頁構(gòu)造,然后用xpath解析數(shù)據(jù)即可。限于篇幅,爬蟲代碼不做贅述,僅提供核心代碼。
def main(): for page in range(1,46): #這里設(shè)置頁數(shù) url = 'https://www.tudinet.com/market-213-0-0-0/list-o1ctime-pg{}.html'.format(page) print(url) headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36', } response = requests.request("GET", url, headers = headers) #print(response.status_code) if response.status_code == 200: re = response.content.decode('utf-8') print("正在提取第" + str(page) + "頁") time.sleep(random.uniform(1,2)) print("-" * 80) # print(re) parse = etree.HTML(re) #解析網(wǎng)頁 items = parse.xpath('.//div[@class="land-l-cont"]/dl') parse_page(items) if len(items) < 10: print('獲取完成') break if __name__ == '__main__': time.sleep(random.uniform(1,2)) main()
運(yùn)行爬蟲代碼,提取到廣州1238塊土地?cái)?shù)據(jù)。以下為簡(jiǎn)單清洗后部分?jǐn)?shù)據(jù):
土地成交狀態(tài)
近10年廣州土地招拍掛成交情況
2011年至2016年廣州市土地招拍掛成交土地較少,2016年成交規(guī)劃建筑面積僅為77.30萬㎡。2017年以后成交規(guī)模開始步入高潮,2018年成交規(guī)劃建筑面積達(dá)到1635.50萬㎡。
2019年以來廣州土地招拍掛成交面積(萬㎡)
近10年來廣州成交土地主要以工業(yè)用地、其他用地和住宅用地為主,工業(yè)用地占比高達(dá)41.19%,這也是廣州工業(yè)企業(yè)發(fā)達(dá)的重要?jiǎng)右颉?/p>
土地成交區(qū)域
近10年廣州各區(qū)土地招拍掛成交面積(萬㎡)
從成交區(qū)域來看,南沙區(qū)和番禺區(qū)各年都有一定土地成交,越秀區(qū)和天河區(qū)成交土地較少。2020年以來,南沙區(qū)土地市場(chǎng)火熱,成交面積遠(yuǎn)高于廣州其他地區(qū)。
房產(chǎn)市場(chǎng)分析主要包括新房和二手房交易市場(chǎng),由于一般的房產(chǎn)信息發(fā)布平臺(tái)二手房數(shù)量遠(yuǎn)大于新房,為盡可能獲取更大樣本數(shù)據(jù),提高分析的準(zhǔn)確性,本文以廣州二手房成交數(shù)據(jù)進(jìn)行房產(chǎn)市場(chǎng)分析。
本文通過Python獲取房天下公布的廣州二手房成交數(shù)據(jù)。房天下的爬蟲也較為簡(jiǎn)單,爬蟲邏輯類似貝殼找房,唯一需要注意的是當(dāng)遍歷完一個(gè)子地區(qū)后跳轉(zhuǎn)下一個(gè)子地區(qū)的處理。以下給出核心代碼:
def main(): #增城a080;番禺a(chǎn)078;南沙a084;花都a0639;白云a076;海珠a074;越秀a072;荔灣a071;天河a073;從化a079;黃埔a075 district_list = ['a084', 'a078','a080', 'a0639','a076', 'a074','a072', 'a071','a073', 'a079','a075'] #地區(qū) for district in district_list: for page in range(1,101): #這里設(shè)置頁數(shù) url = 'https://gz.esf.fang.com/chengjiao-{0}/i3{1}/'.format(district, page) print(url) headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36', } response = requests.request("GET", url, headers = headers) if response.status_code == 200: re = response.content.decode('utf-8') print("正在提取" + district +'第' + str(page) + "頁") time.sleep(random.uniform(1,2)) print("-" * 80) # print(re) parse = etree.HTML(re) # 解析網(wǎng)頁 items = parse.xpath('.//div[@name="div_houselist"]/dl') parse_page(items) if len(items) < 30: #遍歷完子地區(qū)后跳轉(zhuǎn) print('獲取完成') break if __name__ == '__main__': time.sleep(random.uniform(1,2)) main()
代碼運(yùn)行幾分鐘就提取下22170套廣州二手房數(shù)據(jù),簡(jiǎn)單清洗后部分?jǐn)?shù)據(jù)展示如下:
量?jī)r(jià)走勢(shì)
近5年廣州二手房量?jī)r(jià)走勢(shì)
2020年1月至6月,廣州二手房均價(jià)與2019年基本持平。從成交量來看,2月份受疫情影響僅成交70套二手房,3月份以來,疫情逐漸得到控制,房產(chǎn)市場(chǎng)向好,6月份成交二手房1337套。
房?jī)r(jià)分布
2020年上半年廣州各區(qū)二手房均價(jià)(元/㎡)
從樓盤成交來看,2020年1月至6月廣州二手房成交數(shù)量最多的樓盤為位于增城區(qū)的錦繡天倫花園,共計(jì)成交78套,成交均價(jià)為18565.40元/㎡。
相關(guān)性分析
import pandas as pd import matplotlib.pyplot as plt import matplotlib as mpl import seaborn as sns %matplotlib inline sns.set_style('white') #設(shè)置圖形背景樣式為白色 df = pd.read_excel("D:\data\地產(chǎn)數(shù)據(jù)分析\廣州二手房.xlsx") df = df[['室','廳','面積(㎡)','層數(shù)','成交單價(jià)(元/㎡)']] #選擇需要的列 df.rename(columns={'室': 'room', '廳': 'hall', '面積(㎡)': 'area', '層數(shù)': 'floor', '成交單價(jià)(元/㎡)': 'price'}, inplace=True) fig,axes=plt.subplots(1,2,figsize=(12,5)) sns.regplot(x= 'room',y='price',data=df,color='r',marker='+',ax=axes[0]) sns.regplot(x='hall',y='price',data=df,color='g',marker='*',ax=axes[1])
感謝各位的閱讀,以上就是“怎么運(yùn)用Python進(jìn)行數(shù)據(jù)分析房地產(chǎn)市場(chǎng)”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對(duì)怎么運(yùn)用Python進(jìn)行數(shù)據(jù)分析房地產(chǎn)市場(chǎng)這一問題有了更深刻的體會(huì),具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是創(chuàng)新互聯(lián),小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章,歡迎關(guān)注!
當(dāng)前名稱:怎么運(yùn)用Python進(jìn)行數(shù)據(jù)分析房地產(chǎn)市場(chǎng)
本文網(wǎng)址:http://aaarwkj.com/article36/pdejpg.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供ChatGPT、網(wǎng)站導(dǎo)航、做網(wǎng)站、動(dòng)態(tài)網(wǎng)站、企業(yè)建站、網(wǎng)站排名
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)