欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

如何使用Python分析全國所有必勝客餐廳-創(chuàng)新互聯(lián)

本篇文章給大家分享的是有關(guān)如何使用 Python 分析全國所有必勝客餐廳,小編覺得挺實用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

在揚州等地區(qū),都構(gòu)建了全面的區(qū)域性戰(zhàn)略布局,加強(qiáng)發(fā)展的系統(tǒng)性、市場前瞻性、產(chǎn)品創(chuàng)新能力,以專注、極致的服務(wù)理念,為客戶提供成都做網(wǎng)站、成都網(wǎng)站建設(shè)、成都外貿(mào)網(wǎng)站建設(shè) 網(wǎng)站設(shè)計制作按需求定制制作,公司網(wǎng)站建設(shè),企業(yè)網(wǎng)站建設(shè),成都品牌網(wǎng)站建設(shè),全網(wǎng)整合營銷推廣,成都外貿(mào)網(wǎng)站建設(shè),揚州網(wǎng)站建設(shè)費用合理。

我講到如何爬取必勝客官網(wǎng)中全國各大城市餐廳的信息。雖然餐廳數(shù)據(jù)信息被抓取下來,但是數(shù)據(jù)一直在硬盤中“躺尸”。不曾記得,自己已經(jīng)第 n 次這么做了。說到這里,要追溯到自己的大學(xué)時光。

自己從大學(xué)開始就接觸 Python,當(dāng)時是自己的好奇心很強(qiáng)烈。好奇為什么 Python 不需要瀏覽器就能抓取網(wǎng)站數(shù)據(jù)。內(nèi)心感嘆到,這簡直是太妙了。自己為了體驗這種抓取數(shù)據(jù)的樂趣,所以寫了很多的爬蟲程序。

隨著自己知識面地拓展,自己了解到數(shù)據(jù)分析這領(lǐng)域。自己從而才知道爬取到的數(shù)據(jù),原來背后還隱藏的一些信息。自己也是在學(xué)習(xí)這方面的相關(guān)知識。這篇文章算是數(shù)據(jù)分析的處女稿,主要內(nèi)容是從數(shù)據(jù)中提取出必勝客餐廳的一些信息。

01環(huán)境搭建

百度前端技術(shù)部開源一個基于 Javascript 的數(shù)據(jù)可視化圖表庫。其名字為 ECharts。它算是前端數(shù)據(jù)可視化的利器,能提供直觀,生動,可交互,可個性化定制的數(shù)據(jù)可視化圖表。

國內(nèi)有個大神突發(fā)奇想,這么好用的庫如果能和 Python 結(jié)合起來就好了。于是乎,pyecharts 庫就應(yīng)運而生。因此,pyecharts 的作用是用于生成 Echarts 圖表的類庫。本文中的所有圖標(biāo),自己都是利用 pyecharts 生成的。

安裝該庫也很簡單,使用 pip 方式安裝。

pip install pyecharts
02數(shù)據(jù)清洗

數(shù)據(jù)清洗工作是數(shù)據(jù)分析必不可少的步驟。這一步是為了清洗一些臟數(shù)據(jù)。因為可能網(wǎng)站本身就有空數(shù)據(jù),或者匹配抓取網(wǎng)站信息時,有些混亂的數(shù)據(jù)。這些都需要清除掉。

我之前是將數(shù)據(jù)寫到一個 json 文件中,我先將數(shù)據(jù)讀取出來。然后把 json 文本數(shù)據(jù)轉(zhuǎn)化為字典類型。

def get_datas():
    """ 從文件中獲取數(shù)據(jù) """
    file_name = 'results.json'
    with open(file_name, 'r', encoding='UTF-8') as file:
        content = file.read()
        data = json.loads(content, encoding='UTF-8')
        # print(data)
    return data

接著對字典進(jìn)行遍歷, 統(tǒng)計每個城市的餐廳總數(shù)。

def count_restaurants_sum(data):
    """ 對字典進(jìn)行遍歷, 統(tǒng)計每個城市的餐廳總數(shù) """
    results = {}
    for key, value in data.items():
        results[key] = len(value)
        # print(key, len(value))
    return results

再將字典中的每個 key-value 轉(zhuǎn)化為元組,然后根據(jù) value 進(jìn)行倒序排序。

restaurants_sum = sorted(restaurants_sum.items(), key=lambda item: item[1], reverse=True)

最后根據(jù)顯示結(jié)果,手動刪除一些臟數(shù)據(jù)。

def clean_datas(data):
    """
    清除臟數(shù)據(jù)。
    經(jīng)過分析發(fā)現(xiàn) ('新區(qū)', 189), ('南區(qū)', 189), ('朝陽', 56) 是臟數(shù)據(jù), 必勝客官網(wǎng)的地區(qū)選項中就有這三個名字
    [('新區(qū)', 189), ('上海市', 189), ('南區(qū)', 189), ('北京市', 184), ('深圳', 95),
     ('廣州', 86), ('杭州', 78), ('天津市', 69), ('朝陽', 56), ('蘇州', 54)]
    """
    data.remove(('新區(qū)', 189))
    data.remove(('南區(qū)', 189))
    data.remove(('朝陽', 56))
    return data

到此,數(shù)據(jù)工作已經(jīng)完成。

03數(shù)據(jù)分析

我們已經(jīng)拿到了經(jīng)過清洗的數(shù)據(jù),我們簡單對數(shù)據(jù)進(jìn)行打印,然后繪制直方圖。

def render_top10():
    """
    繪制直方圖顯示 全國必勝客餐廳總數(shù) Top 10 的城市
    根據(jù)清洗過后數(shù)據(jù)的結(jié)果, Top 城市如下
    ('上海市', 189), ('北京市', 184), ('深圳', 95), ('廣州', 86), ('杭州', 78),
    ('天津市', 69), ('蘇州', 54), ('西安', 52), ('武漢', 51), ('成都', 48)
    """
    attr = ["上海", "北京", "深圳", "廣州", "杭州", "天津", "蘇州", "西安", "武漢", "成都"]
    values = [189, 184, 95, 86, 78, 69, 54, 52, 51, 48]
    bar = Bar("全國各大城市必勝客餐廳數(shù)量排行榜")
    bar.add("總數(shù)", attr, values, is_stack=True, is_more_utils=True)
    bar.render("render_bar.html")

繪制出來的結(jié)果如下:

如何使用 Python 分析全國所有必勝客餐廳

不難看出,一線城市擁有必勝客的餐廳數(shù)比較多,省會城市擁有餐廳數(shù)要比非省會城市要多。

我們繼續(xù)繪制餅狀圖,看看北上廣深的餐廳數(shù)在全國的占比。

def render_top10_percent():
    """
    繪制餅狀圖 顯示北上廣深餐廳數(shù)在全國中的比例
    """
    configure(global_theme='macarons')
    attr = ["上海", "北京", "深圳", "廣州", "其他城市"]
    value = [189, 184, 95, 86, 1893]  # 根據(jù) count_other_sum() 計算出來的
    pie = Pie("北上廣深餐廳數(shù)的占比")
    pie.add("", attr, value, is_label_show=True, is_more_utils=True)
    pie.render("render_pie.html")

繪制出來的結(jié)果如下:

如何使用 Python 分析全國所有必勝客餐廳

從數(shù)據(jù)上看,北上廣深的餐廳數(shù)占據(jù)全國餐廳數(shù)的 22.64%。其他二三線城市共占據(jù) 77.36%。說明必勝客餐廳不僅主打大城市路線,還往二三四線城市發(fā)展,擴(kuò)展領(lǐng)域。

以上就是如何使用 Python 分析全國所有必勝客餐廳,小編相信有部分知識點可能是我們?nèi)粘9ぷ鲿姷交蛴玫降摹OM隳芡ㄟ^這篇文章學(xué)到更多知識。更多詳情敬請關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司行業(yè)資訊頻道。

名稱欄目:如何使用Python分析全國所有必勝客餐廳-創(chuàng)新互聯(lián)
標(biāo)題來源:http://aaarwkj.com/article4/jcjie.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供外貿(mào)建站網(wǎng)站維護(hù)、網(wǎng)站制作、虛擬主機(jī)、搜索引擎優(yōu)化、自適應(yīng)網(wǎng)站

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)

網(wǎng)站建設(shè)網(wǎng)站維護(hù)公司
天天日天天天干夜夜操| av剧情免费在线观看| 国产亚洲一区二区自拍视频| 精品人妻少妇一区二区三区| 亚洲精品日韩国产3区| 中文字幕制服日韩久久一区| 成年人午夜在线观看网址 | 国产精品久久久99| 亚洲天堂av在线观看| 日本一区二区不卡二区| 日韩有码高清av在线| 毛片精品一区二区二区三区| 一区二区三区免费在线观看视频| 亚洲熟女av一区少妇| 亚洲精品综合在线二区| 国产日韩欧美 一区二区三区| 91九色国产成人久久精品| 国产av剧情日韩精品| 深夜日本福利在线观看| 国产中文字幕乱码中文| 91人妻互换一区二区| 日本中文字幕一区在线观看| 不卡视频一区中文字幕| 久久综合伊人欧美精品| 九九热在线视频观看最新| 亚洲三级av在线播放| 禁止18岁以下的视频| av熟女一区二区三区| 免费在线观看欧美色妇| 国产日韩综合精品一区| 人人看男人的天堂东京| 国产精品专区日产一区| 久久精品久久久精品| 又黄又爽又刺激的性视频| 另类激情综合在线观看| 欧美三级特黄在线播放| 亚洲另类欧美日韩中文字幕| 中午字幕人妻少妇久久| 精品一区无遮挡免费网站| 国产真实乱偷精品视频免| 久久国产精品人妻av|