本篇內(nèi)容主要講解“python數(shù)據(jù)分析之怎么用pandas搞定Excel表格”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學(xué)習“python數(shù)據(jù)分析之怎么用pandas搞定Excel表格”吧!
創(chuàng)新互聯(lián)于2013年創(chuàng)立,先為南丹等服務(wù)建站,南丹等地企業(yè),進行企業(yè)商務(wù)咨詢服務(wù)。為南丹企業(yè)網(wǎng)站制作PC+手機+微官網(wǎng)三網(wǎng)同步一站式服務(wù)解決您的所有建站問題。
接下來我們讀取三類文件csvtsvtxt文件,值得注意的是讀取這三類文件時使用的都是同一個方法,即pd.read_csv(file),在讀取時為excel表時需注意分隔符,使用參數(shù)sep=''來分隔。接下來我們一起看看在excel和pandas種如何操作的吧!
從excel中導(dǎo)入外部數(shù)據(jù)
導(dǎo)入csv文件時,分隔符選擇逗號即可。
導(dǎo)入tsv文件,分隔符選擇tab鍵
導(dǎo)入txt文件時,注意文本里是以什么符號分隔的,自定義分隔符。
在pandas中為無論是讀取csv文件還是tsv文件亦或者txt文件,都是用read_csv()的方法讀取,另外加上sep()參數(shù)來分隔。
import pandas as pd # 導(dǎo)入csv文件 test1 = pd.read_csv('./excel/test12.csv',index_col="ID") df1 = pd.DataFrame(test1) print(df1)
tab鍵用\t來表示
import pandas as pd # 導(dǎo)入tsv文件 test3 = pd.read_csv("./excel/test11.tsv",sep='\t') df3 = pd.DataFrame(test3) print(df3)
import pandas as pd # 導(dǎo)入txt文件 test2 = pd.read_csv("./excel/test13.txt",sep='|') df2 = pd.DataFrame(test2) print(df2)
結(jié)果:
在excel中存在多種數(shù)據(jù),且分為很多類型,這時使用數(shù)據(jù)透視表就會很方便也很直觀的為我們分析出各種我們想要的數(shù)據(jù)了。
實例:將下列數(shù)據(jù)繪制成一個透視表,并繪制出按總類分每年的銷售額!
需要按照年份來分,則我們需要將date列拆分,把年份拆分出來。隨后在數(shù)據(jù)欄下選擇數(shù)據(jù)透視表,選擇區(qū)域即可。
隨后將各部分數(shù)據(jù)拖動到各區(qū)域即可。
結(jié)果:
這樣就在excel中完成了數(shù)據(jù)透視表的制作。
那么在pandas中要怎么實現(xiàn)這一效果呢?
繪制透視表的函數(shù)為:df.pivot_lable(index,columns,values),最后將數(shù)據(jù)求和即可。
import pandas as pd import numpy as np pd.options.display.max_columns =999 test = pd.read_excel('./excel/test14.xlsx') df = pd.DataFrame(test) # 將年份取出并新建一個列名為年份的列 df['year'] = pd.DatetimeIndex(df['Date']).year # 繪制透視表 table = df.pivot_table(index='總類',columns='year',values='銷售額',aggfunc=np.sum) df1 = pd.DataFrame(table) df1['總計'] = df1[[2011,2012,2013,2014]].sum(axis=1) print(df1)
結(jié)果:
除此之外還可以利用groupby函數(shù)來繪制數(shù)據(jù)表。這里將總類和年份分組求銷售總額和銷售數(shù)量。
import pandas as pd import numpy as np pd.options.display.max_columns =999 test = pd.read_excel('./excel/test14.xlsx') df = pd.DataFrame(test) # 將年份取出并新建一個列名為年份的列 df['year'] = pd.DatetimeIndex(df['Date']).year # groupby方法 group = df.groupby(['總類','year']) s= group['銷售額'].sum() c = group['ID'].count() table = pd.DataFrame({'sum':s,'total':c}) print(table)
結(jié)果:
到此,相信大家對“python數(shù)據(jù)分析之怎么用pandas搞定Excel表格”有了更深的了解,不妨來實際操作一番吧!這里是創(chuàng)新互聯(lián)網(wǎng)站,更多相關(guān)內(nèi)容可以進入相關(guān)頻道進行查詢,關(guān)注我們,繼續(xù)學(xué)習!
網(wǎng)頁題目:python數(shù)據(jù)分析之怎么用pandas搞定Excel表格
網(wǎng)站鏈接:http://aaarwkj.com/article22/iggojc.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供虛擬主機、電子商務(wù)、、品牌網(wǎng)站設(shè)計、靜態(tài)網(wǎng)站、手機網(wǎng)站建設(shè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)