欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

DataFrame基礎(chǔ)運(yùn)算以及空值填充的案例分析-創(chuàng)新互聯(lián)

這篇文章主要介紹DataFrame基礎(chǔ)運(yùn)算以及空值填充的案例分析,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!

為莆田等地區(qū)用戶提供了全套網(wǎng)頁(yè)設(shè)計(jì)制作服務(wù),及莆田網(wǎng)站建設(shè)行業(yè)解決方案。主營(yíng)業(yè)務(wù)為成都網(wǎng)站制作、做網(wǎng)站、莆田網(wǎng)站設(shè)計(jì),以傳統(tǒng)方式定制建設(shè)網(wǎng)站,并提供域名空間備案等一條龍服務(wù),秉承以專業(yè)、用心的態(tài)度為用戶提供真誠(chéng)的服務(wù)。我們深信只要達(dá)到每一位用戶的要求,就會(huì)得到認(rèn)可,從而選擇與我們長(zhǎng)期合作。這樣,我們也可以走得更遠(yuǎn)!

數(shù)據(jù)對(duì)齊

我們可以計(jì)算兩個(gè)DataFrame的加和,pandas會(huì)自動(dòng)將這兩個(gè)DataFrame進(jìn)行數(shù)據(jù)對(duì)齊,如果對(duì)不上的數(shù)據(jù)會(huì)被置為Nan(not a number)。

首先我們來(lái)創(chuàng)建兩個(gè)DataFrame:

import numpy as npimport pandas as pddf1 = pd.DataFrame(np.arange(9).reshape((3, 3)), columns=list('abc'), index=['1', '2', '3'])df2 = pd.DataFrame(np.arange(12).reshape((4, 3)), columns=list('abd'), index=['2', '3', '4', '5'])復(fù)制代碼

得到的結(jié)果和我們?cè)O(shè)想的一致,其實(shí)只是通過(guò)numpy數(shù)組創(chuàng)建DataFrame,然后指定index和columns而已,這應(yīng)該算是很基礎(chǔ)的用法了。

然后我們將兩個(gè)DataFrame相加,會(huì)得到:

我們發(fā)現(xiàn)pandas將兩個(gè)DataFrame加起來(lái)合并了之后,凡是沒(méi)有在兩個(gè)DataFrame都出現(xiàn)的位置就會(huì)被置為Nan。這其實(shí)是很有道理的,實(shí)際上不只是加法,我們可以計(jì)算兩個(gè)DataFrame的加減乘除的四則運(yùn)算都是可以的。如果是計(jì)算兩個(gè)DataFrame相除的話,那么除了對(duì)應(yīng)不上的數(shù)據(jù)會(huì)被置為Nan之外,除零這個(gè)行為也會(huì)導(dǎo)致異常值的發(fā)生(可能不一定是Nan,而是inf)。

fill_value

如果我們要對(duì)兩個(gè)DataFrame進(jìn)行運(yùn)算,那么我們當(dāng)然不會(huì)希望出現(xiàn)空值。這個(gè)時(shí)候就需要對(duì)空值進(jìn)行填充了,我們直接使用運(yùn)算符進(jìn)行運(yùn)算是沒(méi)辦法傳遞參數(shù)進(jìn)行填充的,這個(gè)時(shí)候我們需要使用DataFrame當(dāng)中為我們提供的算術(shù)方法

DataFrame當(dāng)中常用的運(yùn)算符有這么幾種:

add、sub、p這些我們都很好理解,那么這里的radd、rsub方法又是什么意思呢,為什么前面要加上一個(gè)r呢?

看起來(lái)費(fèi)解,但是說(shuō)白了一文不值,radd是用來(lái)翻轉(zhuǎn)參數(shù)的。舉個(gè)例子,比如說(shuō)我們希望得到DataFrame當(dāng)中所有元素的倒數(shù),我們可以寫成1 / df。由于1本身并不是一個(gè)DataFrame,所以我們不能用1來(lái)呼叫DataFrame當(dāng)中的方法,也就不能傳遞參數(shù),為了解決這種情況,我們可以把1 / df寫成df.rp(1),這樣我們就可以在其中傳遞參數(shù)了。

由于在算除法的過(guò)程當(dāng)中發(fā)生了除零,所以我們得到了一個(gè)inf,它表示無(wú)窮大。

我們可以在add、p這些方法當(dāng)中傳入一個(gè)fill_value的參數(shù),這個(gè)參數(shù)可以在計(jì)算之前對(duì)于一邊出現(xiàn)缺失值的情況進(jìn)行填充。也就是說(shuō)對(duì)于對(duì)于只在一個(gè)DataFrame中缺失的位置會(huì)被替換成我們指定的值,如果在兩個(gè)DataFrame都缺失,那么依然還會(huì)是Nan

我們對(duì)比下結(jié)果就能發(fā)現(xiàn)了,相加之后的(1, d), (4, c)以及(5, c)的位置都是Nan,因?yàn)閐f1和df2兩個(gè)DataFrame當(dāng)中這些位置都是空值,所以沒(méi)有被填充。

fill_value這個(gè)參數(shù)在很多api當(dāng)中都有出現(xiàn),比如reindex等,用法都是一樣的,我們?cè)诓殚哸pi文檔的時(shí)候可以注意一下。

那么對(duì)于這種填充了之后還出現(xiàn)的空值我們應(yīng)該怎么辦呢?難道只能手動(dòng)找到這些位置進(jìn)行填充嗎?當(dāng)然是不現(xiàn)實(shí)的,pandas當(dāng)中還為我們提供了專門解決空值的api。

空值api

在填充空值之前,我們首先要做的是發(fā)現(xiàn)空值。針對(duì)這個(gè)問(wèn)題,我們有isna這個(gè)api,它會(huì)返回一個(gè)bool型的DataFrame,DataFrame當(dāng)中的每一個(gè)位置表示了原DataFrame對(duì)應(yīng)的位置是否是空值。

dropna

當(dāng)然只是發(fā)現(xiàn)是否是空值肯定是不夠的,我們有時(shí)候會(huì)希望不要空值的出現(xiàn),這個(gè)時(shí)候我們可以選擇drop掉空值。針對(duì)這種情況,我們可以使用DataFrame當(dāng)中的dropna方法。

我們發(fā)現(xiàn)使用了dropna之后,出現(xiàn)了空值的行都被拋棄了。只保留了沒(méi)有空值的行,有時(shí)候我們希望拋棄是的列而不是行,這個(gè)時(shí)候我們可以通過(guò)傳入axis參數(shù)進(jìn)行控制。

這樣我們得到的就是不含空值的列,除了可以控制行列之外,我們還可以控制執(zhí)行drop的嚴(yán)格程度。我們可以通過(guò)how這個(gè)參數(shù)來(lái)判斷,how支持兩種值傳入,一種是'all',一種是'any'。all表示只有在某一行或者是某一列全為空值的時(shí)候才會(huì)拋棄,any與之對(duì)應(yīng)就是只要出現(xiàn)了空值就會(huì)拋棄。默認(rèn)不填的話認(rèn)為是any,一般情況下我們也用不到這個(gè)參數(shù),大概有個(gè)印象就可以了。

fillna

pandas除了可以drop含有空值的數(shù)據(jù)之外,當(dāng)然也可以用來(lái)填充空值,事實(shí)上這也是最常用的方法。

我們可以很簡(jiǎn)單地傳入一個(gè)具體的值用來(lái)填充:

fillna會(huì)返回一個(gè)新的DataFrame,其中所有的Nan值會(huì)被替換成我們指定的值。如果我們不希望它返回一個(gè)新的DataFrame,而是直接在原數(shù)據(jù)進(jìn)行修改的話,我們可以使用inplace參數(shù),表明這是一個(gè)inplace的操作,那么pandas將會(huì)在原DataFrame上進(jìn)行修改。

df3.fillna(3, inplace=True)復(fù)制代碼

除了填充具體的值以外,我們也可以和一些計(jì)算結(jié)合起來(lái)算出來(lái)應(yīng)該填充的值。比如說(shuō)我們可以計(jì)算出某一列的均值、大值、最小值等各種計(jì)算來(lái)填充。fillna這個(gè)函數(shù)不僅可以使用在DataFrame上,也可以使用在Series上,所以我們可以針對(duì)DataFrame中的某一列或者是某些列進(jìn)行填充:

除了可以計(jì)算出均值、大最小值等各種值來(lái)進(jìn)行填充之外,還可以指定使用缺失值的前一行或者是后一行的值來(lái)填充。實(shí)現(xiàn)這個(gè)功能需要用到method這個(gè)參數(shù),它有兩個(gè)接收值,ffill表示用前一行的值來(lái)進(jìn)行填充,bfill表示使用后一行的值填充。

我們可以看到,當(dāng)我們使用ffill填充的時(shí)候,對(duì)于第一行的數(shù)據(jù)來(lái)說(shuō)由于它沒(méi)有前一行了,所以它的Nan會(huì)被保留。同樣當(dāng)我們使用bfill的時(shí)候,最后一行也無(wú)法填充。

以上是DataFrame基礎(chǔ)運(yùn)算以及空值填充的案例分析的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司行業(yè)資訊頻道!

當(dāng)前題目:DataFrame基礎(chǔ)運(yùn)算以及空值填充的案例分析-創(chuàng)新互聯(lián)
分享地址:http://aaarwkj.com/article36/copssg.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供品牌網(wǎng)站建設(shè)、網(wǎng)站設(shè)計(jì)、網(wǎng)頁(yè)設(shè)計(jì)公司、微信小程序、網(wǎng)站導(dǎo)航、ChatGPT

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)

綿陽(yáng)服務(wù)器托管
日韩欧美一区亚洲一区| 久久综合婷婷亚洲五月| 精品国产美女主播在线| 亚洲av网站一区二区三区| 日韩黄色免费在线观看| 日本成人一区二区在线播放| av一区二区三区不卡在线看| 亚洲精品一区二区三区不卡| 久久亚洲一本综合久久| 成人在线一区二区三区观看| 漂亮人妻中文字幕av| 欧美精品色精品免费观看| 国产欧美高清在线观看视频 | 黄色片黄色片美女黄色片亚洲黄色片 | 久久综合给合综合久久| 五月天亚洲综合小说网| 欧美日韩精品人妻一区| 禁区正片免费看完整国产| 日韩午夜电影一区二区三区| 亚洲区一区二区三区亚洲| 国产熟女肥臀精品国产馆乱| 久久亚洲女同第一区综合| 久久国产精品99久久久| 国产精品久久亚洲一区二区 | 中文字幕欧美人妻在线| 久久夜色噜噜噜av一区| 欧美成人精品三级在线网站| 欧美性生活真实的视频| 亚洲高清成人在线观看| 99国产综合精品女| 亚洲欧美激情啪啪啪| 亚洲三级伦理中文字幕| 日本午夜激情一区二区| av免费观看日韩永久| 永久免费成人在线视频| 黄片视频免费在线观看播放| 日韩精品在线观看电影 | 亚洲男人天堂av电影| 国产传媒在线免费播放| 亚洲福利一区二区在线| 一区二区少妇黄色三区|