如何理解R語言中的缺失值

這期內(nèi)容當(dāng)中小編將會給大家?guī)碛嘘P(guān)如何理解R語言中的缺失值，文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述，閱讀完這篇文章希望大家可以有所收獲。

汝州網(wǎng)站建設(shè)公司創(chuàng)新互聯(lián),汝州網(wǎng)站設(shè)計制作，有大型網(wǎng)站制作公司豐富經(jīng)驗。已為汝州上1000家提供企業(yè)網(wǎng)站建設(shè)服務(wù)。企業(yè)網(wǎng)站搭建\成都外貿(mào)網(wǎng)站制作要多少錢，請找那個售后服務(wù)好的汝州做網(wǎng)站的公司定做！

大部分統(tǒng)計方法都假定處理的是完整向量、矩陣、數(shù)據(jù)框，但是在大多數(shù)情況下，在處理真實數(shù)據(jù)之前不得不消除缺失值數(shù)據(jù)：（1）刪除含有缺失值的實例；（2）用合理的值替代缺失值。缺失值的處理主要用VIM和mice函數(shù)

VIM包提供哺乳動物數(shù)據(jù)（sleep），研究62種動物的睡眠、生物學(xué)變量和體質(zhì)變量是自變量或預(yù)測變量。

睡眠變量包含睡眠中做夢時長(Dream)、不做夢的時長(NonD)以及它們的和(Sleep)。體質(zhì)變量包括體重 (BodyWgt，單位為千 )、腦重 (BrainWgt，單位為 )、壽命 (Span，單位為年)和妊娠期(Gest，單位為天)。生物學(xué)變量包含物種被捕食的程度(Pred)、睡眠時暴露的程度 (Exp)和面臨的總危險程度(Danger）

處理缺失值的方法：

如何理解R語言中的缺失值

R語言中使用NA代表缺失值，NaN（不是一個數(shù)）代表不可能的值，符號Inf和-Inf代表正無窮和負(fù)無窮，函數(shù)is.na、is.nan()和is.infinite()分別識別缺失值、不可能值和無窮值，返回結(jié)果是TRUE或FALSE

如何理解R語言中的缺失值

> install.packages(c("VIM","mice"))

> data(sleep,package="VIM")

> sleep[complete.cases(sleep),]#列出沒有缺失值的行

此處省略一萬字.......

>sleep[complete.cases(sleep),]

BodyWgt BrainWgt NonD Dream Sleep Span Gest Pred Exp Danger

1 6654.000 5712.0 NA NA 3.3 38.6 645 3 5 3

3 3.385 44.5 NA NA 12.5 14.0 60 1 1 1

4 0.920 5.7 NA NA 16.5 NA 25 5 2 3

13 0.550 2.4 7.6 2.7 10.3 NA NA 2 1 2

14 187.100 419.0 NA NA 3.1 40.0 365 5 5 5

19 1.410 17.5 4.8 1.3 6.1 34.0 NA 1 2 1

20 60.000 81.0 12.0 6.1 18.1 7.0 NA 1 1 1

21 529.000 680.0 NA 0.3 NA 28.0 400 5 5 5

24 207.000 406.0 NA NA 12.0 39.3 252 1 4 1

26 36.330 119.5 NA NA 13.0 16.2 63 1 1 1

30 100.000 157.0 NA NA 10.8 22.4 100 1 1 1

31 35.000 56.0 NA NA NA 16.3 33 3 5 4

35 0.122 3.0 8.2 2.4 10.6 NA 30 2 1 1

36 1.350 8.1 8.4 2.8 11.2 NA 45 3 1 3

41 250.000 490.0 NA 1.0 NA 23.6 440 5 5 5

47 4.288 39.2 NA NA 12.5 13.7 63 2 2 2

53 14.830 98.2 NA NA 2.6 17.0 150 5 5 5

55 1.400 12.5 NA NA 11.0 12.7 90 2 2 2

56 0.060 1.0 8.1 2.2 10.3 3.5 NA 3 1 2

62 4.050 17.0 NA NA NA 13.0 38 3 1 1

> sum(is.na(sleep$Dream))#表明變量Dream有12個缺失值

[1] 12

> mean(is.na(sleep$Dream))#表19%比例在此變量上有缺失值[1] 0.1935484

> mean(!complete.cases(sleep))#數(shù)據(jù)集中32%實例有一個或多個缺失值

[1] 0.3225806

對于缺失值，必須牢記complete.cases（）函數(shù)僅NA和NAN缺失值識別，Inf和-Inf無窮值唄當(dāng)作有效值；必須使用缺失值函數(shù)來識別數(shù)據(jù)對象中缺失值，比如mydata==NA的邏輯是無法實現(xiàn)的。

上述就是小編為大家分享的如何理解R語言中的缺失值了，如果剛好有類似的疑惑，不妨參照上述分析進行理解。如果想知道更多相關(guān)知識，歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。

文章題目：如何理解R語言中的缺失值
本文網(wǎng)址：http://aaarwkj.com/article12/jejodc.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián)，為您提供響應(yīng)式網(wǎng)站、企業(yè)建站、自適應(yīng)網(wǎng)站、微信公眾號、動態(tài)網(wǎng)站、標(biāo)簽優(yōu)化

聲明：本網(wǎng)站發(fā)布的內(nèi)容（圖片、視頻和文字）以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主，如果涉及侵權(quán)請盡快告知，我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場，如需處理請聯(lián)系客服。電話：028-86922220；郵箱：631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載，或轉(zhuǎn)載時需注明來源：創(chuàng)新互聯(lián)

猜你還喜歡下面的內(nèi)容

欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

如何理解R語言中的缺失值