本篇文章給大家分享的是有關(guān)R語(yǔ)言入門及描述性統(tǒng)計(jì)分析的方法是什么,小編覺(jué)得挺實(shí)用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說(shuō),跟著小編一起來(lái)看看吧。
站在用戶的角度思考問(wèn)題,與客戶深入溝通,找到右江網(wǎng)站設(shè)計(jì)與右江網(wǎng)站推廣的解決方案,憑借多年的經(jīng)驗(yàn),讓設(shè)計(jì)與互聯(lián)網(wǎng)技術(shù)結(jié)合,創(chuàng)造個(gè)性化、用戶體驗(yàn)好的作品,建站類型包括:成都網(wǎng)站設(shè)計(jì)、網(wǎng)站制作、企業(yè)官網(wǎng)、英文網(wǎng)站、手機(jī)端網(wǎng)站、網(wǎng)站推廣、申請(qǐng)域名、虛擬主機(jī)、企業(yè)郵箱。業(yè)務(wù)覆蓋右江地區(qū)。
今天要給大家講講R語(yǔ)言,主要是入門基礎(chǔ)及簡(jiǎn)單的統(tǒng)計(jì)分析入門。
R語(yǔ)言其實(shí)算是我正式接觸編程語(yǔ)言的第一門語(yǔ)言,大學(xué)學(xué)的C++,matlab簡(jiǎn)直是水到家了。所以剛開(kāi)始學(xué)R語(yǔ)言的時(shí)候,我很痛苦,你知道嗎。大約經(jīng)歷了1個(gè)月的磨合期,逐漸對(duì)R有了點(diǎn)認(rèn)識(shí),知道怎么去學(xué)了,都有哪些東西,當(dāng)然最開(kāi)始還是找度娘,看什么書,怎么安裝等等之類的abc的問(wèn)題。和大多數(shù)人學(xué)習(xí)的入門書籍一樣,我也是從《R語(yǔ)言實(shí)戰(zhàn)》這本書開(kāi)始的,但是現(xiàn)在看來(lái),我覺(jué)得這本書,只需要看前7章的內(nèi)容就可以了,因?yàn)楹竺娴氖巧婕暗骄唧w模型的內(nèi)容,如果你沒(méi)有一個(gè)具體的實(shí)際問(wèn)題去解決的話,學(xué)了也作用不大,畢竟我們不是為了考試。好了,先扯這么多,下面進(jìn)入正題。
# 如何使用R
## 安裝
Windows
下載地址:
https://mirrors.tuna.tsinghua.edu.cn/CRAN/bin/windows/
Windows的安裝比較簡(jiǎn)單了,.exe文件,基本都是next就ok了。
需要說(shuō)的是,有時(shí)候我們需要使用某個(gè)package的時(shí)候,R報(bào)錯(cuò)說(shuō)不支持當(dāng)前R版本,這時(shí)候,就需要安裝比較老的R版本,這里給一個(gè)舊版本的R鏈接,需要哪個(gè)版本的可以直接下。
https://cran.r-project.org/bin/windows/base/old/
還有一個(gè)問(wèn)題,就是怎么更新R,現(xiàn)在R的最新版本是3.4.1.那么當(dāng)下一個(gè)版本出來(lái)的時(shí)候,怎么更新呢。最笨的辦法就是下載新版本,然后把舊版本卸載了。但是當(dāng)你使用了一段時(shí)間R以后,必然會(huì)安裝很多個(gè)packages,R安裝包并不大,但是加上packages的話,總共就很大了,我記得我最多的時(shí)候,安裝了好幾百個(gè)packages。這里要教大家一招是,在卸載R之前,把R安裝目錄中的library文件夾先復(fù)制出來(lái)另存,然后安裝完新版本的R以后,在把其中的文件復(fù)制到新安裝的library文件夾下面。一般在windows中,R的安裝目錄默認(rèn)為:
C:\ProgramFiles\R\R-3.4.0\library
然后是怎么在Ubuntu中安裝,也可以參考文檔:
https://mirrors.tuna.tsinghua.edu.cn/CRAN/bin/linux/ubuntu/README.html
依次執(zhí)行下面三條命令,就ok了。
sudo apt-get update
sudo apt-get install r-base
sudo apt-get install r-base-dev
然后,在Ubuntu中安裝完R之后,直接在shell里面輸入R,就會(huì)進(jìn)入到R環(huán)境中,但是這樣寫代碼是很累的,所以這里推薦大家使用Sublim Text 作為R的Ubuntu中的IDE。環(huán)境搭建也很簡(jiǎn)單,主要是安裝SublimeREPL這個(gè)拓展包,在sublim中快捷鍵Ctrl+shift+P輸入install,會(huì)出來(lái)install package,然后輸入SublimeREPL就可以安裝了。安裝完了以后,在
Preferences > Package Settings >SublimeREPL > Settings-User
輸入以下內(nèi)容:
{
"default_extend_env": {"PATH": "{PATH}; 這里寫你的安裝目錄"},
"show_transferred_text": true
}
在windows在還有一個(gè)工具可以使用,就是R的IDE,相比于Python的IDE數(shù)量,比較好用的IDE也就是Rstudio了。,直接下載安裝就對(duì)了。
地址:https://www.rstudio.com/products/rstudio/download/
關(guān)于Rstudio的使用,我就想說(shuō)一個(gè)問(wèn)題,怎么設(shè)置R的編譯器。選擇
Tools—>Global options
可以選擇不同的R版本,尤其是對(duì)于安裝了不同版本的R用戶來(lái)說(shuō),就很關(guān)鍵。當(dāng)然如果你只安裝了一個(gè)版本的R,是不需要設(shè)置的,Rstudio在安裝的時(shí)候,會(huì)自動(dòng)幫我們?cè)O(shè)置好。
好,其他的都可以先不用管,到這里環(huán)境就搭好了。
然后對(duì)于入門來(lái)說(shuō),基本的R概念,變量,數(shù)據(jù)結(jié)構(gòu)等今天就不展開(kāi)講了,下面講幾種R中進(jìn)行描述性統(tǒng)計(jì)分析的方法。什么是描述性統(tǒng)計(jì)分析呢?簡(jiǎn)單說(shuō)就是根據(jù)樣本計(jì)算樣本統(tǒng)計(jì)量。比如均值,最大值,最小值,方差,分位數(shù),偏度,蜂度等。然后通過(guò)例子,你也可以大致了解一下,R語(yǔ)言的一些使用方法和特點(diǎn)。
R中單行注釋用#來(lái)表示,不支持多行注釋,如果要多行注釋,只能使用多個(gè)#。還有一個(gè)要說(shuō)的是,Rstudio中多行注釋的快捷鍵是Ctrl+Shift+C,取消注釋也是Ctrl+Shift+C。關(guān)于快鍵鍵,強(qiáng)烈推薦大家自己去百度一下,把常用的記住,可以提高效率。
# 設(shè)置R工作目錄,setwd
setwd("F:/R_learn/")
# R語(yǔ)言的強(qiáng)大之處很重要的原因是R有很多packages,
# 這些Packages給我們提供了非常便利的工具。所以首先要
# 學(xué)會(huì)怎么安裝 packages,用下面這個(gè)命令,相當(dāng)于Python的pip install 。
install.packages("psych")
# 安裝好了以后,就需要加載進(jìn)來(lái),相當(dāng)于Python的import。
library(psych)
# 讀取csv文件,R
test_data <-read.csv("da.csv", header = F, sep = ",")
# 查看數(shù)據(jù)類型
class(test_data)
# [1] "data.frame"
# 查看數(shù)據(jù)前5行
head(test_data)
# V1 V2 V3
# 1 25 26 27
# 2 36 37 38
# 3 47 48 49
# 4 58 59 60
# 5 69 70 71
# 6 80 81 82
# R中數(shù)據(jù)框的索引,使用美元符號(hào),后面加列名。
col1 <- test_data$V1
# 描述性統(tǒng)計(jì)分析
summary(col1)
# Min. 1st Qu. Median Mean 3rd Qu. Max.
# 25.00 44.25 63.50 63.50 82.75 102.00
summary(test_data)
# V1 V2 V3
# Min. : 25.00 Min. : 26.00 Min. : 27.00
# 1st Qu.: 44.25 1st Qu.: 45.25 1st Qu.: 46.25
# Median : 63.50 Median : 64.50 Median : 65.50
# Mean : 63.50 Mean : 64.50 Mean : 65.50
# 3rd Qu.: 82.75 3rd Qu.: 83.75 3rd Qu.: 84.75
# Max. :102.00 Max. :103.00 Max. :104.00
# 然后我們使用psych包提供的另外一個(gè)函數(shù),看一下
describe(col1)
# vars n mean sd median trimmed mad min max range skew kurtosis se
# 1 1 8 63.5 26.94 63.5 63.5 32.62 25 102 77 0 -1.65 9.53
describe(test_data)
# vars n mean sd median trimmed mad min max range skew kurtosis se
# V1 1 8 63.5 26.94 63.5 63.5 32.62 25 102 77 0 -1.65 9.53
# V2 2 8 64.5 26.94 64.5 64.5 32.62 26 103 77 0 -1.65 9.53
# V3 3 8 65.5 26.94 65.5 65.5 32.62 27 104 77 0 -1.65 9.53
# 可以看到describe比summary多了幾個(gè),trimmed表示截尾均值,skew表示偏# 度, kurtosis表示峰度,se表示標(biāo)準(zhǔn)誤差;
以上就是R語(yǔ)言入門及描述性統(tǒng)計(jì)分析的方法是什么,小編相信有部分知識(shí)點(diǎn)可能是我們?nèi)粘9ぷ鲿?huì)見(jiàn)到或用到的。希望你能通過(guò)這篇文章學(xué)到更多知識(shí)。更多詳情敬請(qǐng)關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。
分享文章:R語(yǔ)言入門及描述性統(tǒng)計(jì)分析的方法是什么
文章網(wǎng)址:http://aaarwkj.com/article44/gpjhhe.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供做網(wǎng)站、品牌網(wǎng)站設(shè)計(jì)、標(biāo)簽優(yōu)化、網(wǎng)站導(dǎo)航、網(wǎng)站改版、定制開(kāi)發(fā)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來(lái)源: 創(chuàng)新互聯(lián)