欧美一级特黄大片做受成人-亚洲成人一区二区电影-激情熟女一区二区三区-日韩专区欧美专区国产专区

R語言中的k折交叉驗(yàn)證是怎樣的

這篇文章給大家介紹R語言中的k折交叉驗(yàn)證是怎樣的,內(nèi)容非常詳細(xì),感興趣的小伙伴們可以參考借鑒,希望對(duì)大家能有所幫助。

創(chuàng)新互聯(lián)公司堅(jiān)持“要么做到,要么別承諾”的工作理念,服務(wù)領(lǐng)域包括:網(wǎng)站設(shè)計(jì)制作、網(wǎng)站設(shè)計(jì)、企業(yè)官網(wǎng)、英文網(wǎng)站、手機(jī)端網(wǎng)站、網(wǎng)站推廣等服務(wù),滿足客戶于互聯(lián)網(wǎng)時(shí)代的鐵山港網(wǎng)站設(shè)計(jì)、移動(dòng)媒體設(shè)計(jì)的需求,幫助企業(yè)找到有效的互聯(lián)網(wǎng)解決方案。努力成為您成熟可靠的網(wǎng)絡(luò)建設(shè)合作伙伴!

 機(jī)器學(xué)習(xí)中需要把數(shù)據(jù)分為訓(xùn)練集和測試集,因此如何劃分訓(xùn)練集和測試集就成為影響模型效果的重要因素。本文介紹一種常用的劃分最優(yōu)訓(xùn)練集和測試集的方法——k折交叉驗(yàn)證。

  • k折交叉驗(yàn)證

K折交叉驗(yàn)證(k-fold cross-validation)首先將所有數(shù)據(jù)分割成K個(gè)子樣本,不重復(fù)的選取其中一個(gè)子樣本作為測試集,其他K-1個(gè)樣本用來訓(xùn)練。共重復(fù)K次,平均K次的結(jié)果或者使用其它指標(biāo),最終得到一個(gè)單一估測。

這個(gè)方法的優(yōu)勢在于,保證每個(gè)子樣本都參與訓(xùn)練且都被測試,降低泛化誤差。其中,10折交叉驗(yàn)證是最常用的。

  • 實(shí)例代碼

在線性分類器與性能評(píng)價(jià)(R語言)中,我們將數(shù)據(jù)集隨機(jī)抽取70%作為訓(xùn)練集,剩下30%作為測試集,通過線性回歸的方法進(jìn)行預(yù)測,通過ROC和AUC評(píng)價(jià)模型效果?,F(xiàn)在,我們使用k折交叉驗(yàn)證的方法,選取最優(yōu)的訓(xùn)練集和測試集,建立線性分類器并評(píng)價(jià)模型效果。

1、數(shù)據(jù)導(dǎo)入并分組。導(dǎo)入數(shù)據(jù),并使用caret包中的createFolds()函數(shù),根據(jù)標(biāo)簽列將數(shù)據(jù)分成10份 。

target.url <- 'https://archive.ics.uci.edu/ml/machine-learning-databases/undocumented/connectionist-bench/sonar/sonar.all-data'

data <- read.csv(target.url,header = F) 

set.seed(17)  

require(caret)  

folds <- createFolds(y=data[,61],k=10)

2、選取最優(yōu)訓(xùn)練集與測試集。構(gòu)建for循環(huán),得到十次交叉驗(yàn)證預(yù)測的AUC值。并紀(jì)錄取值最大的一組,作為最優(yōu)的訓(xùn)練集與測試集劃分。

library(pROC)

max=0  

num=0 

auc_value<-as.numeric()

for(i in 1:10){  

  fold_test <- data[folds[[i]],]   #取folds[[i]]作為測試集  

  fold_train <- data[-folds[[i]],]   # 剩下的數(shù)據(jù)作為訓(xùn)練集    

  fold_pre <- lm(as.numeric(V61)~.,data=fold_train)  

  fold_predict <- predict(fold_pre,type='response',newdata=fold_test)  

  auc_value<- append(auc_value,as.numeric(auc(as.numeric(fold_test[,61]),fold_predict)))

}  

num<-which.max(auc_value)

print(auc_value)

10次auc取值結(jié)果如下:

 [1] 0.7636364 0.7474747 0.8484848 0.9363636 0.7272727 0.8454545 0.9181818 0.7454545 0.7979798

[10] 0.7916667

3、構(gòu)建分類器并判斷模型效果。根據(jù)前一步的結(jié)果,使用最優(yōu)劃分構(gòu)建線性分類器并預(yù)測。繪制出測試集的ROC曲線。

fold_test <- data[folds[[num]],]   

fold_train <- data[-folds[[num]],]

fold_pre <- lm(as.numeric(V61)~.,data=fold_train)  

fold_predict <- predict(fold_pre,type='response',newdata=fold_test)

roc_curve <- roc(as.numeric(fold_test[,61]),fold_predict)

plot(roc_curve, print.auc=TRUE, auc.polygon=TRUE, grid=c(0.1, 0.2),

     grid.col=c("green", "red"), max.auc.polygon=TRUE,

     auc.polygon.col="skyblue", print.thres=TRUE,main="ROC curve for the set with the largest AUC value")

R語言中的k折交叉驗(yàn)證是怎樣的

線性分類器與性能評(píng)價(jià)(R語言)中隨機(jī)選取訓(xùn)練集和測試集,最終測試集的AUC值僅為0.755,而本次我們通過k折交叉驗(yàn)證選取訓(xùn)練集和測試集,測試集AUC值達(dá)到0.936,可以看出模型效果提升顯著。

關(guān)于R語言中的k折交叉驗(yàn)證是怎樣的就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到。

網(wǎng)站題目:R語言中的k折交叉驗(yàn)證是怎樣的
標(biāo)題網(wǎng)址:http://aaarwkj.com/article48/jjpdep.html

成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供域名注冊、用戶體驗(yàn)、網(wǎng)站導(dǎo)航ChatGPT、面包屑導(dǎo)航品牌網(wǎng)站制作

廣告

聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

成都網(wǎng)站建設(shè)
少妇又色又爽又高潮欧美| 中文字幕久久亚洲一区| 久久久国产精品调教网站| 一级亚洲国产日韩欧美| 国产一区二区三区性色| sedoge在线播放免费有码| 国产av自拍在线免费观看| 国产精品一区二区三区四区久久| 日本在线免费观看91| 国产日韩综合精品一区| 野花日本免费高清完整| 国产精品久久乱码综合| 精品国产女同一区二区| 亚洲精品一区久久狠狠欧美| 激情五月婷婷我有我色| 久久草福利视频在线观看| 日本人妻久久中文字幕精品| 成人在线一区二区三区观看| 亚洲av日韩av在线不卡一区| 丝袜亚洲激情欧美日韩偷拍| 夜夜嗨精品免费视频播放| 亚洲老司机深夜福利| 播放欧美日韩特黄大片| 日韩精品中文女同在线播放| 日韩成年人高清精品不卡一区二区| 人妻少妇被猛烈进入中文字幕91| 国产手机在线91精品观看| 日韩精品在线观看一二三区| 国产乱码精品免费一区二区av| 蜜臀人妻四季av一区二区不卡| 日本东京热加勒比视频| 中文字幕五月久久婷热| 欧美看黄网站在线观看| 亚洲激情久热中文字幕| 日本免费精品一区二区三区中| 夜夜春久久天堂亚洲精品| 自拍偷拍一区蜜桃视频| 丰满少妇被激烈的插进去| 一区二区在线观看激情| 亚洲精品成人午夜久久| 日日摸夜夜添添出白浆|