今天就跟大家聊聊有關(guān)使用Python怎么實現(xiàn)多項式回歸,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。
Python是一種編程語言,內(nèi)置了許多有效的工具,Python幾乎無所不能,該語言通俗易懂、容易入門、功能強大,在許多領(lǐng)域中都有廣泛的應(yīng)用,例如最熱門的大數(shù)據(jù)分析,人工智能,Web開發(fā)等。
為什么多項式回歸:
研究人員假設(shè)的某些關(guān)系是曲線的。顯然,這種類型的案例將包括多項式項。
檢查殘差。如果我們嘗試將線性模型擬合到曲線數(shù)據(jù),則預(yù)測變量(X軸)上的殘差(Y軸)的散點圖將在中間具有許多正殘差的斑塊。因此,在這種情況下,這是不合適的。
通常的多元線性回歸分析的假設(shè)是所有自變量都是獨立的。在多項式回歸模型中,不滿足該假設(shè)。
多項式回歸的使用:
這些基本上用于定義或描述非線性現(xiàn)象,例如:
組織生長速度。
疾病流行病的進(jìn)展
湖泊沉積物中碳同位素的分布
回歸分析的基本目標(biāo)是根據(jù)自變量x的值來模擬因變量y的期望值。在簡單回歸中,我們使用以下等式 y = a + bx + e
這里y是因變量,a是y截距,b是斜率,e是誤差率。
在許多情況下,這種線性模型將無法解決。例如,如果我們在這種情況下根據(jù)合成溫度分析化學(xué)合成的產(chǎn)生,我們使用二次模型y = a + b1x + b2 ^ 2 + e
這里y是x的因變量,a是y截距,e是誤差率。
通常,我們可以將其建模為第n個值。y = a + b1x + b2x ^ 2 + .... + bnx ^ n
由于回歸函數(shù)在未知變量方面是線性的,因此這些模型從估計的角度來看是線性的。
因此,通過最小二乘技術(shù),讓我們計算y的響應(yīng)值。
Python中的多項式回歸:
要獲得用于分析多項式回歸的數(shù)據(jù)集,請單擊此處。
步驟1:導(dǎo)入庫和數(shù)據(jù)集
導(dǎo)入重要的庫和我們用于執(zhí)行多項式回歸的數(shù)據(jù)集。
# Importing the libraries import numpy as np import matplotlib.pyplot as plt import pandas as pd # Importing the dataset datas = pd.read_csv('data.csv') datas
第2步:將數(shù)據(jù)集分為2個組件
將數(shù)據(jù)集劃分為兩個組件,即X和yX將包含1到2之間的列.y將包含2列。
X = datas.iloc[:, 1:2].values y = datas.iloc[:, 2].values
第3步:將線性回歸擬合到數(shù)據(jù)集
擬合線性回歸模型在兩個組件上。
# Fitting Linear Regression to the dataset from sklearn.linear_model import LinearRegression lin = LinearRegression() lin.fit(X, y)
第4步:將多項式回歸擬合到數(shù)據(jù)集
將多項式回歸模型擬合到兩個分量X和y上。
# Fitting Polynomial Regression to the dataset from sklearn.preprocessing import PolynomialFeatures poly = PolynomialFeatures(degree = 4) X_poly = poly.fit_transform(X) poly.fit(X_poly, y) lin2 = LinearRegression() lin2.fit(X_poly, y)
步驟5:在此步驟中,我們使用散點圖可視化線性回歸結(jié)果。
# Visualising the Linear Regression results plt.scatter(X, y, color = 'blue') plt.plot(X, lin.predict(X), color = 'red') plt.title('Linear Regression') plt.xlabel('Temperature') plt.ylabel('Pressure') plt.show()
步驟6:使用散點圖可視化多項式回歸結(jié)果。
# Visualising the Polynomial Regression results plt.scatter(X, y, color = 'blue') plt.plot(X, lin2.predict(poly.fit_transform(X)), color = 'red') plt.title('Polynomial Regression') plt.xlabel('Temperature') plt.ylabel('Pressure') plt.show()
步驟7:使用線性和多項式回歸預(yù)測新結(jié)果。
# Predicting a new result with Linear Regression lin.predict(110.0)
# Predicting a new result with Polynomial Regression lin2.predict(poly.fit_transform(110.0))
使用多項式回歸的優(yōu)點:
廣泛的功能可以適應(yīng)它。
多項式基本上適合寬范圍的曲率。
多項式提供了依賴變量和自變量之間關(guān)系的最佳近似。
使用多項式回歸的缺點
這些對異常值過于敏感。
數(shù)據(jù)中存在一個或兩個異常值會嚴(yán)重影響非線性分析的結(jié)果。
此外,遺憾的是,用于檢測非線性回歸中的異常值的模型驗證工具少于線性回歸。
看完上述內(nèi)容,你們對使用Python怎么實現(xiàn)多項式回歸有進(jìn)一步的了解嗎?如果還想了解更多知識或者相關(guān)內(nèi)容,請關(guān)注創(chuàng)新互聯(lián)成都網(wǎng)站設(shè)計公司行業(yè)資訊頻道,感謝大家的支持。
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機、免備案服務(wù)器”等云主機租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。
文章題目:使用Python怎么實現(xiàn)多項式回歸-創(chuàng)新互聯(lián)
網(wǎng)頁URL:http://aaarwkj.com/article24/jdoce.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站設(shè)計公司、云服務(wù)器、靜態(tài)網(wǎng)站、服務(wù)器托管、網(wǎng)站維護(hù)、標(biāo)簽優(yōu)化
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)