第七章 线性回归预测模型
線性回歸模型屬于經(jīng)典的統(tǒng)計(jì)學(xué)模型,該模型的應(yīng)用場(chǎng)景是根據(jù)已知的變量(自變量)來(lái)預(yù)測(cè)某個(gè)連續(xù)的數(shù)值變量(因變量)。
一元線性回歸模型:y=a+bx+ε
import pandas as pd import matplotlib.pyplot as plt import seaborn as snsf = open(r'C:\Users\active\Music\Desktop\Python\第7章 線性回歸模型\第7章 線性回歸模型\第七章 線性回歸模型\Salary_Data.csv', encoding='UTF-8') income = pd.read_csv(f) sns.lmplot(x='YearsExperience',y='Salary',data=income,ci=None) plt.show()如何得到這條擬合線數(shù)學(xué)表達(dá)式?
運(yùn)用statsmodels,用于統(tǒng)計(jì)建模的第三方模塊,如需實(shí)現(xiàn)線性回歸模型的參數(shù)求解,可以調(diào)用子模塊中的ols函數(shù)。有關(guān)該函數(shù)的語(yǔ)法及參數(shù)含義如下
formula:以字符串的形式指定線性回歸模型的公式,如‘y~x’就表示簡(jiǎn)單線性回歸模型。
data:指定建模的數(shù)據(jù)集。
subset:通過(guò)bool類型數(shù)組對(duì)象,獲取data的子集用于建模。
drop_cols:指定需要從data中刪除的變量。
import statsmodels.api as sm fit = sm.formula.ols('Salary~YearsExperience',data=income).fit() print(fit.params)OUT:Intercept 25792.200199 YearsExperience 9449.962321 dtype: float64?多元線性回歸模型:y=y=β0+β1x1+β2x2+...+ε
回歸模型參數(shù)的求解:最小二乘法
回歸模型的預(yù)測(cè):用predict方法(predict(exog=None,transform=True)
exog:指定用于預(yù)測(cè)的用于預(yù)測(cè)的其他自變量的值
transform:bool類型參數(shù),預(yù)測(cè)時(shí)是否將原始數(shù)據(jù)按照模型表達(dá)式進(jìn)行轉(zhuǎn)換,默認(rèn)為True
接下來(lái)將基于statsmodels模塊對(duì)多元線性回歸模型的參數(shù)進(jìn)行求解,進(jìn)而依據(jù)其他新的自變量值實(shí)現(xiàn)模型的預(yù)測(cè)功能。
總結(jié)
以上是生活随笔為你收集整理的第七章 线性回归预测模型的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 第一天 Requests库入
- 下一篇: day14 集合与函数