多项式回归,用于不是线性的情况

import numpy as np

import matplotlib.pyplot as plt
plt.rcParams["font.sans-serif"]=["SimHei"] #设置字体
plt.rcParams["axes.unicode_minus"]=False #该语句解决图像中的“-”负号的乱码问题

import pandas as pd
dataset=pd.read_csv('Position_Salaries.csv')
X=dataset.iloc[:,1:2].values

y=dataset.iloc[:,2].values

#对数据集拟合线性回归
from sklearn.linear_model import LinearRegression
lin_reg=LinearRegression()
lin_reg.fit(X,y)

#对数据集拟合多项式回归
from sklearn.preprocessing import PolynomialFeatures
poly_reg=PolynomialFeatures(degree=5)#对特征进行5次方操作
X_poly=poly_reg.fit_transform(X)#新的特征,真正需要的特征y=b0+b1x1+b2x1的平方+bnx1的n次方
poly_reg.fit(X_poly,y)#将X_poly的高次方进行拟合
lin_reg_2=LinearRegression()
lin_reg_2.fit(X_poly,y)
plt.scatter(X,y,color='red')

plt.plot(X,lin_reg.predict(X),color='blue')
plt.title('线性回归')
plt.xlabel('级别')
plt.ylabel('工资')
plt.show()

在这里插入图片描述

#多项式回归结果可视化,用于更高的分辨率和更平滑的曲线
X_grid=np.arange(min(X),max(X),0.1)
X_grid=X_grid.reshape((len(X_grid),1))
plt.scatter(X,y,color='red')
plt.plot(X_grid,lin_reg_2.predict(poly_reg.fit_transform(X_grid)),color='blue')
plt.title('多项式回归,参数4')
plt.xlabel('级别')
plt.ylabel('工资')
plt.show()

在这里插入图片描述

#线性工资预测结果
print(lin_reg.predict(np.array([[6.5]])))

#多项式回归预测结果
print(lin_reg_2.predict(np.array([[6.5]])))

版权声明:本文为m0_46371988原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。