通俗易懂三哥讲机器学习01线性回归LinearRegress

视频详解:01-机器学习-线性回归-LinearRegress

  • 线性:两个变量之间的关系是一次函数关系的
  • 非线性:两个变量之间的关系不是一次函数关系的

2、应用场景

  • 房价预测
  • 流量预测
  • 票房预测
  • ….

3、表达式&优化函数

  • 表达式: =+

w是x的系数,b是偏置项

  • 目标函数(Loss Function)
通俗易懂三哥讲机器学习01线性回归LinearRegress

  • 利用梯度下降法求 J 的最小值,从而推导出w和b

4、为什么需要正则化

通俗易懂三哥讲机器学习01线性回归LinearRegress

4.1 L1正则化(Lasso回归)

通俗易懂三哥讲机器学习01线性回归LinearRegress

L1正则化项:

通俗易懂三哥讲机器学习01线性回归LinearRegress

L1如何解决过拟合问题:

  • 特征稀疏性

4.2 L2正则化(岭回归)

通俗易懂三哥讲机器学习01线性回归LinearRegress

L2正则化项:

通俗易懂三哥讲机器学习01线性回归LinearRegress

L2如何解决过拟合问题

  • 拟合过程中通常都倾向于让权值尽可能小
  • 参数很小,数据偏移得多一点也不会对结果造成什么影响,鲁棒性更强
  • 参数:=0.01

代码实现:房价回归预测-LinearRegression

# encoding: utf-8
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression

# 1.获取数据集
boston_data = load_boston()
x = pd.DataFrame(boston_data.data) # 波士顿房价data
y = boston_data.target             # 波士顿房价真实值
x.columns = boston_data.feature_names # 特征赋值

#特征14个:
#CRIM: 城镇人均犯罪率
#ZN: 住宅用地所占比例
#INDUS: 城镇中非住宅用地所占比例
#CHAS: 虚拟变量,用于回归分析
#NOX: 环保指数
#RM: 每栋住宅的房间数
#AGE: 1940 年以前建成的自住单位的比例
#DIS: 距离 5 个波士顿的就业中心的加权距离
#RAD: 距离高速公路的便利指数
#TAX: 每一万美元的不动产税率
#PTRATIO: 城镇中的教师学生比例
#B: 城镇中的黑人比例
#LSTAT: 地区中有多少房东属于低收入人群
#MEDV: 自住房屋房价中位数(也就是均价)


# 2.划分训练集、测试集
xtrain,xtest,ytrain,ytest = train_test_split(x,y,test_size=0.2,random_state=125)
# 3.建立线性回归模型
model = LinearRegression().fit(xtrain,ytrain)
# 4.1 获取预测值
y_pred = model.predict(xtest)

y_w = model.coef_

# 4.4 将回归系数与特征对应
compare_feature = [*zip(xtrain.columns,y_w)]

# 5.预测结果可视化
plt.rcParams['font.sans-serif'] = 'SimHei'
fig = plt.figure(figsize=(10,6))
plt.plot(range(ytest.shape[0]),ytest,color='black',linestyle='-',linewidth=1.5)
plt.plot(range(y_pred.shape[0]),y_pred,color='red',linestyle='-.',linewidth=1.5)
plt.xlim((0,102))
plt.ylim((0,55))
plt.legend(['真实值','预测值'])
plt.show()

预测值&实际值效果图:

通俗易懂三哥讲机器学习01线性回归LinearRegress

通俗易懂三哥讲机器学习01线性回归LinearRegress

发布者:股市刺客,转载请注明出处:https://www.95sca.cn/archives/46762
站内所有文章皆来自网络转载或读者投稿,请勿用于商业用途。如有侵权、不妥之处,请联系站长并出示版权证明以便删除。敬请谅解!

(0)
股市刺客的头像股市刺客
上一篇 2024 年 6 月 21 日
下一篇 2024 年 6 月 21 日

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注