什么是广义线性模型
指数族分布即为广义线性模型的概率分布
线性回归什么是最重要的,是目标函数(损失函数)
为什么说损失函数很重要,因为我们采用的是梯度下降法,必须要保证下降至最低点,由最小二乘法确定的损失函数,经过数学论证,可以确保达到最低点。
由最小二乘法得出的损失函数,经过数学证明可以直接通过公式得出其最优的参数
经过对线性回归的学习,一般人都会有一种普遍错误(夸张了一点,应该是很片面)的直觉认知,那就是认为
线性回归模型假设输入数据和预测结果遵循一条直线的关系
如下图所示:
自变量(特征 x)和因变量(结果 y)的关系是一条直线
对线性含义要理解的透彻需要从其定义入手:
线性函数的定义是:多元一阶(零)多项式
我们最熟悉的就是,只有一个变量的单项式,f(x) = a + bx,这就直接导致了我们对线性相关的理解为一条直线,
实际上线性函数的一般定义为:
在二维平面上由x、y轴组成
由泰勒公式
可知如果输入一元参数标量x,那么一元多阶多项式可以表示在二维平面上的任意函数,即任意曲线。
接下来就是比较骚的操作:
一元多阶多项式可转化为多元一阶多项式
一般的线性函数是这样的:
图1:
对线性函数含义有了一定的理解后就是要对 线性回归模型 要理解清楚
线性回归模型是:利用线性函数对一个或多个自变量和因变量(y)之间的关系进行拟合的模型。
即输入数据进过线性函数后的输出要与真实值接近,如果接近的好,就是好的线性回归模型,即好的线性函数,否则就是差的模型。
假设在进过输入数据训练以后,我们得出系数为【1000,100,20,5,-5,-2,9,-250,253】的线性模型函数:
y=1000X1+100X2+20X+3+5X4-5X5-2X6+9X7-250X8+253
(即图1所示:)
如果与真实数据的拟合情况如下图所示,即是好模型:
如果与真实数据的拟合情况如下图所示,即是坏模型:
具体衡量标准即为cost function(衡量真实值和预测值之间的差距,差距小就是好模型)
…
我就没想过讲这么细!!!
…
什么是线性回归?
线性回归就是通过线性函数输出一个值,值的大小不固定
以下是比较重要的,线性回归的目的是什么?
线性回归的目的就是是构建一个好的线性模型,就是构建一个好的线性函数,就是要得到好的系数,就是要有一个好的输出值。
以达到现实生活中的想要结果,比如通过输入数据,得出你将来的身高;输入数据,得出你将来的工资;输入数据,得到你的另一半会有多高。
转载:https://blog.csdn.net/qq_41375318/article/details/102171754