深度学习（四）分类

课程链接
之前我们已经介绍了线性回归问题，分类问题是不适用线性回归方法的。
在这里插入图片描述
理想情况下的分类问题的解决
模型是一个布尔函数，损失函数是分类错误的次数，这样的损失函数显然是不能用最优化方法求解的。不过它也可以用感知机和支持向量机来解决，本节不作介绍。

因此我们在这里采用概率统计的方法进行求解，算出某一项数据落入某一类的最大可能性。
比较简单和常用的分布是高斯分布。建立高斯分布只需要数据的均值和方差。
在这里插入图片描述
在课程中我们待解决的问题是通过宝可梦的攻击防御等属性对宝可梦分类。输入7种属性分别计算均值方差的情况下分类水系和一般系宝可梦效果并不理想。
图中红线是分类边界
我们猜测（不一定对）可能是模型过于复杂出现的过拟合现象。简化模型假设每种属性正态分布只有均值不同，方差是共享的。
在这里插入图片描述
在这样改进之后，分类的边界变成里直线，准确率也有了一定的提升。

逻辑回归

虽然线性回归无法解决分类问题，但是，逻辑回归可以。
在这里插入图片描述

通过上图中的公式转换，我们可以把x落入C1的概率，写成关于z的sigmoid函数（sigmoid函数可以把一个任意实数转化到（0,1）之间）。
在这里插入图片描述
z的形式和回归中的模型是一样的，因此我们把sigmoid(z)作为逻辑回归的第一步的模型。

第二步是根据模型得到一个损失函数，这里用到了最大似然估计。