机器学习课程-李宏毅 第一课学习笔记
欢迎使用Markdown编辑器
以下所有学习内容源于李宏毅老师的《机器学习》一课,

概念
人工智慧是我们想要达成的目标,而机器学习是想要达成目标的手段,希望机器通过学习方式,他跟人一样聪明。机器学习是研究计算机模仿人类学习的过程,利用新的数据改善自身的性能,是人工智能的核心。
而深度学习和机器学习有什么关系呢?深度学习就是机器学习的其中一种方法。
机器学习本质

machine learning所做的事情,你可以想成就是在寻找一个function,要让机器具有一个能力,这种能力是根据你提供给他的资料,它去寻找出我们要寻找的function。还有很多关键问题都可以想成是我们就是需要一个function。
机器学习三部曲


1.根据模型应用构建多个function
2.让machine实际运用衡量一个function是好还是不好
3.让machine通过一个好演算法挑出最好的function
机器学习相关的技术

‘’‘’
监督学习:
定义:根据已有的数据集,知道输入和输出结果之间的关系。根据这种已知的关系,训练得到一个最优的模型。也就是说,在监督学习中训练数据既有特征(feature)又有标签(label),通过训练,让机器可以自己找到特征和标签之间的联系,在面对只有特征没有标签的数据时,可以判断出标签。
通俗一点,可以把机器学习理解为我们教机器如何做事情。
监督学习的分类:回归(Regression)、分类(Classification)
无监督学习:我们不知道数据集中数据、特征之间的关系,而是要根据聚类或一定的模型得到数据之间的关系。
可以这么说,比起监督学习,无监督学习更像是自学,让机器学会自己做事情,是没有标签(label)的。从无标注数据中学习预测模型的机器学习问题,本质是学习数据中的统计规律或潜在结构
强化学习:智能系统在与环境的连续互动中学习最优行为策略的机器学习问题
半监督学习:利用标注的数据和未标注的数据学习预测模型的机器学习问题
主动学习:机器不断主动给出实例让教师进行标注,然后利用标注数据学习预测模型的机器学习问题
————————————————
同样的颜色不同的方块是同一个类型的,这边的蓝色的方块,指的是学习的情景,通常学习的情景是你没有办法控制的。比如,因为我们没有data做监督学习,所以我们才做reinforcement learning。现在因为Alpha Go比较火,所以Alpha Go中用到的reinforcement learning会被认为比较潮。所以说有学生去面试,说明自己是做监督学习的,就会被质疑为什么不做reinforcement learning。那这个时候你就应该和他说,如果我今天可以监督学习,其实就不应该做reinforcement learning。reinforcement learning就是我们没有办法做监督学习的时候,我们才做reinforcement learning。红色的是指你的task,你要解的问题,你要解的这个问题随着你用的方程的不同,有regression、有classification、有structured。所以在不同的情境下,都有可能要解这个task。最后,在这些不同task里面有不同的model,用绿色的方块表示。