简单机器学习和NLP基础

机器学习

基本概念

训练集/验证集(开发集)/测试集
有监督机器学习和无监督机器学习
常见的机器学习算法
机器学习vs人类学习

简单的机器学习流程

在这里插入图片描述
在这里插入图片描述

训练集/验证集(开发集)/测试集

在机器学习和模式识别等领域中,一般需要将样本分成独立的三部分训练集(train set),验证集(validation set ) 和测试集(test set)。其中训练集用来估计模型,验证集用来调超参数,测试集用来测试模型准确度

有监督机器学习和无监督机器学习

有监督机器学习:我们要教会计算机做某些事情
无监督机器学习:让计算机自己去做某些事情
有监督机器学习就是:我们给算法一个数据集,其中包含了正确答案,算法的目的就是给出更多的正确答案
无监督机器学习就是:我们给算法一个数据集,但是不给他正确答案,而让计算机自己去学习

有监督机器学习例子:分类

分辨猫和狗
在这里插入图片描述

无监督机器学习例子:聚类

机器学习VS人类学习