CNN学习笔记——图像分类
1、什么是图像分类
对于输入图像,从已有的固定标签集合中找出一个分类标签给该输入图像。
Eg. 比如图像是一只猫,就将猫作为该图像的标签。
2、计算机视觉难点
由于物体的大小、视角、形变、遮挡、光照条件、背景等干扰
3、解决方法
数据驱动方法:给计算机很多数据,实现学习算法,让计算机学习到每个类的外形。
4、流程
输入:输入训练集
学习:训练分类器
评价:让分类器预测未曾见过的图像,并且将预测标签真实标签对比。
5、具体分类器:K-NN分类器
流程:将测试图像和训练集中的每一张图像作比较,找出最相似的K张。在这K张的label中,找出最多的label类型给这张测试图。
(1)如何比较?
方法一:L1距离
将测试图像和训练图像的像素值相减的绝对值。如下图所示。
方法二:L2距离
(2)如何确定K值?
将训练集又分为训练集和验证集,在训练集中尝试不同的K值进行分类器训练,得到的分类器在验证集上验证结果。查看哪一个K值得分类效果最好,用最好的K值来跑真正的测试集。
!!!一定一定不能用测试集来调优 原因:如果用测试集调优的话,会造成过拟合(算法看起来效果不错,但性能会低于预期。相当于将测试集当做训练集,结果自然是看起来很好,但实际效果差很多)
(3)如何分训练集和验证集?
方法:交叉验证
将训练集分成5分,将这5份循环着取其中4份做测试集,1份做验证集。进行(2)中的K值得确定,将得到的5个K值取平均,得到最终的K值。
6、K-NN分类器的优劣
优势
(1)易于理解,实现简单。
(2)训练不需花时间。
劣势
(1)花大量时间进行测试图像和所有训练图像对比
(2)更多是基于背景的分类(原始像素比较),而不是语义的分类。
版权声明:本文为qq_36284793原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。