为期七天的图像分割课程转瞬即逝,这七天忙碌但又收获颇丰,非常感谢百度AIstudio提供了这样的机会能让我从一个什么都不会的小白到能够在本机安装paddle paddle,学会是用notebook。
之前我接触过一些简单的图像分类,对于最简单单标签分类任务,每一张图片都对应一个标签。通过神经网络训练图片与正确标签之间的映射关系,最后能在测试集上有良好的表现。
记得第一次上课之前看了一下图像分割的简介当时就很好奇它是怎么在同一张图像上识别出不同的景物并且用不同的色块表示的?第一次听老师直播讲解才明白原来它的大致原理是对图像中的每个像素进行分类,也就是语义分割。而它的训练过程和图像分类也颇为类似,输入的也是图像和对应的标签,把图像输入到网络中,计算网络的输出和对应标签之间的损失再反向传播,更新权重。
训练营的这几次课程中我对PSPNet部分的学习印象比较深刻。FCN虽然在一些任务重有不错的表现,但是它也有很多明显的缺点,比如它的分割结果不精确,更重要的是FCN没有考虑上下文的信息比如当A区域和B的appearance比较相似的时候就有可能误识别。PSPNet就要解决这个问题,它的大致思路是:PSPNet ->利用上下文信息 ->增大感受视野。
因为不同感受野下所带来的上下文信息对图像分割而言十分重要,所以感受野选择的是否恰当会直接影响最终的分割效果,这种影响对极端尺寸(极大和极小)目标表现地尤为明显。
为了在同一级别下融合多尺度下的上下文信息,PSPNet提出了池化金字塔结构,从而实现了可以理解目标所处环境的图像分割。
这次课程收获了很多理论知识,但我明显地感受到理论与实践之间还有很大的距离,写作业的时候才发现自己把理论用代码表达出来的能力十分欠缺,我觉得这是因为平时代码训练的量和阅读量都还不够,其次对模型的一些常用写法不熟悉。尤其是写作业三infer.py的时候感觉遇到了比较大的困难,所以今后还应该注重这方面能力的训练!
总体来说,这次训练营收获很大,希望这样的活动多一些,也希望百度AIstudio越来越好!
图像分割学习心得
版权声明:本文为weixin_44548214原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。