整理文章:https://www.cnblogs.com/YSPXIZHEN/p/11232932.html
- 图像分类:对图像的内容对图像进行标记
详细:通常会有一组固定的标签,通过模型预测出最适合图像的标签。 - 图像说明:计算机视觉+自然语言处理,为图像生成一个最适合图像的标题,图像检测+说明
- 目标识别/检测:对边界框围绕目标检测体
- 图像/实例分割:将图像划分成互不相交的区域
普通分割:狗,猫,背景 相互分割。非监督,无语义标注
语义分割:普通分割+语义
实例分割:语义分割+物体编号 - 边缘检测:图像最基本的特征
- 轮廓提取&轮廓跟踪
整理文章:https://blog.csdn.net/weixin_30388677/article/details/98217446
- 图像分类
- 语义分割
- 分类和定位
- 目标检测
- 实例分割
- 人脸识别
- 生成模型
- 风格迁移
- 物体跟踪
- 图像问答
整理文章:http://www.elecfans.com/d/901496.html
- 图像分类:最基础,模式分类,整张内容描述
- 目标检测:图片中特定目标。2个子任务:目标类别信息和概率(分类),目标具体位置(定位)。设计特征和浅层分类器思路
- 图像分割:最高层次的图像理解,对图像某区域感兴趣,此基础上对目标进行更深的处理与分析(包括对象的数学模型表示、几何形状参数提取、统计特征提取、目标识别等)
- 目标跟踪:视频中运动目标的跟踪,结果是个框,视频监控中不可缺少
- 图像滤波与降噪:降噪应用于图像增强和美颜等领域
- 图像增强:增强图像中的有用信息,改善图像的视觉效果,包括降噪
- 风格化:
- 三位重建:三种方法,手工建模,仪器采集与基于图像的建模。
- 图像检索:用文本描述图像特征
- GAN:新的深度学习
整理文章:https://www.zhihu.com/question/330153893/answer/721471978
- 三维视觉:包括 三维感知(点云获取及处理)、位姿估计(视觉SLAM)、三维重建(大规模场景的三维重建、动态三维重建)、三维理解(三维物体的识别、检测及分割等)
- 视频理解:新媒体,5G大环境。比图像的目标检测识别复杂。视频有动作,动作是复杂概念。图像层面的竞赛在减少,视频层面的竞赛在增加。
- 多模态融合:从文本、图片、视频、音频等不同模态数据中交叉融合获取知识
图像自动标注:
应用:图像检索,对数据库定位感兴趣图像
分类:有监督
分类模型:图像分割,过滤噪声,分割
知网论文搜索 图像,出现以下联想搜索:
图像处理,图像分割,图像融合,图像识别,图像增强,图像检索,
图像配准 ,图像压缩,图像去噪,图像拼接
论文中看见的图:
版权声明:本文为lee__7原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。