计算机视觉领域里重要的研究方向

整理文章：https://www.cnblogs.com/YSPXIZHEN/p/11232932.html

图像分类：对图像的内容对图像进行标记
详细：通常会有一组固定的标签，通过模型预测出最适合图像的标签。
图像说明：计算机视觉+自然语言处理，为图像生成一个最适合图像的标题，图像检测+说明
目标识别/检测：对边界框围绕目标检测体
图像/实例分割：将图像划分成互不相交的区域
普通分割：狗，猫，背景相互分割。非监督，无语义标注
语义分割：普通分割+语义
实例分割：语义分割+物体编号
边缘检测：图像最基本的特征
轮廓提取&轮廓跟踪

整理文章：https://blog.csdn.net/weixin_30388677/article/details/98217446

图像分类
语义分割
分类和定位
目标检测
实例分割
人脸识别
生成模型
风格迁移
物体跟踪
图像问答

整理文章：http://www.elecfans.com/d/901496.html

图像分类：最基础，模式分类，整张内容描述
目标检测：图片中特定目标。2个子任务：目标类别信息和概率(分类)，目标具体位置(定位)。设计特征和浅层分类器思路
图像分割：最高层次的图像理解，对图像某区域感兴趣，此基础上对目标进行更深的处理与分析（包括对象的数学模型表示、几何形状参数提取、统计特征提取、目标识别等）
目标跟踪：视频中运动目标的跟踪，结果是个框，视频监控中不可缺少
图像滤波与降噪：降噪应用于图像增强和美颜等领域
图像增强：增强图像中的有用信息，改善图像的视觉效果，包括降噪
风格化：
三位重建：三种方法，手工建模，仪器采集与基于图像的建模。
图像检索：用文本描述图像特征
GAN：新的深度学习

整理文章：https://www.zhihu.com/question/330153893/answer/721471978

三维视觉：包括三维感知（点云获取及处理）、位姿估计（视觉SLAM）、三维重建（大规模场景的三维重建、动态三维重建）、三维理解（三维物体的识别、检测及分割等）
视频理解：新媒体，5G大环境。比图像的目标检测识别复杂。视频有动作，动作是复杂概念。图像层面的竞赛在减少，视频层面的竞赛在增加。
多模态融合：从文本、图片、视频、音频等不同模态数据中交叉融合获取知识

图像自动标注：
应用：图像检索，对数据库定位感兴趣图像

分类：有监督
分类模型：图像分割，过滤噪声，分割

知网论文搜索图像，出现以下联想搜索：
图像处理，图像分割，图像融合，图像识别，图像增强，图像检索，
图像配准，图像压缩，图像去噪，图像拼接

论文中看见的图：
在这里插入图片描述

版权声明：本文为lee__7原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接和本声明。

原文链接：https://blog.csdn.net/lee__7/article/details/104087789