hbuildx自动添加作者和创建时间注释_强烈推荐！计算机视觉领域5个最佳开源注释工具...

图灵TOPIA

作者：Laurent Montier

编译：刘静

图灵联邦编辑部出品

如果你是一名计算机视觉领域的数据科学家，你可能也意识到自己需要一个快速而简单的标记工具，原因至少有以下两个:

为PoC或R＆d实验创建数据集
确保你的数据质量，这样它就不会影响你的深度学习算法的性能

本文作者Laurent Montier，是一位敏捷数据科学家，近期他在Medium上发文介绍了5个很棒的注释工具，希望能帮助您创建计算机视觉数据集。作者深入研究了计算机视觉标签领域，发现该领域已有大量令人印象深刻的工具。他花了相当多的时间比较最有希望的(和活跃的)项目，了解到这些工具的设计目标只有三个: 1、如果你想在标签行业开展业务，你需要: -先进的项目管理功能 -大量的功能，使任何任务都可以完成 -提高效率的自动化工具 2、如果你属于一家创业公司，你可能需要: - api或者至少是将标记工具连接到私有api的简单方法 -直观的用户体验(UX)，使您临时聘用的每个注释者可以立即开始工作 3、如果你是一个人在工作，你: -不关心api /项目管理 -只想尽可能快地开始标记！下面是他最喜欢的工具的快速列表，这些工具允许为计算机视觉应用程序注释边界框(检测)和多边形(分割)。如果你发现这些工具不能正常工作，试着在Chrome中运行它们! 以下是具体内容： [选读]计算机视觉标签的快速基础知识 在计算机视觉中，主要有三种类型的数据用于训练算法： 1、训练分类器的图片+标签( ResNets) 2、训练检测器的边界框+标签(YOLOv3，更快的R-CNN…) 3、用于分割应用程序的多边形+标签(Mask R-CNN)

分割数据(蓝色)和检测数据(紫色)之间的差异您也可能已经意识到，AI项目成功的最重要因素之一是您可以使用的“质量数据”的数量。我对计算机视觉应用的“ 质量数据 ”的意思是：

每张图片/注释都有一个合适的标签

每个边界框或多边形准确地围绕实体进行训练

尽管后一种定义肯定缺乏客观性，但我们希望我们的算法能够实现人类级别的性能。因此，我们需要“人类级”注释。 适用于标签公司的最佳开源注释工具 计算机视觉注释工具(CVAT) https://github.com/opencv/cvat

计算机视觉注释工具(CVAT) 在推出OpenCV近20年后，Intel在计算机视觉领域重申并发布了CVAT，这是一个非常强大和完整的注释工具。尽管它需要一些时间来学习和掌握，它提出了大量的功能来标记计算机视觉数据。优点:

它很容易安装和扩展，因为它是一个运行在Docker中的web应用程序

提出了许多自动化工具(如使用TensorFlow*对象检测API的自动标注、视频插值等)

它允许管理协作工作，这样团队中的不同成员就可以在同一个注释任务上协同工作

缺点:

UI相当复杂。例如，第一次设置注释任务可能非常棘手

一开始不是很直观，可能需要几天的时间来掌握

只能在Chrome运行，所以你必须找到解决办法，如果你害怕谷歌…

下面是一个Demo： https://c.onepanel.io/onepanel-demo/projects/cvat-public-demo/workspaces 适用于初创公司的最佳开源注释工具 视觉对象标记工具(VoTT) https://github.com/microsoft/vott

视觉对象标记工具(VoTT) VoTT由微软开发，提供了极好的用户体验，可以在注释时节省大量的时间和精力。此外，创建项目也很简单，因此您无需深入了解文档即可使用它。优点:

代码编写得非常好(在React中)，并且完美地定义了接口，因此很容易fork并添加所需的额外功能

正如我所说的，UX是完美的，它有一个黑色的主题和一个跟随鼠标的虚线网格，所以很容易知道从哪里开始一个边界框。这看起来像是一种奖励，但是相信我，这真的很重要!

它建议使用深度学习算法来自动检测对象(它附带了在COCO类上训练的SSD)

它是一个web应用程序和一个电子应用程序。这使您可以将它作为一个thick客户端使用，也可以将它用于web浏览器中运行的应用程序

缺点:

要使用web应用程序版本，您需要将数据托管在微软的云计算服务Azure上(然而，电子版本允许您在硬盘上使用数据，但需要使用npm安装)。

它没有提供一个内置的API(但是调整代码使您的私有API能够与之通信是非常容易的)

您不能给图片贴标签:您只被允许绘制带有相关标签的边界框(或多边形)。因此，它不适合创建分类数据集

在这里可查看网络应用程序： https://vott.z5.web.core.windows.net/ DataTurks https://github.com/DataTurks/DataTurks

DataTurks DataTurks是一家成立于2018年的初创公司，提供图片、视频和文字的标记服务。然而，直到最近它才成为开源软件(这可能与沃尔玛在2019年2月购买了它有关)，此前你都必须为此付费。尽管他们几乎没有就此进行沟通并且似乎已经停止了任何开发，但是注释工具很棒且现在是免费的！

当您使用它时，不要注意任何许可证，也不要限制在不同地方使用的非商业版本。Dataturks现在是免费的，您可以使用它的所有功能(我已经尝试并测试过了)！

优点:

至于CVAT，它是一个在Docker中运行的web应用程序(查看下面链接获取Docker镜像)

https://medium.com/@dataturks/dataturks-on-prem-a-fully-self-hosted-data-annotation-solution-86b455bf0634

允许协作和异步工作：处理同一数据集的两个团队成员将无法获得相同的图像进行注释

提出一种用于创建和获取注释任务的API

缺点:

DataTurks似乎已经停止了其产品的开发

UX还可以，但是一些小的调整就可以让它变得更好

这里可以查看Demo： https://dataturks.com/projects/Dataturks 最适合自己的开源图像标记工具

MakeSense.ai Make-Sense https://www.makesense.ai/ Make-sense在两个月前刚刚发布(如果你在未来读到这篇文章，将会在2019年6月发布)，并且已经拥有了令人难以置信的用户体验。开始注释从来没有这么快!进入网站，拖放你的图片并开始注释。优点:

快速，高效，但最重要的是，简单!

很酷的用户体验

至于你上传的图片的隐私问题，不要担心，因为他们说:“他们不会存储你的图片，因为他们一开始就不会把它们发送到任何地方。”

缺点:

不提供任何项目管理功能

也不提供任何API

关于其他工具的快速简短列表，这些工具真的很酷，但我没在上面提到： VGG VIA 是一款非常易于使用的注释器，由牛津机器人实验室制造。它在一个html / js文件中编码，因此很容易调整！ http://www.robots.ox.ac.uk/~vgg/software/via/ LabelMe 由麻省理工学院开发。 http://labelme.csail.mit.edu/Release3.0/

Coco-Annotator似乎功能齐全，而且它是最近发布的(用户身份验证系统，API端点)。在下面的链接查看演示(用户名：admin 密码：password)

https://annotator.justinbrooks.ca/#/

原文链接： https://blog.sicara.com/best-open-source-annotation-tools-in-computer-vision-4b9f6a18f911

原文链接：https://blog.csdn.net/weixin_28900461/article/details/112096200