hbuildx自动添加作者和创建时间注释_强烈推荐!计算机视觉领域5个最佳开源注释工具...

图灵TOPIA

作者:Laurent Montier

编译:刘静

图灵联邦编辑部出品

如果你是一名计算机视觉领域的数据科学家,你可能也意识到自己需要一个快速而简单的标记工具,原因至少有以下两个:
  • 为PoC或R&d实验创建数据集

  • 确保你的数据质量,这样它就不会影响你的深度学习算法的性能

本文作者Laurent Montier,是一位敏捷数据科学家,近期他在Medium上发文介绍了5个很棒的注释工具,希望能帮助您创建计算机视觉数据集。 作者深入研究了计算机视觉标签领域,发现该领域已有大量令人印象深刻的工具。他花了相当多的时间比较最有希望的(和活跃的)项目,了解到这些工具的设计目标只有三个: 1、如果你想在标签行业开展业务,你需要: -先进的项目管理功能 -大量的功能,使任何任务都可以完成 -提高效率的自动化工具 2、如果你属于一家创业公司,你可能需要: - api或者至少是将标记工具连接到私有api的简单方法 -直观的用户体验(UX),使您临时聘用的每个注释者可以立即开始工作 3、如果你是一个人在工作,你: -不关心api /项目管理 -只想尽可能快地开始标记! 下面是他最喜欢的工具的快速列表,这些工具允许为计算机视觉应用程序注释边界框(检测)和多边形(分割)。 如果你发现这些工具不能正常工作,试着在Chrome中运行它们! 以下是具体内容: [选读]计算机视觉标签的快速基础知识 在计算机视觉中,主要有三种类型的数据用于训练算法: 1、训练分类器的图片+标签( ResNets) 2、训练检测器的边界框+标签(YOLOv3,更快的R-CNN…) 3、用于分割应用程序的多边形+标签(Mask R-CNN)229b4568adf02edf976b247db2d0383c.png分割数据(蓝色)和检测数据(紫色)之间的差异 您也可能已经意识到,AI项目成功的最重要因素之一是您可以使用的“质量数据”的数量。我对计算机视觉应用的“ 质量数据 ”的意思是:
  • 每张图片/注释都有一个合适的标签

  • 每个边界框或多边形准确地围绕实体进行训练

尽管后一种定义肯定缺乏客观性,但我们希望我们的算法能够实现人类级别的性能。因此,我们需要“人类级”注释。 适用于标签公司的最佳开源注释工具 计算机视觉注释工具(CVAT) https://github.com/opencv/cvatd17826a3190e3a45ec65474dd452376f.png计算机视觉注释工具(CVAT) 在推出OpenCV近20年后,Intel在计算机视觉领域重申并发布了CVAT,这是一个非常强大和完整的注释工具。尽管它需要一些时间来学习和掌握,它提出了大量的功能来标记计算机视觉数据。 优点:
  • 它很容易安装和扩展,因为它是一个运行在Docker中的web应用程序

  • 提出了许多自动化工具(如使用TensorFlow*对象检测API的自动标注、视频插值等)

  • 它允许管理协作工作,这样团队中的不同成员就可以在同一个注释任务上协同工作

缺点:
  • UI相当复杂。例如,第一次设置注释任务可能非常棘手

  • 一开始不是很直观,可能需要几天的时间来掌握

  • 只能在Chrome运行,所以你必须找到解决办法,如果你害怕谷歌…

下面是一个Demo: https://c.onepanel.io/onepanel-demo/projects/cvat-public-demo/workspaces 适用于初创公司的最佳开源注释工具 视觉对象标记工具(VoTT) https://github.com/microsoft/vott9ddfdf3181ae9acd31a295cbdf4d100e.png视觉对象标记工具(VoTT) VoTT由微软开发,提供了极好的用户体验,可以在注释时节省大量的时间和精力。此外,创建项目也很简单,因此您无需深入了解文档即可使用它。 优点:
  • 代码编写得非常好(在React中),并且完美地定义了接口,因此很容易fork并添加所需的额外功能

  • 正如我所说的,UX是完美的,它有一个黑色的主题和一个跟随鼠标的虚线网格,所以很容易知道从哪里开始一个边界框。这看起来像是一种奖励,但是相信我,这真的很重要!

  • 它建议使用深度学习算法来自动检测对象(它附带了在COCO类上训练的SSD)

  • 它是一个web应用程序和一个电子应用程序。这使您可以将它作为一个thick客户端使用,也可以将它用于web浏览器中运行的应用程序

缺点:
  • 要使用web应用程序版本,您需要将数据托管在微软的云计算服务Azure上(然而,电子版本允许您在硬盘上使用数据,但需要使用npm安装)。

  • 它没有提供一个内置的API(但是调整代码使您的私有API能够与之通信是非常容易的)

  • 您不能给图片贴标签:您只被允许绘制带有相关标签的边界框(或多边形)。因此,它不适合创建分类数据集

在这里可查看网络应用程序: https://vott.z5.web.core.windows.net/ DataTurks https://github.com/DataTurks/DataTurksd95d621dcbd031a6612397df2027e79b.pngDataTurks DataTurks是一家成立于2018年的初创公司,提供图片、视频和文字的标记服务。然而,直到最近它才成为开源软件(这可能与沃尔玛在2019年2月购买了它有关),此前你都必须为此付费。尽管他们几乎没有就此进行沟通并且似乎已经停止了任何开发,但是注释工具很棒且现在是免费的!
当您使用它时,不要注意任何许可证,也不要限制在不同地方使用的非商业版本。Dataturks现在是免费的,您可以使用它的所有功能(我已经尝试并测试过了)!
优点:
  • 至于CVAT,它是一个在Docker中运行的web应用程序(查看下面链接获取Docker镜像)

https://medium.com/@dataturks/dataturks-on-prem-a-fully-self-hosted-data-annotation-solution-86b455bf0634
  • 允许协作和异步工作:处理同一数据集的两个团队成员将无法获得相同的图像进行注释

  • 提出一种用于创建和获取注释任务的API

缺点:
  • DataTurks似乎已经停止了其产品的开发

  • UX还可以,但是一些小的调整就可以让它变得更好

这里可以查看Demo: https://dataturks.com/projects/Dataturks 最适合自己的开源图像标记工具54cc4f135126946da622c9e527574a78.pngMakeSense.ai Make-Sense https://www.makesense.ai/ Make-sense在两个月前刚刚发布(如果你在未来读到这篇文章,将会在2019年6月发布),并且已经拥有了令人难以置信的用户体验。开始注释从来没有这么快!进入网站,拖放你的图片并开始注释。 优点:
  • 快速,高效,但最重要的是,简单!

  • 很酷的用户体验

  • 至于你上传的图片的隐私问题,不要担心,因为他们说:“他们不会存储你的图片,因为他们一开始就不会把它们发送到任何地方。”

缺点:
  • 不提供任何项目管理功能

  • 也不提供任何API

关于其他工具的快速简短列表,这些工具真的很酷,但我没在上面提到: VGG VIA 是一款非常易于使用的注释器,由牛津机器人实验室制造。它在一个html / js文件中编码,因此很容易调整! http://www.robots.ox.ac.uk/~vgg/software/via/ LabelMe 由麻省理工学院开发。 http://labelme.csail.mit.edu/Release3.0/

Coco-Annotator似乎功能齐全,而且它是最近发布的(用户身份验证系统,API端点)。在下面的链接查看演示(用户名:admin 密码:password)

https://annotator.justinbrooks.ca/#/

原文链接: https://blog.sicara.com/best-open-source-annotation-tools-in-computer-vision-4b9f6a18f9117063977ead170073c36d94b4a412c41b.gif

版权声明:本文为weixin_28900461原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。