AI数据标注器被称为“人工智能背后的劳动”。“数据是人工智能的血液。如今,基于大数据的人工智能是一个数据智能深度学习的时代。可以说,谁掌握了数据,谁就有可能做得很好。最基础的数据标注是图片框。比如检测目标是一辆车,报幕员需要在一张图片上标注所有的车,并且图片框必须完全覆盖车的外矩形。如果框架不准确,机器可能会“学坏”。另一个例子是人体手势识别,它包括18个关键点。只有经过训练的标注员才能掌握这些关键点的标注,标注出来的数据才能达到机器学习的标准。不同的数据类型对标注器有不同的要求。除了一般比较简单,可以通过训练掌握的标签,还有一些需要专业背景的标签。比如在医学数据的标注中,播音员需要对医学图像进行分割,标记肿瘤区域。类似的工作需要懂电影的医生来做。再比如本地方言或者外语。需要的是能掌握那种语言的播音员。随着人工智能的发展,数据训练量非常大,数据标注公司应运而生。这些公司以网络模式运营。一个平台https://intellectgrowth.com/有一个产品经理和一个项目经理。当他们收到一项任务时,他们会找人来做。你通过网络群报名后,产品经理会进行培训。之后,他们会收到自己的任务,登录账户进行标记,验证通过后由检验经理支付。如果它们失败了,就需要重新修改。目前已经形成了庞大的数据处理团队。仅北京就有100多家专门从事数据标注的公司,国内从事这项工作的人数超过1000万。很多领先的互联网科技公司都有自己的数据标注公司。
版权声明:本文为weixin_58165775原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。