时间:2023-01-19 | 标签: | 作者:Q8 | 来源:网络
小提示:您能找到这篇{万字干货 | 图像标注工具竞品分析}绝对不是偶然,我们能帮您找到潜在客户,解决您的困扰。如果您对本页介绍的万字干货 | 图像标注工具竞品分析内容感兴趣,有相关需求意向欢迎拨打我们的服务热线,或留言咨询,我们将第一时间联系您! |
1. 什么是图像标注图像标注是在原始图像打上标签的行为。在训练深度学习模型前,需要准备足量的,已被标注的样本用于训练。而图像标注就是样本准备中的一个步骤,如图1: 图1:Supervisely中的图片标注 原始图像类型包括:二维图片、三维图片、视频等。 标注形式包括:标签、包围框(二维和三维形式)、点、线、多边形、像素图(Bitmap)。 根据不同的标注形式,图像标注类型可分为:
下图为各个标注类型的示例: 图2:各类标注类型的示例,来源:https://gluon-cv.mxnet.io/contents.html 通常,企业会有各式各样的标注需求,作为一款通用的标注产品,产品功能(如支持各种输入格式,各种标注类型,各种标注形式,以及额外功能)会是我们关注的一个重点。 另一方面,实际情况中标注是一件十分费时费力的工作,例如需要标出上图中的大部分行人,而这样的图片至少得有几百上千张。由此可见,因此用户体验是我们需要关注的另一个重点。 综上,本文将主要从产品功能和用户体验这两个维度来分析行业中的代表性产品。 2. 核心业务流程完成图片标注训练的整个工作流程,通常需要经历”数据准备”、”数据标注”、“数据进化”三个环节。具体业务流程如下图所示: 图3:图像标注通用业务流程 2.1 数据准备数据准备包含:数据采集、数据预处理两步。 1. 数据采集:采集途径很多如:本地上传,调用其他数据集数据,摄像头数据导入,从云服务调用获取数据等。 2. 数据预处理:数据清洗是获取高质量训练数据的前提,并且通过清洗不合格的数据也可以减少无意义的标注工作,提高标注效率。数据清洗通常的操作包括:清洗模糊数据,清洗相似数据,裁剪,旋转,镜像,图片亮度,图片对比度,图片锐化等。 2.2 数据标注数据标注包括:建立标注集、数据标注、标注审核。 2.2.1 建立标注集 标注集是标注工作的基本任务管理单元,在此不做过多赘述。 2.2.2 数据标注 具体方式见表1: 表1:数据标注具体方式 2.2.3 标注审核 针对“任务标注”,标注审核是对下发的标注任务进行管理并对标注结果审核,一般审核维度包括:标注进度、验收情况、标签数量、难例、标注质量等。 针对“自动标注”,标注审核是对自动标注的结果进行逐一检查确认,并修改标注有误的图片。 2.3 数据进化数据进化包括:模型训练、模型推理。 2.3.1 模型训练: 是将标注数据进行训练得出模型结果的过程。 2.3.2 模型推理: 用于对训练的模型结果进行校验预测,并将错误或者有误差的校验结果记录下来带入到下一次模型训练中用于模型的优化迭代,从而形成由数据标注到模型训练再到模型迭代优化的闭合环路。 3. 竞品简介目前市面上标注工具较多,首先需要确定竞品选取原则:
综上,选取了以下3款竞品:
表2:3款产品的概括对比 4. 功能对比本节中,针对3款产品,我们从根据第2章的核心业务流程来探究产品功能间差异。 4.1 CVATCVAT的使用流程虽然十分简单,但功能十分全面和丰富。 图4:CVAT的标注流程 4.1.1 创建数据集 CVAT中以标注任务(Task)的概念替代数据集,一个任务可以包含多个作业,每个作业可以分配一个标注人员。 在创建标注任务时,CVAT也提供了丰富的高级选项,例如:
总结来看,CVAT在标注任务模块汇中的一个优势是支持直接上传视频类型文件,上传完的视频会被根据用户设定的帧率(Frame)转换成图片。 CVAT在该模块中也有个明显的劣势:缺少一个统一的视角去总览任务中所有的图片(如下图所示,任务详情页中仅能看到首张图的照片),以及每张图片上所有的标注,推测是因为由于一张图片可能存在在多个作业中所导致。 图5:CVAT的标注任务详情页 4.1.2 自动标注 由于CVAT并未提供模型服务的能力,其自动标注功能还处在发展的初期,仅能满足个人实验。 添加自动标注模型需要用户上传模型文件,而非镜像或API,这种非服务化的方式很容易因为运行环境差异(例如2个服务器上安装了不同版本的依赖包),而影响标注成功率以及准确率。 4.1.3 人工标注 4.1.3.1 人工标注支持3种标注模式,且各个模式之前可来回切换:
4.1.3.2 针对CVAT我们体验下来总结了以下几点优势: 1)灵活的标签和属性定义 同一图片可以标注多个标签,且一个标签可以设置多个属性且平台将属性定义分为:多选(Select)、单选(Radio)、是否(Checkbox)、文本(Text)、数字(Number)五种。CVAT标签自定义的自由度基本满足了绝大部分的标注需求。 图6:CVAT中的5种标签属性 2)丰富的标注形式 为了支持各种类型的标注,CVAT提供了6种的标注形式,包括:标签、点、矩形、折线、多边形、长方体等。同时支持AI多边形标注:只需指定至少四个点就可以在系统的帮助下框选出一个目标的轮廓,这点同Supervisely相同,我们者体验下来在AI识别速度上还是期待进一步提升。 3)标注方式快捷键的统一 选择一个标注方式则快捷键”N“就代表这种标注方式。重新选择标注方式则”N”代表的方式随之对应改变。快捷键的统一进一步降低了用户的操作成本。 4)任务分析 通过任务分析仪表板中的分析,您可以查看每个用户在每个任务上花费了多少时间,以及他们在任何时间范围内完成了多少工作,任务分析拓展了CVAT的团队标注能力。 图7:CVAT中的Analytics仪表板(图片来源CVAT用户手册) 5)追踪模式(Track mode) 用于对视频文件进行标注。视频会按照帧率被分割成若干画面(Frame)。用户仅需在关键画面(Key frame,和Flash中的关键帧很类似)上进行标注,关键画面之间的画面也会自动带上标注。CVAT目前仅支持包围框和点使用插值模式。Propagate功能很实用,场景:如果想将当前图片中的标注传递(Propagate)给后面的n张图片。同时CVAT的追踪模式结合合并(Merge)功能、分割(Split)功能共同支撑起CVAT独具优势的视频或动图标注能力。 4.1.3.3 可能正因为其支持的功能过于丰富,导致使用起来有一定的学习成本,用户体验会有些差强人意。例如:
4.2 ModelArtsModelarts在2019年10月17日版本更新后(特别是团队标注功能),业务流程覆盖趋于完整。整体用户流程如下: 图8:ModelArts的标注流程(图片来自ModelArts官网) 由于本文以数据标注功能的讨论为主,数据标注之后的功能(包括训练、推理、数据校正等)不在本文的讨论范围内。 4.2.1 创建数据集 在创建图片数据集时,ModelArts将图像标注类型设定在了数据集层面,即创建数据集时就需要区分标注类型. 这一点与Supervisely和CVAT区别较大,具体分析见Supervisely的人工标注章节。目前支持图片分类及目标检测两种任务。 图9:ModelArts中放入创建数据集 4.2.2 数据处理 华为的数据处理功能位于对象存储服务中,其提供了便利且功能全面的图片处理能力。 华为对象存储服务中提供了“图形界面模式”和“代码编辑模式”两种图片处理操作方式,适用了普通用户和开发者用户的使用。 同时最终的处理结果存放于内容分发网络(Content Delivery Network,CDN)加速,后续请求可以通过URL直接从CDN下载,可以将结果用于任意可以通过URL导入数据的标注平台,极大的拓展了平台的功能拓展性。 华为图片处理提供的能力主要包括:设置图片效果(亮度、对比度、锐化、模糊)、设置缩略、旋转图片、剪切图片、设置水印、转化格式、压缩图片。 图10:华为对象存储中的图片处理模块 4.2.3 智能标注 ModelArts智能标注包含:主动学习(半自动标注)和预标注(全自动标注), 目前只有“图像分类”和“物体检测”类型的数据集支持智能标注功能。下面简单分析一下智能标注模块:
4.2.4 人工标注 华为ModelArts人工标注的特点主要有以下三点: 4.2.4.1 目标检测标注支持多达6种形式的标注 包括方形、多边形、正圆、点、单线、虚线(见图11),丰富的标注方式覆盖了更广泛的标注场景,同时可以提高标注的精度。 4.2.4.2 高效的标签选择方式 在数据标注的交互上,华为ModelArts在画完选框后会自动弹出标签下拉框已经展开的添加标签弹窗(见图11),省去了用户框选完成后自行点击标签下拉框的步骤。且弹出的标签选项卡就在选框旁边(见图11),这样减短了滑动鼠标选择标签的鼠标移动行程。 图11:ModelArts图像检测的数据标注界面 4.2.4.3 图片分组 在标注预览页面华为ModelArts提供了图片分组功能(见图12),此功能会使用聚类算法或根据清晰度、亮度、图像色彩对图片进行分组。自动分组可以理解为数据标注的预处理,用户可根据分组结果,进行分组打标、图片清洗等操作。此功能可以提高图片标注效率,尤其是在图片分类标注的情况下再配合批量标注功能可以在标注速度上有质的提升。但我们在实际体验后感觉此功能分组的成功率较低。 图12:ModelArts中的图片自动分组 4.2.5 团队标注 华为ModelArts的团队标注功能设置很齐全,有很多亮点,这里从创建,标注,审核三个方面探讨: 4.2.5.1 创建 华为启用团队标注后可以直接指定标注团队,也可以选择指定管理员然后由管理员分配标注人力并做审核工作。选则完类型后团队成员会收到系统邮件,按邮件提示可以很轻松的完成标注和审核。 可以选择是否将新增文件自动同步至标注团队。同时可以选择标注团队的文件是否加载智能标注结果。这些操作增加了管理员对任务分配和自动标注之间关系的调节自由度。 图13:ModelArts团队标注创建页面 4.2.5.2 标注 标注一张图片并保存后,图片自动进入“待审核”状态。我们认为这样的状态切换超出用户预期,特别是用户如果还想再检查标注是否有误的话还需切换到“待审核”页面去检查,这样会给用户带来不便。 “待审核”的图片仍然可以修改,在管理员发起验收前,修改有效。但在验收时,如果图片被抽样到则修改不会保存在数据集中,如果图片未被抽样到则修改会被保存在数据集中。这样的审核逻辑限定可以减少在审核中产生不必要的混乱,防止审核结果产生误差。 4.2.5.3 审核 ModelArts将审核称为“验收”,验收分了2个层级:单张图片的验收和一批次图片的验收。流程是用户对一批图片做验收。审核层级过多,逻辑复杂,导致操作结果可能不符合用户预期。 标注状态混乱:例如管理员分配图片A给到标注人a,a标注完,管理员使用智能标注同时标注图片A,如果2个结果都被管理员确认,无论先确认哪种标注,最后只有智能标注的结果有效,而标注人a的标注则无效。 ModelArts提供了审核的仪表盘,仪表盘方便了审核的统计环节,用可视化的方式展示了任务进度。仪表盘的评判指标包括:验收进展统计、难例集数量、标签数与含标签的样本数、标注人进展统计等5个,见图14: 图14:ModelArts中的标注审核仪表盘 4.3 Supervisely图15:Supervisely的标注流程 从图中可以看到团队标注一块的逻辑相比其他产品更加复杂,分析背后的原因: 表面上看很多步骤是为了满足团队标注这一需求(特别是外部标注团队),包括创建团队、邀请成员、创建标注作业、标注审核等等,但本质上则是安全把控和质量把控需求:
因此,这样复杂的链路是一个企业级标注产品应有的设计,尽管这样不可避免会造成用户认知成本的升高,以及用户体验的降低。 4.3.1 创建数据集 在Supervisely中,用户可以在一个数据集中完成4种标注(视频标注除外),即分类、检测、分割、姿态估计。 与ModelArts不同,Supervisely对数据集的定位更像是图片集。一批图片只需要导入一次,无论做哪种类型的标注都可以在同一个数据集上完成。且后续做训练时,可以直接得到一张图片上的所有标注。 综上,Supervisely统一的数据集模块,提升了图片导入,图片标注以及图片后处理的效率。但这种方式也有缺点:所有标注类型的操作模式固定,无法针对特定类型(例如Modelarts的图片分类可同时选择多张图片一起标注)做深入优化。 4.3.2 数据处理 Supervisely的数据处理模块叫做DTL, Data Transformation Language,是一种基于JSON的脚本语言,通过配置DTL脚本可以完成合并数据集、标签映射、图片增强、格式转换、图片去噪、图片翻转等46种操作,满足各类数据处理需求。 图16:Supervisely中为图片加入高斯模糊 虽然功能相比ModelArts来说更加强大,但是由于仅提供代码形式操作,仅适合工程师,然而大部分工程师已掌握通过python处理图片的方式,再额外学习一种语言无疑会增加学习成本。 另一方面这种特殊的语言对效率的提升也存在未知数,例如用户想进行某种图片操作,但调研了半天发现该语言不支持,最后还是要通过python来完成,到头来降低了效率。 4.3.3 自动标注 Supervisely目前提供了14款预训练的模型,训练用数据大部分来自COCO(微软发布的大型图像数据集),少部分来自PASCAL VOC2012, Cityscapes, ADE20K等其他公开数据集。 在自动标注部分,Supervisely的优势在于支持语义分割型的自动标注,加上产品在语义分割型的人工标注上拥有出色的体验,使这类型任务的标注效率得以大幅提升。 Supervisely的自动标注模块产品化程度较低,主要体现在以下两点:
图17:Supervisely(左)与华为ModelArts(右)的全自动标注配置对比 4.3.4 人工标注 Supervisely的标注功能十分强大,主要有以下2个特点:
4.3.4.1 丰富的标注形式 在所有9种标注形式中,智能工具令人印象深刻: 智能工具用于分割类型的标注,用户只需要2次点击框选一个物体,通过算法对目标进行描边即可完成一个初步的分割,再通过标注积极点和消极点完成精确标注,大大降低了分割类任务的标注成本。 图18:Supervisely中经过11次点击后完成了一个语义分割 4.3.4.2 复杂的标签系统 为了满足一个数据集涵盖多种标注类型的需求,Supervisely有一套复杂的标签系统。我们通过对3款产品的ER图来具体分析一下这套标签系统的优劣。 在图19的行人识别场景中,我们会画一个个行人包围框。那么我们就需要定义一个标签叫:行人。 图19:Supervisely中的行人标注场景 但是每个行人的属性又有不同,例如行人A戴帽,行人B不戴帽.如果我们需要区分戴帽的行人和不戴帽的行人,一种做法是创建两个标签:戴帽的行人、不戴帽的行人。 但这样的两南通危机公关哪里有个标签会丧失关联性——如果模型只要检测行人,还需要对这两个标签进行转换,效率较低。 比较合理的做法是在行人标签下创建一个属性——是否戴帽;并抽象出一个概念:对象。 用户每画一个包围框,系统就会创建一个对象(例如:行人A),每个对象会对应一个标签(例如:行人),然后每个对象可以设置该标签所具有的属性值(例如:是否戴帽=是)。 CVAT和ModelArts都是这样的做法,区别是CVAT可以直接为图片加上标签,用于图片分类。而ModelArts由于划分了图片分类和目标检测数据集,因此标签仅能在图片分类型数据中被应用在图片上。 图20:CVAT(左)和ModelArts(右)的图片-对象-标签ER图对比 而Supervisely则是把标签和属性拆分成了两个实体,再通过对象实体来关联标签和属性(如下图): 这种做法可以提高属性的复用,例如在Supervisely中,用户只需要定义一遍颜色属性,之后无论是标注行人(作为一个标签)还是车辆(作为一个标签)的颜色都可以应用同一个“颜色”下面的属性,提高了复杂标注集的准备效率。 但同时这种做法对用户体验设计提出了较大挑战,从上手难度来看,Supervisely无疑是三款产品中最难上手的。 图21:Supervisely的图片-对象-标签-对象ER图 5. 总结与展望5.1 总结对比下表为三款标注产品的功能总结: 表3:三款产品的功能总结对比
当然我们也发现有一些功能在3款产品中都没有看到,例如水印功能,会适用于保密要求的场景,如监狱,银行等。 5.2 标注工具的未来趋势5.2.1 人工标注这个环节不会消失 这其实是个悖论:假设我需要训练一个CV模型,训练模型需要准备标注好的图片,如果图片标注只需要自动标注而无需人工干预,那意味着模型已经能够准确预测出结果. 如果能做到准确预测,说明已经这个模型已经被训练完全,不再需要训练,这就和假设相悖了。 5.2.2 自动标注的价值主要体现在单个标注需要花费较长时间的标注类型中,如分割和姿态估计 既然人工标注一定会存在,那么自动标注存在意义就是提高人工标注效率,而非代替人工标注。在分类和检测任务这类单次标注耗时较短的场景中,自动标注的价值较小。 假设从0开始完成一个标注花费5秒钟,而已经进行了自动标注的情况下,修改一个标注需要花2秒,标注效率提升60%(假设跑自动标注模型是在下班之后,不影响人工标注时间)。 但我们看到可能有些图片上模型的标注结果偏差太大,这样用户还需要话1秒来删掉自动标注的结果,反而这次标注的效率降低了20%(ie., 1/5),如此高的负收益使得整体效率算下来没有提高很多。 5.2.3 人工标注的主要内容将从创建标注转变为修改标注 虽然人工标注环节不会消失,但显然自动标注将会在标注环节起到越来越重要的作用,今后常见的标注流程将会从创建一个新标注,转变为修改一个由模型创建的标注。 因此,优化修改标注时的用户体验将会是一个提高标注效率的突破点。
作者:薛康杰,AIoT产品经理,AIops, CV和IoT等平台类产品;江海龙,AI产品实习生,主攻CV产品设计。 本文由 @DarrickBM 于,, 题图来自 Unsplash,基于 CC0 协议 |
上一篇:次时代和互联网时代的变革,VR社交VS互联网社交
下一篇:众多跨境电商品牌,缘何考拉海购成为市场首位
一、标题规则:标题关键词分开的店铺,关键词排名和权重会排在前面。所以店主...
作为一个淘宝卖家,关注自己的店铺权重,是十分重要的,因为这对自己的销量、...
一般的消费者在淘宝买东西的时候都会先输入一个他理解这个产品的词组,顾客的...
淘宝直通车收费方式还是挺好的,所以对于一些资金比较少的淘宝店家来说,推广...
第一步:登录到淘宝卖家中心,点击左侧菜单中的『物流管理-电子面单平台-我的...
推广当然都希望立竿见影,最好来一个点你广告的,就做一笔生意,所以要选择你...
现在开淘宝网店只要交一些保证金就可以完成了,可以说是投资最低的创业成本了...
宝贝滞销,也就是说宝贝长期没有销量,上架之后90天依然没有销量,那么淘宝方...
直通车坑位指的是大家在使用直通车做店铺推广的时候,官方平台给予宝贝的展示...
线下活动对很多网站来说不容易,对于一些静态网站来说更加无从着手。比如技术...
小提示:您应该对本页介绍的“万字干货 | 图像标注工具竞品分析”相关内容感兴趣,若您有相关需求欢迎拨打我们的服务热线或留言咨询,我们尽快与您联系沟通万字干货 | 图像标注工具竞品分析的相关事宜。
关键词:2年, 初级, 图像标注工具