今天看啥  ›  专栏  ›  AI小毛

ModelArts2.0难例特性体验

AI小毛  · 简书  ·  · 2020-01-19 20:36

ModelArt2.0版在“数据标注”这功能模块上面变化很大。今天我们简单体验下其中的“难例标注”这一新功能。首先,它不是在我们首次数据标注中使用,而是在我们发布了一个基础模型后。针对新的未识别数据提供再次标注来完善AI模型的模型升级体验。说的有点绕口了,接下来我把其中比较有特点的说明下:

来自华为云官方流程图(https://support.huaweicloud.com/engineers-modelarts/modelarts_23_0223.html)

1.这是难例数据集导入模块。启动“数据采集”功能后,系统可以把上传上来的数据进行分析,当识别为:

识别不出内容

则把数据收集到难例数据集里面。同时能根据时间段进行数据集的分列。

后来又试了一次,还是没有太确定这个触发的机制。不知道是不是上传后停止(几分钟)就开始新建任务。


可以看出这里的设计是为了多人团队标注使用的。哪类数据集可用,哪类再调整下。都可以在这里进行统一管理。

2.

重新标注完难例数据集后,进行新的一轮发布。同一个模型也提供了一个配置更新记录。之前以为是数据集版本与模型版本一致,也会进行版本的迭代。简单使用后,我在考虑注册一家公司来做数据标注工作。之前的平台的标注工作是单流程的。当遇到复杂标注的时候,只能靠外部工作来协调。现在,可以在ModelArts平台上来回的对数据进行标注优化,以达到最佳标注数据集。核心功能的理解为:模型部署上线后,还能把预测后未识别出来的数据进行收集。把这些数据收集到难例数据集中。让用户再次进行标注、训练、部署、验证。可持续的通过新增验证数据集来完善整个AI模型。这将快速提高数据收集标注的工作效率。




原文地址:访问原文地址
快照地址: 访问文章快照