主要技术内容
在研制过程中,本标注标准主要参考了《标准化工作导则第1部分:标准化文件的结构和起草规则》、GB/T 41867《信息技术 人工智能 术语》、GB/T 17798《地理空间数据样本交换格式》、LY/T 2930《林业数据样本采集标准规范》等文件。主要指标说明如下:1.建设内容主要提出了影像数据样本库的建设框架,主要包括确定需求、建立数据样本库、管理数据样本库3个部分。确定需求部分主要包括3个部分:数据样本分类、数据样本采集和数据样本标注的内容,并分别规定其规范原则。数据样本分类主要由监管部门的实际需求决定,同时考虑计算机视觉算法的基本原理与算法5轮迭代成果,将数据样本按分类原则进行梳理,并根据具体工作场景进行分类内容划分;数据样本采集部分总结了不同季节、地域与方式的采集经验,包括采集的前期准备、数据样本类型、采集方法、元数据相关信息记录以及采集的数据样本格式;数据样本的标注则主要根据深度学习算法原理及实际算法模型训练与迭代经验,规范了数据标注基本流程和质量控制方法,并分别对标注角色、工具、对象、质量以及注意事项进行了归纳总结,以把控数据标注质量,提高模型训练精度上限。