旷视发布全球最大的物体检测数据集 构建高质量
我国亦将缺少有效的训练资源库列为影响人工智能发展的痛点问题之一,工信部此前发布的《促进新一代人工智能产业发展三年行动计划》更是明确提出,支持建设面向、视觉识别、等基础领域及工业、医疗、金融、交通等行业领域的高质量人工智能训练资源库、标准测试数据集并推动共享。
在此背景下,旷视研究院在日前举办的“智源学者计划启动暨联合实验室发布会”上,发布了全球最大的物体检测数据集——旷视Objects365。
图旷视首席科学家兼研究院院长孙剑介绍旷视Objects365
据旷视首席科学家兼研究院院长孙剑介绍,旷视Objects365是新一代通用物体检测数据集,具有规模大、质量高、泛化能力强的特点。在规模方面,旷视Objects365定义了生活中常见的365个类别,第一批将开放63万张图像,拥有高达1000万的标注框(每张图像的平均标注框为 15.8个),而这个数量级分别是目前全球最权威的物体检测数据集——MS COCO的5倍和11倍。
图旷视Objects365与大型经典数据集的基本对比
,在研究过程中,由于算法优化的上限严重依赖于基准数据集的质量,旷视研究院在打造旷视Objects365时设计了一套标注流程,通过标注员严格的资质审核,以及对目标物体严谨、科学的分类保证每一张图片的标注质量。
,作为一个优秀的预训练数据集,旷视Objects365预训练模型在使用过程中,可以轻松超越现有算法的精度,显著加速收敛过程,表现出极强的泛化能力。在执行COCO、VOO Det、CityPersons等检测任务时,在VOC Seg和ADE等分割任务上均有显著提升。
相较于算法,高质量的数据能对深度学习带来更大的提升,对计算机视觉模型的训练产生更大影响,因而数据共享是集结全行业之力推动计算机视觉发展的关键之举。基于此,旷视Objects365 数据集的发布,将推动通用物体检测技术的发展,为中国人工智能计算机视觉技术的发展与应用注入新活力和新动力。而且,无论从数据规模再到标注质量,旷视Objects365皆为计算机视觉基础技术通用物体检测树立了新的里程碑。
在未来,旷视还将进一步推动数据集的构建。据孙剑透露“虽然旷视Objects365已是目前世界上最大的物体检测数据集,但我们的目标是在未来3年内将这个数据集从现在的60万,扩大到200万图,超过2000多万框,进一步扩大这个数据集。”
机器人工业设计
- 11个工业智能机器人
- 工业机器人技术专业专升本难吗 工业机器人技术
- 工业机器人就业方向及前景专科专业
- 国内工业机器人龙头公司 国内工业机器人龙头企
- 工业机器人岗位职责有哪些
- 工业机器人技术专业需要学什么
- 工业机器人技术难学吗 工业机器人技术是学什么
- 世界上第一台工业机器人资料
- 工业机器人技术大专毕业工资 工业机器人技术专
- 工业机器人方向研究生好就业吗
- 工业机器人编程主要学什么 工业机器人编程主要
- 工业机器人技术容易学吗 工业机器人学起来难不
- 学工业机器人就业前景分析 学工业机器人就业前
- 工业机器人编程需要学什么方向 工业机器人编程
- 工业机器人编程属于什么专业 工业机器人编程专
- 工业机器人的专业 工业机器人的专业课程有哪些