超越微软COCO 全球最大物体检测数据集“旷视Ob

工业机器人 2021-06-01 09:02www.robotxin.com工业机器人教育
4月16日,由北京旷视科技有限公司与北京智源人工智能研究院共同举办的“智源学者计划启动暨联合实验室发布会”在京举行。在会上,旷视研究院联合北京智源人工智能研究院发布了全球最大的物体检测数据集——旷视Objects365,该数据集也是新一代通用物体检测数据集,具有规模大、质量高、泛化能力强的特点。

图“智源学者计划启动暨联合实验室发布会”在京召开

旷视Objects365首批开放60万张图像和1000万标注框,超越微软COCO

据旷视首席科学家兼研究院院长孙剑介绍,在规模方面,旷视Objects365定义了生活中常见的365个类别,第一批将开放63万张图像,1000万的标注框。开放图片数是微软COCO的5倍,标注框超过微软COCO的11倍。

算法优化的上限严重依赖于基准数据集术的质量。,为保证标注质量,在打造旷视Objects365时,旷视设计出一套科学而严格的标注流程,每一张图片的背后至少会经过9名标注工人之手。,作为一个优秀的预训练数据集,旷视Objects365预训练模型在使用过程中,可以轻松超越现有算法的精度,显著加速收敛过程,表现出极强的泛化能力。在执行COCO、VOO Det、CityPersons等检测任务时,在VOC Seg和ADE等分割任务上均有显著提升。

除此之外,孙剑还表示“虽然旷视Objects365已是目前世界上最大的物体检测数据集,但我们的目标是在未来3年内将这个数据集从现在的60万,扩大到200万图,超过2000多万框,进一步扩大这个数据集。”

图旷视首席科学家兼研究院院长孙剑在发布会上讲话

重视数据共享,旷视为行业发展树立新的里程碑

相较于算法,高质量的数据能对深度学习带来更大的提升,因而数据共享是集结全行业之力推动计算机视觉发展的关键之举。并且近几年,相关技术的进步使得图像采集设备一代代革新,更高清晰度、更优色彩表现的图像将会对计算机视觉模型的训练产生更大影响。旷视Objects365 数据集的发布,无论从数据规模再到标注质量,皆为计算机视觉基础技术通用物体检测树立了新的里程碑。

值得一提的是,旷视Objects365数据集将被用于Detection In the Wild 2019(DIW 2019)挑战赛中。DIW 2019由旷视研究院联合北京智源人工智能研究院举办,并已成功申请到2019 CVPR Workshop,其目的是为了推动目标检测技术的发展,改善现有目标检测数据集的类别覆盖不全、标注精度不高、密集场景缺少等问题。

DIW2019挑战赛的比赛赛道分为三个赛道,即Objects365赛道、Objects365小赛道和CrodHuman赛道。其中,为探索目标检测系统的瓶颈,参加Objects365赛道的选手将利用公开的365种类别,60万张图片超过1000万个框的完整训练集对检测模型进行训练;在3万张图片构成的验证集上调试算法,并在10万张图片构成的测试集上进行最终的挑战。

主办方为每个赛道的冠军队伍准备了10000美元的奖励。,挑战赛赛程共分为四个阶段即日起进入第一阶段,开放注册并同步发布训练集和验证集;第二阶段(5月初)发布测试集数据;第三阶段(6月初)终止提交结果;阶段将于CVPR 2019 Workshop期间公布比赛结果,并邀请优胜队在研讨会中介绍比赛经验,共同探讨检测问题的瓶颈及优化方向。

DIW2019挑战赛只是旷视Objects365数据集其中一个应用案例。相信随着该数据集的发布,研究社区得以在旷视 Objects365 这一全新的 Benchmark 上开展更多实验,这势必会推动通用物体检测技术发展新一波浪潮的到来,为计算机视觉技术发展注入新活力和新动力。

Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by