超越微软COCO 全球最大物体检测数据集“旷视Ob
图“智源学者计划启动暨联合实验室发布会”在京召开
旷视Objects365首批开放60万张图像和1000万标注框,超越微软COCO
据旷视首席科学家兼研究院院长孙剑介绍,在规模方面,旷视Objects365定义了生活中常见的365个类别,第一批将开放63万张图像,1000万的标注框。开放图片数是微软COCO的5倍,标注框超过微软COCO的11倍。
算法优化的上限严重依赖于基准数据集术的质量。,为保证标注质量,在打造旷视Objects365时,旷视设计出一套科学而严格的标注流程,每一张图片的背后至少会经过9名标注工人之手。,作为一个优秀的预训练数据集,旷视Objects365预训练模型在使用过程中,可以轻松超越现有算法的精度,显著加速收敛过程,表现出极强的泛化能力。在执行COCO、VOO Det、CityPersons等检测任务时,在VOC Seg和ADE等分割任务上均有显著提升。
除此之外,孙剑还表示“虽然旷视Objects365已是目前世界上最大的物体检测数据集,但我们的目标是在未来3年内将这个数据集从现在的60万,扩大到200万图,超过2000多万框,进一步扩大这个数据集。”
图旷视首席科学家兼研究院院长孙剑在发布会上讲话
重视数据共享,旷视为行业发展树立新的里程碑
相较于算法,高质量的数据能对深度学习带来更大的提升,因而数据共享是集结全行业之力推动计算机视觉发展的关键之举。并且近几年,相关技术的进步使得图像采集设备一代代革新,更高清晰度、更优色彩表现的图像将会对计算机视觉模型的训练产生更大影响。旷视Objects365 数据集的发布,无论从数据规模再到标注质量,皆为计算机视觉基础技术通用物体检测树立了新的里程碑。
值得一提的是,旷视Objects365数据集将被用于Detection In the Wild 2019(DIW 2019)挑战赛中。DIW 2019由旷视研究院联合北京智源人工智能研究院举办,并已成功申请到2019 CVPR Workshop,其目的是为了推动目标检测技术的发展,改善现有目标检测数据集的类别覆盖不全、标注精度不高、密集场景缺少等问题。
DIW2019挑战赛的比赛赛道分为三个赛道,即Objects365赛道、Objects365小赛道和CrodHuman赛道。其中,为探索目标检测系统的瓶颈,参加Objects365赛道的选手将利用公开的365种类别,60万张图片超过1000万个框的完整训练集对检测模型进行训练;在3万张图片构成的验证集上调试算法,并在10万张图片构成的测试集上进行最终的挑战。
主办方为每个赛道的冠军队伍准备了10000美元的奖励。,挑战赛赛程共分为四个阶段即日起进入第一阶段,开放注册并同步发布训练集和验证集;第二阶段(5月初)发布测试集数据;第三阶段(6月初)终止提交结果;阶段将于CVPR 2019 Workshop期间公布比赛结果,并邀请优胜队在研讨会中介绍比赛经验,共同探讨检测问题的瓶颈及优化方向。
DIW2019挑战赛只是旷视Objects365数据集其中一个应用案例。相信随着该数据集的发布,研究社区得以在旷视 Objects365 这一全新的 Benchmark 上开展更多实验,这势必会推动通用物体检测技术发展新一波浪潮的到来,为计算机视觉技术发展注入新活力和新动力。
机器人工业设计
- 工业机器人技术专业方向 工业机器人技术专业方
- 国际上第一台工业机器人产品诞生于 世界上第一
- 工业机器人编程属于什么专业 工业机器人编程属
- 工业机器人编程是学的什么专业课程
- 工业机器人技术需要学什么 工业机器人技术需要
- 工业机器人编程是学的什么内容 工业机器人编程
- 工业机器人发展趋势 工业机器人未来的发展趋势
- 国内工业机器人企业排名 2024年国内工业机器人企
- 工业机器人学起来难不难 工业机器人好不好学
- 工业机器人就业形势了解 工业机器人就业现状
- 工业机器人编程及操作的阅读内容 工业机器人编
- 工业机器人编程难不难 工业机器人编程难不难学
- 工业机器人入门实用教程 工业机器人入门应该学
- 工业机器人编程基本思路是什么 工业机器人编程
- 工业机器人难学吗 工业机器人学起来难不难
- 工业机器人岗位介绍 工业机器人岗位说明