Facebook推出新AI工具可直接识别图片中的物体
DETR可以直接(并行)预测最终的检测结果
研究员将这套工具命名为DETR(Detection Transformer),并表示这套工具简化了识别图片对象需要的组件。
FAIR 在官方博客中称,DETR是第一个成功将Transformer架构集成为图像对象检测核心的工具。Transformer架构可以像近年来对自然语言进行处理一样,彻底改变计算机视觉,或者缩小与计算机视觉之间的差距。
“通过将通用的CNN与Transformer架构相结合,DETR可以直接(并行)预测最终的检测结果,与许多其他现代检测工具不同,新模型在概念上很简单,不需要专门的数据库。”研究员在论文中称。
Transformer架构由谷歌研究人员于2017年创建,Transformer架构最初旨在改进机器翻译的方法,但目前已发展成为的基石,可用于训练一些最流行的经过预先培训的语言模型,例如Google的BERT,Facebook的RoBERTa等。Transformer架构使用注意力函数代替递归来预测序列中的下一步。应用于物体检测时,Transformer可以减少建立模型的步骤,例如创建空间锚点和自定义图层等步骤。
研究人员在论文中称,DETR取得的结果可与Faster R-CNN媲美。Faster R-CNN是由微软研究院创建的对象检测模型,自2015年推出以来已获得近10000次引用。
尽管效果不错,但研究人员在论文中也指出了这个模型的主要问题之一DETR在大物体的识别上比小物体上更准确。研究人员表示“目前的模型需要几年改进才能应对类似的问题,我们希望未来的工作能够成功解决。”
值得一提的是,DETR是Facebook 最新推出的AI计划,这个计划旨在找到一种语言模型来解决计算机视觉带来的挑战。在此之前,针对自家平台上泛滥的谣言和不实消息,Facebook引入了恶意模因数据集挑战。Facebook认为,恶意图文对于程序而言是一个有趣的挑战,在短时间内还找不到完美的解决方法。Facebook希望开发者能创建出模型识别图像和随附文本中违反Facebook政策的内容。
家用机器人
- 从初生创业到人工智能领域的佼佼者
- 人工智能产业的全面发展
- 中国人工智能已比肩世界
- 全球产业格局大调整 工业4.0掀半导体变革
- 机器人13年内将抢走全球8亿人饭碗 这些职业影响
- 懒人福音:三星新款 AI 冰箱支持电动开门
- 大疆机场,让无人机基础设施巡检迈向自动化、
- 能链智电开启充电机器人等创新业务 预计2023年收
- 人工智能创新应用先导区再扩容 智能经济渐行渐
- 集萃智造三栖机器人,灵活切换水、陆、空三栖
- 机器人产业发展规划(2016-2020年)发布
- 四大论坛日程出炉,创客、机器人、校外教育、
- 新发布14家“双跨”工业互联网平台
- 《中国制造2025》解读之:推动机器人发展
- 机器人为什么能写稿,以及它们能拿普利策奖吗
- 国产机器人发展方针研究,国产AI芯片再引关注,