进击的视觉SLAM

行业资讯 2021-05-27 13:20www.robotxin.com人工智能机器人网
从磁导航到二维码导航,移动机器人走了超过50年,从二维码导航走向SLAM导航,移动机器人只走了短短五六年来。

这五六年,随着柔性化生产的趋势越来越明显,以AMR为代表的移动机器人在全球市场内都迎来突飞猛进的发展,从企业数量的增多、市场估值的上涨到落地案例的探索,整个行业都呈现一种欣欣向荣的态势。

但也正是时间太短,所以关于AMR移动机器人的技术路线与产品形态,业内也都还在不断探索阶段。

很明显的可以看到,近两三年,以视觉能力为主的移动机器人厂商开始逐渐增多,例如灵动科技、蓝芯科技、马路创新、未来机器人等,而视觉SLAM方案也开始逐步进入主流解决方案队列。

视觉SLAM的技术路径

虽然都是视觉SLAM,由于视觉传感器的选择不同,视觉SLAM本身也分为不同的技术路径。

目前,视觉SLAM可分为单目、双目(多目)、RGBD这三类,另还有鱼眼、全景等特殊相机,但目前在研究和产品中还属于少数,,结合惯性测量器件(Inertial Measurement Unit,IMU)的视觉SLAM也是现在研究热点之一。

从实现难度上来说,大致将这三类方法排序为单目视觉>双目视觉>RGBD。

单目相机,仅用一支摄像头就能完成SLAM。最大的优点是传感器简单且成本低廉,但也有个大问题,就是不能确切的得到深度。

一方面是由于绝对深度未知,单目SLAM不能得到机器人运动轨迹及地图的真实大小,如果把轨迹和房间放大两倍,单目看到的像是一样的,,单目SLAM只能估计一个相对深度。

另一方面,单目相机无法依靠一张图像获得图像中物体离自己的相对距离。即是说,它的轨迹和地图,只有在相机运动之后才能收敛,如果相机不进行运动时,就无法得知像素的位置。,相机运动还不能是纯粹的旋转,这就给单目SLAM的应用带来了一些麻烦。

所以,国内很少有移动机器人厂商会使用单目相机来进行地图构建。

接下来是双目,双目立体视觉既可以在运动时估计深度,亦可在静止时估计,消除了单目视觉的许多麻烦。不过,双目或多目相机配置与标定均较为复杂,其深度量程也随双目的基线与分辨率限制。

中科慧眼CTO崔峰表示“双目视觉需要需保证长期在高/低温、震动的环境中,设备两个相机间不会因为热胀冷缩和机械老化发生大的变动,需持续保持良好的一致性,且对于算力要求高,产品化时需将算法移植到嵌入式芯片中。”

而RGBD相机是2010年左右开始兴起的一种相机,简单来讲就是3D深度相机。

它最大的特点是可以通过红外结构光或TOF原理,直接测出图像中各像素离相机的距离。,它比传统相机能够提供更丰富的信息,也不必像单目或双目那样费时费力地计算深度。

国内典型的厂商,如蓝芯科技,就是采用基于这种3D深度相机让移动机器人进行感知、交互、决策。

视觉SLAM与激光SLAM对比

而随着采用视觉SLAM的移动机器人厂商队伍越来越庞大,其在市场上也对以激光雷达技术路线为主的厂家产生了一定的挑战,那么这两种方案,其优劣势到底如何体现?

◆成本

从成本上来说,激光雷达普遍价格较高,SICK的激光雷达普遍上万,虽然目前国内也有低成本的激光雷达解决方案,但差距还是较大。而VSLAM主要是通过摄像头来采集数据信息,跟激光雷达一对比,摄像头的成本显然要低很多。

◆应用场景

从应用场景来说,VSLAM的应用场景要丰富很多。VSLAM在室内外环境下均能开展工作,对光的依赖程度高,在暗处或者一些无纹理区域是无法进行工作的。而激光SLAM目前主要被应用在室内,用来进行地图构建和导航工作。

◆地图精度

激光SLAM在构建地图的时候,精度较高,斯坦德机器人标准底盘构建的地图精度可达到单个毫米级别;而视觉SLAM则可能要到厘米级别;所以激光SLAM构建的地图精度比VSLAM高,且能直接用于定位导航。

◆易用性

激光SLAM和基于深度相机的视觉SLAM均是通过直接获取环境中的点云数据,根据生成的点云数据,测算哪里有障碍物以及障碍物的距离。除开RGBO,基于单目、双目、鱼眼摄像机的视觉SLAM方案,则不能直接获得环境中的点云,而是形成灰色或彩色图像,需要通过不断移动自身的位置,通过提取、匹配特征点,利用三角测距的方法测算出障碍物的距离。

未来终将走向融合?

而究竟选择何种传感器,事关移动机器人厂家对自身产品的适用环境和行业未来趋势的判断。

优艾智合CEO张朝辉表示“视觉导航虽然有很多优点,其缺点是非常明显的,鲁棒性差,环境适应度低,算力要求高,精度很难提升。所以说,现阶段的视觉受限于时间周期,并不成熟,我认为长期激光导航还会是主导,视觉导航更适合在非工业场景。”

这里面的算法和算力问题可以通过后天的技术突破来解决,环境适应能力、测距问题等属于先天不足,现在来看只能通过融合导航的方式解决。

斯坦德机器人合伙人王茂林也表示“不管是技术路线还是产品,都是看周期,没有任何一个技术或者产品是一招吃遍天下,我们要做的就是不断进行产品的迭代和创新。我们认为纯视觉的话,至少五年之后才会真正商用,那在现阶段,激光仍然是主流产品。”

灵动科技PMO兼产品负责人张硕表示“激光雷达侧重于准确、稳定、高精度,而视觉传感器更侧重机器人的灵活感知能力,所以灵动科技现在的解决方案多是视觉+激光进行融合导航,在一些产线对接上也可以采用固定信标的方式用纯视觉的解决方案,其精度甚至高于激光。”

蓝芯科技创始人兼CEO高勇认为“机器人与机器的本质区别在于,机器人具有强感知能力,而机器没有。未来,机器人的核心竞争力一定是机器人感知技术,深度视觉会让机器人打破现有机器人的认知体系,赋予机器人对三维空间的感知能力和理解能力。”

总体来说,现阶段激光SLAM相对更为成熟,也是目前最为可靠的定位导航方案,而视觉SLAM由于其可扩展性强,仍是今后研究的一个主流方向,现在两者融合已经是必然趋势。

但也要看到,传感器逐步都有往通用性上去发展的趋势,每个传感器都在开始发展别的传感器的特长,比如radar,不光只是测距准,现在4D毫米波也能输出稀疏点云,而低线束Lidar现在也能输出灰度图,类似于图像,只是分辨率很低。

融合是肯定的,只是交融过程中,也在相互渗透。所以未来一定是单纯的融合吗?并不确定。


Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by