打造一家像Amazon Go的无人零售店,需解决哪些核心问题?
自亚马逊Go推出以来已经过去四个月,对国内的传统零售商和创业者产生了深远影响。不少企业纷纷尝试搭建无人零售商店,然而由于对技术和工程细节的不熟悉,往往难以入手。无人零售不仅是人工智能在计算机视觉方面的应用,更涉及到大规模的传感器和智能设备的运用,是一个复杂且庞大的项目。虽然已有关于无人零售商店的原理解读被分享出来,但大多只停留在粗略的实现方式上,未能深入细节。
针对这些疑问,无人零售商店创业者陈维龙(微信:daoyuan3)以Amazon Go的原理为基础,为大家解答疑惑。他提到,打造无人零售商店的核心在于解决“什么商品被谁怎么处理了”的问题。这涉及到五个要素:人、人的位置、商品、商品的位置以及动作。
对于动作这一部分,主要是通过识别商品与手或货架的状态来进行。例如,通过识别手进入或退出货架的手势以及物品在手上的状态,来识别顾客是否拿取或放回商品。要成功实现这一环节,需要对技术和工程细节有深入的了解和熟练的掌握。
在解决这些问题的过程中,创业者需要借助先进的科技手段,如人工智能、传感器和智能设备等。只有掌握了这些技术,并成功将这些技术应用到实际场景中,才能有效地解决无人零售商店运营过程中的各种问题,为顾客提供更好的购物体验。
商品识别之旅始于初始状态的选择。购物清单的核对成为中间环节的救命稻草,它帮助我们缩小识别范围,降低识别难度。雇员的角色至关重要,他们确保初始状态不受干扰。
位置定位技术如手机定位、传感器定位和图片定位等,再结合人体姿态识别,让动作定位到人变得轻而易举。
让我们聚焦Amazon Go的便利之处。传统的收银模式将核对商品和收银权利集中在收银员手中,顾客需要到一个指定地点一次性确认购物行为,并等待收银员空闲。Amazon Go采取的是分布式并行处理方式,顾客的每一次购物行为都会在发生地即时被系统处理并记录,不占用额外系统时间。
若顾客有意购买商品,必须经历一个关键过程——从拿起商品到握在手中的状态转变。货架上的同一商品则处于不可购买的状态。
反之,如果顾客决定不购买商品,那么商品将被放回货架,重新回归在架状态,这也意味着顾客经历了商品的拿起与放回过程。还有一种情况,即顾客并未拿起或放回商品,此时无需进行任何操作,因为没有任何状态变化。
那么,我们如何准确表示或测量这两种状态呢?无论是相机还是传感器都能捕捉到这些变化。具体来说:
相机的处理方式:
当顾客在挑选商品时,我们可以在手进入货架拿取商品前后,对顾客的手以及货架本身拍摄一系列图片。这些图片可以分为四组:第一组拍摄手在进入货架前的状态,第二组拍摄手拿取商品后的状态,第三组拍摄货架上的整体情况,第四组拍摄手拿走商品后货架的状态。通过这四组图片,我们可以清楚地了解到商品的状态变化以及顾客的购买行为。陈维龙对相机处理流程进行了详细的阐述,其重点在于通过肤色识别手部,进而追踪商品的状态。
他解释了如何利用肤色找到手的位置。通过计算机视觉(CV)算法,我们可以识别图像中的肤色,并据此定位到手部。一旦手部被识别,接下来的步骤便是通过手边缘的色差来判断商品的状态。
当比较连续的两张图片时,我们可以通过手边缘的色差来识别商品是否在手。如果第一幅图片手边缘的色差较浅,表示手中没有商品;而在第二幅图片中,如果手边缘的色差明显加深,那就意味着商品已被拿起。放回商品的过程同理可推。
对货架的处理同样重要。通过对比第三幅和第四幅图片,我们也可以判断商品的拿取或放回状态。例如,如果第四幅图片比第三幅图片显示的商品数量增多,那就意味着商品被放回;反之,如果商品数量减少,则表示商品被拿取。
而在传感器处理方面,陈维龙也给出了深入的解析。对于重力传感器,商品的重量的变化可以直接反映其拿取或放回的状态。当商品被拿走时,重量会减少;当被放回时,重量则增加。对于红外传感器,商品的拿取和放回也会影响红外的遮挡状态,从而为我们提供判断的依据。
在识别商品方面,陈维龙强调了对细节的关注和对技术的深入理解。从肤色识别到手部追踪,再到利用图像和传感器数据的分析,每一个步骤都需要精确的执行和深入的思考。而他的阐述方式也极具吸引力,将复杂的技术问题以生动、易懂的方式表达出来,让人对商品的识别和追踪技术有了更深入的了解。商品识别无疑是购物体验中的一大关键环节,其难度堪称顶尖挑战之一。想象一下,超市中的商品品类从千余种到数十万种不等,要在真实且可能受到干扰的环境下准确识别如此繁多的商品种类,几乎是一项不可能完成的任务。
初始状态下的商品识别相对简单。在商品摆放的初始阶段,特定品类的商品被放置在固定位置,由高精度的相机和传感器进行侦测。这些设备只需关注并识别少数特定的商品类别和数量,这样的任务对于它们来说相对容易完成。即使图像识别出现困难,还可以依赖重量识别进行筛查。在品类摆放时,可以选择易于区分的品类相邻摆放,同时所有被拿取的商品都会被记录在顾客的购物清单中。
当进入中间状态时,挑战便接踵而至。顾客在购物过程中的放回行为会破坏初始状态,使得识别难度急剧上升。因为顾客可能将商品随意放回,这导致商品的识别范围扩大,甚至可能出现无法识别的情况。
那么,如何应对这一难题呢?首先我们要考虑到商品被放回后的两种状态:放回正确或错误。对于放回正确的商品,识别难度仍然保持在初始状态的水平。对于放回错误的商品,情况就复杂得多,存在三种可能的情况:一是虽然放回错误但可以被识别;二是放回错误且无法识别;三是放回错误并且识别出错。
面对这样的挑战,我们需要不断探索和创新技术,以应对各种可能出现的情况。只有这样,我们才能在保证购物体验的实现商品的准确识别。在商品拿取、放回的过程中,识别动作发起者的身份是确保系统正常运行的重要环节。对于动作的发起者,也就是顾客或雇员的身份识别,我们首先需要理解在不同状态下的识别难度和策略。
在初始状态,即商品被拿取时,由于商品种类特定且数量有限,识别范围相对较小,通过图像和重量筛查即可轻松完成识别。通过前期的品类选择和摆放,我们可以使这一初始状态的识别过程更加顺畅。
当商品被放回时,我们面临一定的挑战。大部分情况下,放回商品可能会出现错误且无法识别,或是识别错误。针对这种情况,我们可以考虑通过索引顾客购物清单来缩小识别范围,将识别难度维持在可处理范围内。及时通知雇员整理商品,有助于纠正偏差,确保系统的稳定运行。
在最终状态,由于多次的放回动作可能导致系统偏离初始状态。尽管放回识别的难度并不大,但长期的误差累积可能会导致系统崩溃。为了解决这个问题,我们需要对系统进行持续优化,提高算法精度,并调整判断极限值,将部分识别错误的情况转换为无法识别的情况,并及时通知雇员进行整理,以确保系统能够回到初始状态或尽可能接近初始状态。
陈维龙总结道:通过结合图像、重量筛查、购物清单索引以及及时的人工干预,我们可以在一定程度上识别动作发起者的身份。虽然过程中会出现一些错误和偏差,但通过不断调整和优化系统,我们可以确保这些错误和偏差在可接受的范围内,不会对整个系统造成长期的影响。一、商品与动作发起者的紧密关联:一项复杂的工程
陈维龙详细介绍了商品与动作发起者的紧密关联背后的复杂性。识别人主要通过两种方式:身体特征或附带物,如人脸和手机。其中,人脸识别的精度在室内环境下相当可靠,可作为个体的唯一标识。通过判断是谁的手机,也能准确识别顾客身份。
二、“被谁”背后的位置因素
“被谁”这一表述中隐含了一个核心因素:位置。要确认商品被谁拿走,或小张是否被小陈打了,商品和顾客的位置必须匹配。这一匹配过程需要精确的定位技术作为支撑。
五、顾客 ID 与商品 ID 的完美匹配之旅
如何准确地将顾客 ID 与商品 ID 匹配起来?首要任务是确定人和商品的定位。对于人的定位,追踪系统、手机的 GPS、wifi 以及蓝牙都是有效的工具,能够提供准确丰富的位置信息。而对于商品的定位,可以利用红外、重量感应、相机等技术,结合商品和货架的初始信息,进行精确推测。例如,通过分隔同类商品的不同网格,每个网格对应不同的红外或重量感应器,可以精确知道商品的位置,从而确保顾客与商品的ID匹配无误。
通过这样的方式,我们可以更准确地追踪商品和人的移动,确保每一个交易都准确无误,为商业活动提供极大的便利。通过人与商品的位置匹配,成功连接了“什么商品”与“被谁”这两个关键因素。由于成本和技术上的限制,位置精度成为了一大挑战。在实际应用中,顾客与商品的匹配误差较大,例如顾客A在商品A前,而顾客B在商品B前,当顾客A伸手去拿商品B时,系统往往无法准确判断。虽然可以通过顾客确认来补救,但这种方法显得颇为无力。
此前,Amazon Go被提及采用多角度完整人体姿态识别来定位人、动作与商品之间的关系。此方案的关键在于摄像头需拥有广阔的视野和充足的数量。观察其宣传视频,可见Amazon Go的货架设计使得最低层和中间层视野受限。可能的解决方案是依赖对面货架和天花板的摄像头。显然,Amazon Go的货架构造对其运营模式至关重要。只需提供货架结构图或实物图,便可进一步推测其实施方案,探究每层是否设有摄像头、承载商品的承重面形状及尺寸、特殊开口和螺丝位置等细节。
总结而言,虽然该方案的技术实施难度并非想象中那么困难,但工程量庞大。即便动作和商品识别准确率高达100%,由于定位方案和精度问题,整体识别仍存在一定误差,使得整个方案无法全面应用或需顾客的部分协助才能实现。Amazon Go以及其他未来的无人零售店可能仅在小范围内对特定人群如信用度高的会员开放使用。
陈维龙将无人收银的发展划分为三个阶段:首先是商品和顾客行为数据的统计阶段,接着是识别正常购物的无人收银阶段,最后是识别作弊的无人收银阶段。在第一阶段,任务相对轻松,仅需进行统计工作,顾客诚信购物,无需担忧作弊现象,与无人收银相比,统计误差的空间较大。
到了第二阶段,我们致力于在顾客不作弊的情况下,百分之百地记录顾客和商品的数据,以实现无人收银的便捷体验。这正是Amazon Go所达到的阶段,它的成功得益于建立在高素质会员群体之上。
而第三阶段的目标则更为远大,我们不仅要实现无人收银的便捷,更要通过技术识别并阻止所有的作弊行为,彻底杜绝超市或零售行业中的盗损问题。这是技术发展的更高境界,也是零售行业未来的发展方向。
关于如何实现这一目标,陈维龙认为达到第二阶段后,就可以逐渐向第三阶段过渡。他提出可以通过识别正常的购物行为,对特殊情况则进行人工收银的标记。在此基础上,我们可以逐步扩大正常购物行为的识别范围,缩小特殊情况的范畴,使得系统更加友好、智能,为顾客带来更为流畅的购物体验。这样,我们不仅能提升效率,也能更好地维护零售行业的公平与秩序。
机器人技术
- 800多家中国机器人企业近半无产品
- 看看机器人在和你抢什么
- 马化腾、李彦宏等科技企业大佬们在贵阳大数据
- 机器人投入汽车产业园 探索机器人产业链
- 特斯拉 Cybertruck 电动皮卡换上黑色外衣,有望为
- 沁峰如何成为冲压机器人细分赛道国家专精特新
- 运动机器人智障了吗?
- Rivian 将投资 50 亿美元在佐治亚州建造电动汽车工
- 调查发布 - 制造业在疫情防控常态化下突围——
- 未来工业机器人的市场什么样的变化
- 进博会特斯拉展台最全预测 沉浸式体验智能制造
- 美国将中国电动汽车关税提高到 100%,极星 CEO 对
- DeepMind 联合创始人:交互式 AI 才会“改变人类”
- 把握发展趋势 推动机器人产业高质量发展
- AI入侵教师职业,这五类产品发展迅猛
- 他们用AI和食用植物创造“人工肉食”,你想尝尝