旷视十年,AI三级跳

工业机器人 2021-06-01 09:04www.robotxin.com工业机器人教育
金磊 发自 凹非寺

量子位 报道 | 公众号 QbitAI

旷视科技,现在是一家创办10年的公司。

它是最早在中国打响名气的AI视觉明星,是一个全新ID时代的开启者,也是代独角兽中最快实现规模化营收的公司。

谈到这一波AI浪潮,往往标签就是谷歌和AlphaGo,而谈到中国AI创业,似乎开口就会是旷视和Face++……

但即便如此,对于旷视的不同认知也相差甚远。

有人依然停留在天才云集、清华姚班、AI独角兽的通识印象。

也有人看到旷视“AI+IoT”的战略选择后,认定这可能不再是一家掌握“魔法”的酷公司。

更少有人能清晰表达旷视一路的“归去来兮”,理解背后运转的关键逻辑,划定关乎本质的边界与核心。

只是现在,10年一梦,连点成线。

宏观透视当前的旷视,不断升级打怪和求解的现实挑战,可以极简到3个自然数

1、2,3……就是旷视。

1一套核心算法

旷视是一家靠算法起家的公司。

更准确来说,可以细分为两类。

一类是以深度学习(DL)和计算机视觉(CV)为基础的核心算法。

十年前,深度学习露出了快速发展的苗头,旷视抓住了这个契机,立即决定将DL和CV进行结合;于是乎,便形成了现在特征鲜明的算法能力,包括面部识别、视频结构化、图像分类、物体检测、语义分割、动作识别等。

这类算法是旷视之始,是旷视算法演进的基矗

而除了将DL与CV结合之外,旷视在它们各自能力上,也进行了相应拓展,包括更底层的DL模型,以及计算摄影、屏下、机器人导航CV能力。

基于核心算法的突破,旷视在全球AI顶级竞赛中揽获40个世界冠军,创下了前无古人的MS COCO三连冠纪录,获誉AI领域的“中国乒乓球队”。

另一类则是行业算法 (或者叫AIoT算法)。

这类算法的最大特点,就是碎片化和个性化,这点非常好理解,毕竟“千行千面”。而旷视的DL+CV,更多的是解决数据的输入问题,但如若要形成行业数据的闭环,还需要具备数据挖掘和优化的算法能力。

旷视认为,未来十年算法将无处不在,并且成为每个行业“降本增效”最核心的引擎。,在明确“AI+IoT”战略方向后,旷视利用自身能力和优势,推动了行业算法的创新,以实现价值闭环。

这其中包括在多设备调度优化、数据挖掘和分析等方面,实现了多设备之间的高效协同、数据挖掘分析和形成决策。

例如,旷视推出的河图智慧物流操作系统,就是通过同构仿真和AI调度优化的能力,实现了项目规划、仿真、实施、运营等全流程的数字化和智能化。

不过,在旷视的这个1中,算法之强,本质还不在于单个模型,而是旷视规模化、批量化生产算法的能力。

即算法生产引擎Brain++。

形象化理解,如果旷视的算法是蛋,那么Brain++就是背后的鸡。

作为一个生产力工具,Brain++的形成有旷视业务需求的内因,也有当时缺乏可用开源平台的外因。

但内外因综合之下,最终使得Brain++成为了旷视工程实践和算法创新的有力支撑。

而且相比于TensorFlo等算法框架,Brain++包含了算法、数据和计算的统一。

成为了旷视数次在全球AI竞赛中击败谷歌、微软等巨头的“秘密武器”,是旷视研发不断逢山开路的保障。

所以归结起来,旷视的算法之路,经历了从核心算法突破,到行业算法落地和创新,再到算法生产平台的拓展过程。

而所谓道生一,一生二,二生三,三生万物。

在旷视的定义里,AI是不断演进的算法能力。AI是旷视的核心能力,其后场景化落地中形成的边界感,也始终围绕这个核心。

算法就是旷视的1,有这个1才有后续落地的一切。

2有“脑”有“躯干”,软硬结合的路径

AI浪潮,被视为智能化浪潮,是一场替代简单重复脑力劳动的革命。

而这种脑力驱动,来自算法。

但产业化落地,光有“脑”不行,必须还要有“躯干”合体。这个躯干,旷视认定是IoT。

在旷视看来,IoT是一种网络,所具备的特点就是“基于场景空间”、“以人为核心”、“软硬结合”。它是旷视AI技术落地的载体。

而所谓AI+IoT,就是将AI的能力加进IoT场景中,实现从应用、数据中台、边缘设备和终端的全面智能化。

深度学习驱动的AI复兴,本质就是对数据的物尽其用。

但在现实生产中,用数据就得先有可用的数据,用石油就得先开采和部署石油管道。

所以终端执行器、传感器,最核心的价值就是数据的在线化,部署AI算法后,数据就能发挥第一层作用。

智能手机有了刷脸模组,学习了用户面部数据,接下来就能展开刷脸解锁的应用。

,在的执行器、传感器等组网之后,还需要在这些设备与应用之间增加一个智能的“大脑”,使其具备连接、分析和协同能力,这就是旷视着力打造的“AIoT操作系统”。

,AI落地必须要讲场景,明确限定区域。

而不同场景有不同的IoT设备,需要配备不同的AI算法,软硬结合的落地方式,也就成了题中之义。

比如城市公共空间、建筑楼宇,以及面向工业的物流仓储空间和工厂空间等等,场景不同,需要的AI软硬件也不同,而且交付的对象也千差万别……

只有把算法、软件和硬件的各要素能力,集成固化成终端可交付产品,才能定价交付,才能实现商业化、规模化落地。

所以旷视被外界所熟知的是战略选择AI+IoT,在消费、城市和供应链三大场景展开落地,但易于忽略的是,这种战略选择,其路径决定于软硬结合,以及由此带来的客户价值积累。

实际上,软硬结合也是AI业内的大共识。

特斯拉自研AI算法后进一步自研打造AI硬件,依图、地平线等进军芯片也都是基于AI算法和需求的重新定义。

上一个时代的软硬结合,是基于现有硬件,打造与之匹配的算法和软件。

而在IoT时代,软件和硬件是天然结合的,需要协同设计和联合优化,其本身就是软硬一体的。

3三大场景的“边界”

边界不是终点,边界只是意味着技术到商业是否实现了闭环,这是企业阶段性有所为有所不为的选择结果。

而旷视,在算法为核心、AI+IoT的软硬结合为落地方式之下,现阶段选择了三大场景,也暗合其商业价值增长的短期、中期和长期。

第一大场景,消费。最典型如智能手机为主的消费电子上的面部识别、屏下指纹及计算摄影相关的解决方案。

AI能力应用的终端(手机)已经非常成熟,规模化起量也很快,毛利率不高但边际效应明显,对于AI能力供应商而言,被认为是十亿美元市常

从2012年开始,旷视就开始给OEM手机厂商和App,提供解决方案。

除了最知名的刷脸、屏下指纹模组,还包括在AI降噪、多摄虚化、夜景超画质以及视频虚化等方面的计算摄影供应。

除了手机终端的应用之外,旷视还在基于Face++人工智能开放平台,为互联网金融、网约车、线上租赁平台等企业和开发者,提供数十种AI能力及SaaS产品服务。

第二大场景,城市。

比如面向城市区域内的公共安全、交通管理、城市管理、楼宇园区等场景,提供智慧城市解决方案。作为城市智能化和新兴基础设施的核心组成,这被认为是百亿美元的市常

旷视在该领域于2015年入局,推出过洞灵慧+边缘盒子、盘古九霄+新型交互设备等AIoT设备。

而2020年来,大众对于城市最具感知的,可能莫过于商尝地铁站和机场等公共场景的AI识别和测温了。

第三大场景,供应链。

集中体现在物流领域,相比消费和城市两大场景,旷视在这个场景入局最晚2017年,但软硬件一体化能力也展现得最充分。

有AI算法,有软件操作系统河图,还进一步基于AI定义硬件打造了AMR机器人、SLAM导航智能无人叉车、智能圆盘播种机、人工智能堆垛机……

在供应链物流场景中,一方面客户可以是衣食住行用全领域,另一方面之前的“大小脑”智能化程度不高,可以全方位升级改造。这也是该场景被认为有千亿美元潜力的原因。

目前,旷视在供应链领域,据称已经累计向鞋服、医药、智能制造、零售电商等不同行业提供了仓库、工厂及零售店的升级改造,客户数已近百位。

所以整体纵览之后,旷视在这三大场景的发展,有些正处于成熟期,有些尚处于发展期。三大业务板块市场成熟度、商业前景和规模,都有先后之分。

而万佛朝宗,虽然场景领域有不同,构建的闭环边界有不同,但三大业务板块的AI产业化落地的思路一以贯之从软件到软硬结合,从AI走向AIoT。

而从AI算法软件平台软硬结合,也被旷视认为是AI产业落地的最小路径。

更是旷视十年摸石头过河探索出的核心经验。

如何评价?

如今,站在现在来梳理,自然可以把旷视以1、2,3来审视。

不过极简如斯,过程却可能并非一蹴而就,背后都是旷视从算法到硬件,从代码空间到现实场景的10年探索和求解。

而从旷视出发,作为中国AI创业的头雁代表,其发展和演进路径,也是中国原创AI一派的缩影,是前所未有的技术创新到商业模式落地的缩影。

在AI浪潮之前,中国的创业者都是基于硅谷成熟的技术创新之上的商业模式创新,于是产生规模化商业价值的时间也就更快。

但AI浪潮不同,算法的创新天然需要与行业和数据结合,而行业错综复杂,需求高度不确定,这造成AI商业价值的落地的周期相对较长。

旷视用了10年,可能就是最具代表性的说明。

,软硬件一体的AI时代落地趋势,一次次被强化和证明。

无论是因为能力而自研芯片的特斯拉,还是旷视的算法天才们下工厂、走进仓库,在物流供应链一线打造机器人……都是这个趋势的明确注脚。

向重而生、落地为王,也在成为AI价值兑现和交付的风向,也只有朝着这个方向,才能构建从技术到商业的价值闭环。

如果说,AI落地是一道摆在所有人面前的时代级应用题。

那旷视解题的过程和答案,就是这份1、2,3…数列。

Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by