2017 已经过去一半,我们是时候对上半年做一个了。
我们为什么需要人工智能?
自深度学习概念引入以来,人工智能的发展速度有目共睹,信息科技的发展按照指数规模爆炸,将导致存储能力、计算能力、芯片规模、带宽规模暴涨,引领第二次自动化浪潮,AI 得以逐渐成长为了游戏高手、围棋大师、语音转录专家、司机、翻译家、图像艺术家、鉴黄师、武器……,她正在以不可估计的力量改变着我们的生活。
人们也开始尝试利用人工智能技术帮助改善一些劳动密集型工作,以及高精度业务,因为它能持续地像人类一样正确描述照片上发生的事,不会感到疲倦,还能阅读并概括出文本大意,最重要的是它还在不断的学习进步。
就像谷歌的联合创始人拉里·佩奇早在2002年说的,谷歌不是用人工智能强化它的搜索能力,而是利用搜索来改善它的人工智能。
计算机视觉风口和难点
计算机视觉是一门研究如何使机器“看”的科学,它能够用摄影机和电脑代替人眼对目标完成识别、跟踪和测量等工作。
像素级的处理让算法得以伸展,我们可以从算法的发展来看计算机视觉的变化。传统算法大致可以分为以下4个步骤图像预处理、特征提取、特征筛选、推理预测与识别,毫无疑问,这需要大量的经验,需要你对这个领域和数据特别了解,然后设计出来特征还需要大量的调试工作。而引入深度学习后,效果得到大幅度提升,一大批如“DeepID”人脸识别、“Region CNN”物体检测、DeepTrack物体跟踪等开源算法的出现让技术的商用变成可能。
从成熟度曲线来看,语音更靠前一点,然后是计算机视觉,特别是安防领域,封闭的场景,有一些孤岛化分布的大量数据可以用于训练,在这些领域它是有先发优势的。
业内典型公司盘点(排名不分先后)
相比图像,拥有更多可能,而如今像素的世界已经延伸到图像以外,人工智能技术能够使得从中提取信息变得跟从图像中提取信息一样简单。
这次我们在视频内容识别技术领域作了一个统一整理,挑选了其中做得比较好的24家公司进行比较,它们分别来自广告营销、游戏、企业服务、医疗健康、金融、娱乐、电子商务等领域,均已超过A轮,并且专注于文娱类的公司数量遥遥领先,其中以服务于直播监测和广告营销为主要发力方向。
1、商汤科技
技术实力★★★★★ 人才优势★★★★★ 产品商业化★★★★★商汤科技是一家典型的深度学习算法公司,目前是国内该领域,技术团队规模最大、商业化订单、收入及融资额最多的公司。由国内顶尖的计算机视觉专家汤晓鸥、徐立创立于2014年,其中技术团队占比高达90%,其中包括5位微软研究奖获得者(Microsoft Research Fello),两位A-star(阿里星人才计划),聚集了华人世界中一批深度学习和计算机视觉领域专家。
商汤科技早期专注于安防领域,现在扩展到互联网+,最广泛也是受众群体最大的一个应用是为FaceU提供的精准的人脸检测和跟踪技术,能够将Face U 的装饰和贴纸准确的贴在人脸五官上。
之后会将携手 Star VC 打造命名为“未来科技研究中心”的科技产业孵化器。
2、旷视科技(Face++)
技术实力★★★★★ 人才优势★★★★ 产品商业化★★★★★这个成立于2012年的公司目前已完成C轮融资,总估值高达20亿美金,是目前估值最高公司,商汤科技第一竞争对手。
Face++专注于人脸识别技术和相关产品应用研究,面向开发者提供服务。拥有一套非常强大的人脸检测系统。在世界最权威的人脸检测(FDDB评测)、人脸关键点定位(300-W评测),和人脸识别(LFW评测99.6%)获得三个世界第一,在安防领域的成绩也是有目共睹,为支付宝、Uber、中信银行、万科等知名企业提供 SmartID 服务。
最值得关注的是,2016年7月正式加入旷视(Face++)的首席科学家孙剑,曾经作为微软亚洲研究院首席研究员,带领的团队于2015年获得图像识别国际。
3、格灵深瞳
技术实力★★★★ 人才优势★★★★ 产品商业化★★★★格灵深瞳是第一梯队中唯一有在做硬件的公司,公司战略方向会重点放在两个应用领域,第一个最大的是安全领域,第二个领域是商业数据分析。
短短3年时间,格灵深瞳逐步搭建完自己的“格灵深瞳系”——格灵深瞳继续深耕安防和商业数据分析领域。为了进一步扩大影响范围,于2016年与前英特尔研究院院长吴甘沙、北京理工大学姜岩教授,三方共同成立专注无人驾驶驭势科技;近期还会涉足智能医疗领域。
4、码隆科技
技术实力★★★ 人才优势★★★ 产品商业化★★★码隆科技与前三家公司不同,是与时尚业接触最为紧密的一家公司,在面料识别和大数据色彩研究上优势非常明显,目前处于A轮状态,发展非常迅速。
从码隆科技核心团队成员经历和A轮投资方不难看出与微软及英伟达的渊源颇深,今年5月刚刚发布了国际版加上与英伟达的合作,非常有节奏的扩大自己的海外版图。
5、衣+(陌上花科技)
技术实力★★★ 人才优势★★★ 产品商业化★★★★衣+ 主攻方向是在图像与视频中对场景、通用物体、商品、人脸的检测、识别、搜索及推荐,帮助内容和平台实现场景营销、智能分析和内容互动。
从2014年创立以来,发展快速,产品线拉得也比较长,除了最开始的APP保留了下来,目前主打的产品有场景化营销、智能搭配等,除此之外还增加了相册分类和内容审核,几乎涵盖计算机视觉方方面面。
近两年又凭借优酷在网生内容等领域的先行优势,快速完善了技术+电商+视频平台+内容的生态模式,形成完整的商业闭环。但这也成为他们一个羁绊,目前合作平台除了优酷土豆几乎没有与其它平台的合作。
6、Video++
技术实力★★★★ 人才优势★★★ 产品商业化★★★★★Video++专注于消费级视频领域的AI科技公司,近年来也是发布了许多成熟的点播视频方案以及一整套互动视频直播方案,也和乐视、芒果、搜狐、斗鱼直播、熊猫直播等各大视频网站进行了合作,将视频识别技术运用到各类电视节目中,让用户在不反感的前提下进行广告植入,据官方发布的数据,使用此类技术的月独立UV量达到2.8亿。
在技术方面,Video++在跟踪和识别方面拥有自主创新算法,能够准确的识别出明星、物体、品牌、手机、场景等等,使机器像人类一样理解视频的内容,并发现其中有趣的点。用核心组件和视频应用将这些点进行商业化的变现,将机器识别出的结构化数据作为投放点,应用到广告和电商的场景中。
最值得关注的是,Video++将视频行业与AI技术结合,打破以往的传统商业视频模式,通过为流量平台提供视频AI、视频电商、视频互动广告等系统应用,以视觉识别和大数据为基础,来实现视频场景匹配和广告自动投放。
7、云从科技
技术实力★★★★ 人才优势★★★ 产品商业化★★★★★云从科技“国家队”的身份为其带来的优势非常明显,据了解,从 2015 年 4 月成立至今,云从的客户已经有上百家,客户群体主要集中在金融、公安和商业。光是金融行业就是 50 多家银行与非银机构,目前人脸识别产品已经成为银行业第一大供应商,并且由于在广州省公安厅与河北省厅的出色表现,正在用人脸识别技术引领公安战法变革。
2017年,云从科技会大力拓展安防领域市场,以金融行业的业务为基础向其他行业拓展,为金融和安防领域的公司提供软硬一体化解决方案也是云从的两块核心业务。
8、依图科技
技术实力★★★★ 人才优势★★★ 产品商业化★★★★依图科技创立于 2012 年,最开始从图像识别入手,与全国省市级公安系统合作,对车辆品牌、型号等进行精准识别,随后扩展到人像识别,通过静态人像比对技术和动态人像比对技术,协助公安系统进行人员身份核查、追逃、监控、关系挖掘等。
发展 4 年以来,依图科技的产品已经应用到全国二十多个省市地区的安防领域,安防领域之外,进入智慧城市领域和健康医疗领域,协助政府构建”城市大脑”,甚至未来家居、驾驶、搜索、购物等都是依图商业版图的一部分。
9、小白世纪
技术实力★ 人才优势★★ 产品商业化★★小白世纪作为一家成立于2014年的人工智能公司,在业内可能太过低调,并没有太多声音。
他们目前对自己的定位是一家致力于视频内容搜索的CBI(基于内容的互动)科技型创新公司。从产品发展脉络可以看出,从视频互动技术出发,经过两年的积累迈入人工智能行列,着力于智能搜索、广告、内容审核等视频内容识别相关技术研究,组建团队并拥有自己的深度学习网络模型,这些对小白世纪能够获得Pre-A轮融资至关重要。
不过,从目前可以查到的信息可以看出,小白世纪在人工智能方向的核心人才并不突出,核心成员无技术背景,没有首席科学家坐镇,也未成获得高质量的技术奖项和榜单,对其技术水平存疑。
10、智视VCA(视连通)
技术实力★★ 人才优势★★ 产品商业化★★★智视VCA(视连通)是一家还处在天使轮阶段以计算机视觉和深度学习为基础的科技公司,虽然目前还只有“知·视”一款产品,技术却涉及计算机视觉的方方面面,场景识别、生物识别、泛物品识别、大数据、深度学习、VR/AR等计算机视觉、智能人机交互、人工智能等领域。
尽管年轻,视连通有着清晰的商业模式,目标客户是面向视频产业的内容生产方、广告主、各类播放平台以及更广泛的电商、社交和信息类服务提供商。对收费标准也很理性,两种收费模式并行,一种是按照视频分析时长或内容量级进行计费,另一种则是按照一定场景化广告展示或交互的比例收取分成。
不过在技术人才方面有所缺失,核心成员均非人工智能相关领域研究人员,也未与其他院校及研究机构合作,也没有自有数据库,但值得注意的是,他们已经申请了两项专利(由于时间原因尚未披露),具有一定的技术保护意识。
计算机视觉技术的市场需求日益增多,投资风口也在继续扩张,为更多初创型技术公司带来希望。
不过现实也是很残酷的,大量的计算机视觉技术创业公司都集中在智能安防、医疗等垂直领域,原因很简单,大量有价值的数据都掌握在BAT手中,初创公司无法仅凭一己之力建立一整套完善的数据样本库,这对实现商业化非常不利。计算机视觉的技术门槛高,研发周期长,容易造成资金链问题,这些都是创业者需要看见的,不能一味的 ALL IN 入场。
科技让我们拥有了能够想象未来并掌握未来的能力。