一个新兴技术,在层面开始被认可,人工智能某种程度上改变了其几十年来介乎科学与工程学之间的尴尬地位。这些应用,包括(智能个人助理)、无人驾驶、医疗、金融等,人工智能在未来将会无孔不入。
无人驾驶、机器人 起飞却无法落地的人工智能
先来说说无人驾驶,谷歌在很久以前便开始在这一领域布局,对谷歌来说,提前释放所谓的黑科技是其惯用的PR手段。无疑谷歌这一手段是成功的,近两年,众多汽车厂商与百度开始将这一概念在国内释放。
理论上无人驾驶也是人工智能一个非常有前景的应用领域。但目前无论是技术上还是伦理上,无人驾驶短期内面临很多无法解决的问题。
是安全问题,据央视《法治在线》栏目报道,今年1月,一位23岁男青年驾驶着自己的特斯拉轿车在京港澳高速河北邯郸段公路行驶,未能及时躲避前方的道路清扫车而发生追尾,事故导致该名车主身亡。可以理解为技术实操上仍存在着诸多未解决的问题。
国内不少厂商也正在无人驾驶领域持续投入,包括百度、乐视等等,但这些厂商无一例外目前都没有拿出太多让大众满意的成果。
比较关键的一点是,对于无人驾驶来说,愿景虽好,但实现很难。今年4月,公安部交通管理科学研究所副所长孙正良曾公开表示,“未来需要建立车车通信、车路通信的安全认证机制,以及让路侧设备智能化、电子化。如果这些东西都没有,将来要求无人驾驶难度相当大。”
可见无人驾驶这项人工智能技术真正落地还需要很长一段时间。
除无人驾驶技术外,一些公司还开始做起了机器人,比较有名的是由日本软银集团和法国Aldebaran Robotics共同研发的Pepper,除此之外还有“小度”、“贤二”以及一些国内创业公司所研发的机器人,在品质上虽然有高有低,但都以娱乐博眼球为主,并没有实质的场景应用价值。
语音助手可能是未来AI落地最靠谱的方向
相对于无人驾驶、,几年前为了“解放双手”, 语音助手被看作下一代非常有潜力的交互方式和搜索方式。而近两年人工智能技术开始成熟之后,语音助手被赋予了更多的意义,人们期待未来语音助手真正能够理解用户、帮助用户完成一些任务。从技术的角度,这几年国内外的几个大厂商都已经基本完成了第一阶段的技术积累。
美国科技界两大巨头——苹果和谷歌,都在近期显示出加码智能语音助手的决心。一个是iPhone7发布会上,苹果的AirPods增加了Siri的使用场景,而Google 近期在发布会上也突出了Google Assistant的核心地位,无论是Pixel还是Google Home,其内在核心都是Google Assistant的运用和联动。
所谓的智能语音助手,顾名思义是在语音正确识别的基础上,理解用户所表达的真正意思,并为用户提供实质性的帮助。而语音识别的准确率是智能语音助手真正发挥智能的技术基础。
其实,人类已经花费了几十年去研究语音识别技术,但误差率一直都无法降低,直至去年,在英语识别方面,人类在室内的语音识别误差率还停留在约8%,语音识别技术的误差率则在12%,而且还是实验室内的结果。
从目前的发展来看,国内的语音识别技术已经开始领先于国外。我们以目前语音识别领域排名第一的搜狗公开的数据来看,目前搜狗输入法的语音识别准确率已经超过了97%。
97%的准确率是什么概念?相当于一些人耳朵不好分辨的语音内容,搜狗语音识别已经能听得懂了。这个比例,其实已经超越了国外的语音识别技术水平。,搜狗输入法的语音识别功能平均每天被调用次数达到1.9亿次,这样的数据规模也是目前国内语料规模最大的,也让搜狗输入法的语音识别准确率可以更迅速地提升。
就像王小川自己说的,人工智能划分为识别、生成和决策三个阶段,识别与生成是同等重要的;而要让人工智能产生市场价值,决策才是让人工智能变成商业智能的核心。正常的逻辑下,针对特定场景的人工智能才是当前最成熟,也是最容易落地的。
事实上,这几年特别是在国内,之所以智能语音助手能够在用户群中广为普及,某些娱乐应用功不可没,比如两年前的微软小冰。
这种应用的好处在于接地气,娱乐性很强,具有一定的“病毒性营销”效应,能够迅速让用户体验语音识别、语义理解。但其实这种娱乐类的语音助手,个人认为受限于开放环境的限制条件,无法提供针对所有用户提出问题的正确回应。
在我看来,在保证语音识别准确率的基础上,搜索引擎公司拥有做智能语音助手的最好基因,毕竟搜索本来就是一种用户获取信息的方式,语音助手本身就是对搜索的体验进一步升级。利用语音识别技术针对于垂直场景所开发的智能语音助手,更切合实际应用,这种方式要比噱头更有实际意义,也有利于人工智能技术的实际发展。
值得一提的是,搜狗目前已经开始在垂直场景下发力,比如前一阵子推出的“语音修改”,用户可以用自然语言的形式修改自己输入的内容,比如“把弓长张修改为立早章”等。在智能导航领域,用户如果想要去机场,只需要告知导航系统航班号,即可提供相应机场地点与时间等信息。
,我们也有理由相信,技术的发展会为我们带来通用型的语音助手,但个人认为,短期之内做好垂直场景的体验和技术积累,会让通用型助手来得更快。