张胜:让机器人像手机那样人人能用

智能机器人 2019-08-15 21:05www.robotxin.com人工智能机器人网
   11月6日下午,第七届中国国际高峰论坛主题论坛上,广州灵聚信息科技有限公司CEO张胜以《让机器人像手机那样人人能用》为题为我们分享了关于当前人机交互方面的现状及发展趋势。(以下文字根据现场速记整理,仅供参考)
  灵聚洛江是做自然语言交互的。关于好莱坞机器人,灵聚科技在两年前也曾有过探讨。很多拍摄有时候必须用到一些实际的道具,而不是完全依靠CG,比如涉及到会出现机器人的拍摄场景中,可以先制作出一款机器人,进行角色扮演,后期再进行角色加工,这是完全可行的。
 
  实际上两年前自然语言的技术还不是特别成熟,现在相对来说已经成熟很多。自然语言技术是人工智能技术当中的微小领域,只要跟人打交道的产品最终都离不开自然语言交互技术。因为语言是人类传递、传承知识的重要工具和载体,同样机器人想要能够理解人的意图,掌握人类的知识,进行具体的分析和判断,掌握语言这门技能是绕不开的。
 
  张胜为大家介绍了关于人机交互的革命历史。以前所有的人机交互手段没有一家是处于核心地位的,比如最早做按钮的公司,做键盘、鼠标的公司,没有一家公司成为了一个行业的核心区位领导者。
 
  实际上到现在为止可能也有人认为NLP就是语音交互,但其实语音交互是有两个不同的阶段的。一个是语音命令阶段,另一个就是现在所处的自然语言交互阶段。
 
  语音技术并不等同于语义技术。语音命令只需要发出一个指令就可以了,但如果你和你的AI说“屋子有点黑”,暗示着应该帮忙开一下灯,这就进入了自然语言交互阶段。
 
  自然语言理解是非常快速的阶段,自然语言交互阶段很快将会过渡到认知计算阶段。这个阶段将会整合包括机器视觉,更加丰富的传感器等多模态交互。在输入越来越多的情况下,就需要机器本身能拥有足够的知识和算法数学模型来进行分析判断。在这样的一个大方向上,聚灵科技现在正在做一些相关的研究。相信自然语言交互阶段是能够摆脱前几个人机交互的尴尬状态的。
 
  语言本身是传承人类知识的重要手段和工具,它与以往的三个阶段都不一样,以往的三个阶段实际上是响应人的自然动作,而自然语言交互阶段是在响应人的意图。
 
  NLP在当前的领域来讲遇到的问题概括成两个词,一个就是“刚需”,一个是“通用”的问题。
 
  灵聚一直在坚持做通用的自然语言交互技术,外界对此会有两种评论,一种是骗子,一种就是疯子。为什么会有这俩种评论?因为做通用非常难,所以现在很多人都改做了垂直场景。灵聚科技一直在这方面考虑如何去落地真技术。其实现在自然语言交互技术非常麻烦的一点是人说了任何一句话,你能不能知道他的意图是?这是其一。
 
  其二,根据上下文来才到它的意图是什么。在这个方面,需要做很多的处理工作。限于神经网络的局限性,神经网络技术解决不了这个问题,因为语言本身是非连续性的,非连续性的语言没办法被神经网络循环、收敛和计算,所以会很快遇到瓶颈。
 
  比如说现在做QA,微软可以和人聊很长时间吗?张胜先生随后又举例了关于最近很火的索菲亚,张胜先生认为那并不是真实的交互,而是通过人工编辑的,中的主持人也承认了这一点。
 
  在这样一个现实情况下,虽然现在的技术取得了相当的发展,依然有很多的问题有待解决,刚需应该被列在首位。刚需跟通用本身是有一个矛盾点的,刚需往往是某一个具体的应用需求。
 
  张胜随后又谈到了机器人格斗。机器人格斗在细分领域里面解决了一些需求的问题,而且把它成为了一种刚需。作为自然语言交互问题也要解决刚需的问题。整个市场分析包含有俩方面,一个是商用的,另一个就是针对儿童的早教机器人。
 
  如何实现技术的通用化?灵聚科技通过自身近5年的积累和思考,分析并实施了以下四点技术。
 
  第一就是技术本身能不能为用户创造价值,这个用户不单纯指最终用户,而是指方方面面的用户。
 
  就是标准化,关于技术本身能不能做出一些标准的接口,和服务的标准化。定制似乎成了现在商用机器人在落地的时候的必须,把定制的东西基于我们标准化的平台,通过提供工具变成工具化,然后让这种定制化变成了用户自主的行为,而不再是作为研发商来进行的行为。可视化就是让工具变得不但让懂代码的人用,连不懂代码的人也可以用。
 
  如何让大家都用得起来?像手机一样成为人人可以上手的应用?买智能手机不会给人附加一本很厚的说明书,上手就可以用,灵聚科技希望机器人也是开箱就用,而不是要读一个几百页的说明书。针对开发灵聚科技为客户提供了开发者平台,原代码和丰富的自定义能力,包括输出的Json也是可以自定义的,还有QA的自定义。因为整个客服机器人系统基于QA,QA本身的技术突破就能够在商用机器人领域解决很多问题。
 
  聚灵科技还提供销售渠道。对于一个产品的开发者而言,不需要考虑太多, NLP是怎么实现的,都不需要考虑,只需要考虑好不好用,能不能满足自己的需求,怎么利用已有的技术和丰富的想象力开发产品,把产品规划到极致。对于普通用户来说,就是通过终端服务平台提供可视化的工具,包括提供通过自然语言的方式来编程工具。
 
  用户的自我调校只会改他自己本身的设备,能够让他随心所欲的用起来,把机器人调校成他自己的玩具,调校成他自己的一个东西。通过QAW平台可以调整更加复杂的工作,从几岁到几十岁的人,包括专业水平人的都可以适用。
 
  对于行业开发者,灵聚科技提供核心技术和利益共享模式,比如客服机器人引擎。灵聚科技甚至给客服机器人系统公司提供引擎,概括来说如何让大家用起来,其实就是提供一个让用户觉得有价值的事情,然后让他能够轻松的用起来,达到自己的目的。尤其是在眼前技术并不成熟的时候,更加要在细节上做足功夫,这是张胜先生所提出的一个理念。现在灵聚的官网上可以下载到安卓APP的原代码,灵聚科技已经做好了对智能导航、智能计账包括提醒记事,对接引擎几十种场景的支持。如果有人要开发一个智能导航的场景,代码都已经写好了,而客服只需要写一个UI就可以出来了,这就是灵聚科技提供给客户的便捷,这个产品上市了之后终端用户依然可以随时用语音的方式来进行设备的调校,这些功能是已经内置好的。
 
  国内很多知名的公司陆陆续续已经使用或者正在对接灵聚的技术,灵聚科技也想通过这样的方式能够给大家提供更便捷的服务,让大家快速的接入灵聚的接口。灵聚科技的接口是按类来分的,几十种场景是一个接口,对应起来非常快,且接口还在不断标准化和统一化。
 
  通过这样一个已经逐渐完善的管理平台,还可以让机器人进行视频讲解,刻意自行定义到了时间轴讲什么词,机器人在讲话的时候,会自动由灵聚科技的人工大脑配动作,不需要设计者去设计动作,如果动作不满意还可以通过动作按钮来编辑该动作。
 
  再比如说讲PPT,每一页上传PPT文件之后选择哪一页是机器讲还是人自己讲,标题是什么,演讲内容是什么,都是可以进行编辑的。机器人在演讲过程中可以随时被打断,被打断之后人插完话可以让机器人继续演讲。
 
  张胜向大家介绍了聚灵科技新一代的客服机器人引擎。自然语言交互系统在早期被人叫做机器人问答系统,可见机器人就是一问一答的模式,聚灵科技现在在4个方面做了一些工作,最主要的基于Deep Learning的数据方面的最大问题就是不够精确,聚灵科技把两个结构放在一起,做了更加精准的拓展,新的技术拓展已经不可见,变得抽象化。,上下文不需要手动编辑,是系统自动支持的,这一点也很关键,有很多银行客服机器人系统在使用的时候上下文也是需要手动编入的。
 
  包括多轮交互,一个是半编辑模式,一个是全人工编辑的模式,这是不可能全自动的,还需要编辑。关于多行业通用灵聚科技花了很多精力来研究如何制作一个适用于各行业的客服机器人,如何实现机器人的标准化、可视化、工具化。聚灵科技将会提供用户上传WORD文件或者EXCEL文件让用户在这些文件当中学习新的知识,应用在对应的公司或者行业,完全没有人工是不可能的,现有的技术没有人工干预的学习是根本做不到的。
 
  聚灵科技的客服机器人引擎会通过开发平台为客户提供服务,也会为相关的客服提供引擎的支持。不同的产品输出的功能是不太一样的,灵聚智能所展现的能力跟微信各有不同,但共同的意愿是希望通过尽可能的给开发者提供最简单的使用和接入的方案,给用户提供最佳的局部体验来提升聚灵科技的产品最终被用户认可的认可度。
<

Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by