互联网至今发展了30年了,国家开展这项工作也有前30年后30年,前30年是解决温饱问题,做吃的、做汽车的,做房地产发财了。后30年这些方面我们有可能关注在旅游、养老、养生,还有子女教育问题。中间一块是机器人相关的。就是文化产业,包括首富为什么来PK,不是无缘无故的。
我认为,互联网企业比传统企业做服务机器人要更好。
第一是移动终端,尤其是手机。苹果手机他是把手机通信功能做了延伸,而且我们现在智能功能绝对不是腾讯,绝对是在媒体和社交。同样这个道理,将来机器人要做一些颠覆性的,一定会发掘一批新的应用来给我们老百姓使用。
从技术上来讲,云计算这个层面除了解决计算能力和资源,在解决容量方面也提供了非常好的手段。对于服务机器人来说,智能讲的比较多,市场是很大,仔细想一想每个家里用扫地机器人一年用几次,这不是必须要用的功能。如果是手机,你一天不用手机的话不舒服。是不是真正满足了老百姓的需求,这一点我们一定要做好发掘。
另一个层面,对于服务机器人来说,经常提到学习能力,智能加上内容怎么来交互?自然交互非常难,目前为止还没有一款机器人做到了自己交互,也许某些方面达到了,整体还不一定达到这个要求。
机器人是一个移动终端,把它作为一个工具来看,人是一个主体,机器人是一个载体。反正都要用到互联网这个东西,机器人作为中间载体,它会不会取代一些东西?包括线下的比如说快递小哥?还是无人驾驶汽车?这里面有很多文章可以做。
视觉这一块如何让机器人做相关智能?
第一、怎么来跟人进行交互,或者说你如何来识人?
第二、如何识别环境里面的物体。
第三、移动的时候,如何来识别场景。
先看看识别物体,在类脑壳方面我们在上海是排第一的。从人的视觉系统,从神经生物方面已经验证了,提到了两个,一个是腹部流,一个是背部流。从这两个东西受到了启发,如何来识别这个物体,这个物体在哪一个位置,这些方面可以来做一些工作。提出了一个网络模型,和现在非常热的生物学习不一样,是非常浅层的学习方法。
前几年我们做了一些工作,当时做了验证,其中一种验证是在复杂背景下,单个物体和多个物体如何来训练模型。训练完了以后来做测试。研究了这么多种思路,做了这么一款模型。
后面提到机器人必须来识别场景,除了传统的方式还有别的很多方法,我们这两年用深入和强化学习来做,实际应用还会用到非常传统的识别信息来做定位。也要考虑到人来识别这个场景的时候是如何识别的,绝对是做了一些标记和训练的。
如果说强化学习来识别这个场景,不用来构建地图,让机器人在这个场景里面做训练和学习,他是不是能够记得这个点?是可以的。
服务机器人今天上午专门也提到在工业领域里面,谷歌也在做一些抓起的动作,他训练的时候不是用传统的方法,这一块我们也在做,谷歌无非是提前把这个信息发出来的。
机器人到千家万户,他做精确的场景和整体不是一块,而是一些局部的信息。这种局部的信息如何来交叉做训练和学习?这里面是有一些方法可以做的,把场景的东西和整个肢体动作来做。美国人开始不跟我们玩了,我们中国人开始拿第一了,他们开始警惕了。从这个层面上来说,深入学习这个方法的确有可取的地方。这是基于视觉来识别人做了衰老检测,因为实际应用里面有。
基于语音,人的声音是很重要的一块,一块是语音合成,一块是语音识别,一块是语言理解。在后面那一块是我们学校非常擅长做的,是连续音和短时音,我们来做也非常成熟。后面就开始把DNA网络模型放进来了,先做中文语法,这里面包括分词,相关的语法分析也好,具体细节不提。
基于视觉和语音结合起来,提高他的识别率,和语音结合起来可以更好的解答出来,这方面我们做了更好的尝试。
对话管理是很重要的一块,比如说打车软件,这里面有相关细节应用了一些知识。
到第三代就开始到了2010年、上海世博会要做一个开幕机器人,开幕机器人主要功能是做一些迎宾,针对不同的客户如何来做迎宾工作。
还有卖给小孩子的产品,卖给小孩子的时候是不是要更好啊?比如说做小孩教育,哪个企业是引领呢?这个方面的内容怎么来切合老百姓的需求,我们也做了一些尝试,肯定有一些交叉领域。交叉领域里面所提到的一些功能可以到移动终端来做的话,可以培养老百姓的需求,这是我们这两年进行的尝试。
我们尝试的是医学,尤其是中医,比较经典的东西也可以结合起来,和中医结合是怎么考虑的?每个中医院里面都有这个东西,移动终端给整个生活造成影响,如果有这个增值服务的移动终端来提供服务,那是不是更好?在这一块把互联网和医疗结合起来,而且是有市场的。
如何和中医结合做的一些工作,来进行诊断的时候需要做量化的工作,西医比中医做的好,有CT、有磁共振和相关的预测,中医怎么来进行量化。比如说我们要进行舌诊的话,做的一些工作进行量化。提供出来的信息我们觉得是有疗效的。像慢性肾衰的患者,他体现出来的具有价值的特征到底在哪里?这个是在西医里面做的比较好的,怎么来验证他的症状,相关细节不展开了。
还有一块我们也觉得比较重要,这相当于标注了一个样本,面诊也好、舌诊也好,取得了这个样本医生已经做了标注,这个样本对我们来说非常重要,上海大学是国内做的最好的,北京那边做的好的有3万例标准好的样本,上海这边有5万例样本。
说在前面所作的自诊也好,或者是相关的健康管理,最终都是要给老百姓来做反馈的。反馈他的养生、起居情况,增值服务是在哪一块?这个产品可以得到盈利的点。
后面是整个实验室所做的工作。针对舌诊和面诊,有规则、有经验,他越大,计算机,或者人工智能他出现的准确率越高,经过了大量验证。通过深挖面诊里的具体传统方法,对这个特征进行提取。
医生来看的时候,他总是看你这个人有没有神、无神,也可以做一些量化。下面是舌诊,怎么样来进行量化,舌头可能有舌苔、舌纹,甚至有时还包括了齿印。
问诊我们也有讲究,也做了一些代表性的工作一类是镜子,智能镜。第二类是对讲机器人,这种人机交互手段比前面提到的移动终端要好,跟老百姓尤其是中老年人进行交互的时候会少费力一点。在产业界可以推动做一些相关的工作。