微软亚洲研究院谢幸:如何让机器拥有像人一样的思维?
探究机器能否深入人类心灵:微软研究院专家谢幸在“造就”平台分享智慧
在科技的浪潮中,我们不断追问:机器能否洞悉人类的性格与情感?微软亚洲研究院的资深研究员谢幸,日前受邀在剧院式演讲平台上发表了引人瞩目的主题演讲——《如何让机器拥有像人一样的思维》。我们有幸整理了他的演讲内容,并呈现给大家。
亲爱的听众们,我是谢幸,来自微软亚洲研究院。今天,我想与大家共同探讨一个颇具挑战性的议题:如何赋予机器人类的思维?
在谈论核心议题之前,我想分享一个我个人的小故事。最近,给我三岁的女儿买了一本绘本,“我能再造一个我吗?”她深深地被这本书吸引。故事讲述了一个孩子希望通过训练机器人来代替自己的生活,从而拥有更多自由。他面临的首要问题是如何使机器人变成他自己。为了实现这一点,他开始向机器人传达关于自己的各种信息,从基础的姓名、年龄到独特的性格特征,甚至是袜子经常破洞这样的小细节。
这个故事让我意识到,让机器人拥有像人类一样的思维,首先要理解人类自己。因为只有这样,我们才能告诉机器人如何最像我们自己。那么,如何实现这一目标呢?我将从以下几个方面与大家深入探讨:
一、人工智能与心理学的交融
二、人格的分类与推测
三、如何让机器像人一样思考
人工智能的先驱者之一,Herbert A. Simon,在计算机科学、心理学、经济学、社会学和认知科学等领域均有卓越的贡献。他曾荣获图灵奖、诺贝尔经济学奖、美国国家科学奖章以及美国心理学会的终身成就奖。另一位值得一提的人物是多伦多大学的Geoffrey E. Hinton教授,作为深度学习的积极推动者,他在计算科学和心理学领域均享有盛誉。
两年前,我们开始拜访知名心理学家和教授,致力于开展跨学科的合作交流。在这个过程中,我们探索的核心问题是:能否通过用户生成的大数据来解析人的性格?
虽然“人格”这个术语在日常生活中广泛使用,但为其精准定义却并非易事。即使在心理学界,对这个术语的定义也存在诸多争议。人格的概念最早可以追溯到古希腊医学家希波克拉底的体液说,他认为人体的体液分布决定了人的性格。尽管这一理论在现代医学中已经不再被认可,但希波克拉底关于人格分类的探讨仍为后来的心理学家提供了启发。
在与心理学家交流时,我们发现了一个有趣的事实:在现代心理学中,人格的定义与语言的使用息息相关。这引发了我们的思考,因为在计算机科学领域,我们对语言的研究被称为“自然语言理解”。其中有一个概念叫做“词汇学假说”,根据这个假说,我们不必通过观察和研究每个人来研究人格,而可以通过观察人类语言中相关的词汇来探究。例如,描述一个人时,我们可能会用一系列词汇来描述其特点,如“健谈”、“外向”、“冷静”等。心理学家决定整理这些描述性词汇,并建立分类体系。基于这一观察,人格理论的先驱奥尔波特和奥德伯特于1936年进行了艰难的词汇调查,他们从词典中发现了大约18000个与个人特质相关的单词,并进一步整理出四千多个描述性格的词汇。尽管这看似是一个庞大的数字,但在庞大的用户语言中仍显得复杂。如果要给这4000个描述维度分别打分,工作量将是巨大的。他们发现这些词汇之间存在相关性。如果能找到这些相关性,就可以将四千多个词进行分类。
近二十年来,人格研究者最为关注和支持的人格定义是五因素模型,也被称为“大五人格理论”。这一理论基于对用户语言的研究和对人格特征的深入理解,为我们提供了一个全新的视角来看待和理解人格。探索大五人格:从数据到行为测量的革新之旅
你是否曾想过,那五个概括人性的高度抽象词汇——外向性、尽责性、神经质、随和性以及开放性,背后隐藏着怎样的丰富内涵?每个词汇下,都涵盖了一系列细微的特质,如是否热心肠、是否经常参与活动等。有了这些词汇,你在描述朋友时,可以简洁明了地说:“他比较外向,但不太随和,可能较为情绪化。”这样的描述既简单又全面。但你知道吗?这些人格分类体系的形成,大多依赖于数据驱动的方式,与计算机科学紧密相连。那么,我们能否自动计算用户的大五人格呢?答案是肯定的。
在传统的人格测量中,心理学家多采用访谈和调查问卷的形式。这种方法虽然经典,但耗时耗力,且规模有限,无法实现大规模用户的测量。传统的心理问卷调查往往包含上百道题目,但真正认真填写的用户却不多。很多人可能会随意选择中间分数,这样的结果并无太大意义。对于某些模糊的问题,如“自己是否内向?”很多人可能无法给出明确的答案。心理学中的行为测量提供了一种新的思路。通过观察个体的行为来评估其人格,基于人格理论中人类行为的一致性原理。每个人的行为差异与其人格息息相关,因此通过观察个体行为来预测人格成为可能。但在计算机技术广泛应用之前,由于缺乏足够丰富的用户行为数据,这种方法并未被广泛采用。
随着互联网的普及、智能手机的广泛使用以及各种传感设备的进步,用户的行为数据开始被大量收集。再加上人工智能在建模用户方面的不断进步,行为测量法在计算机和心理学的交叉领域得到了快速发展。我们的研究工作在此基础上更进一步,提出了“人格推测模型”。该模型利用社交媒体上的异构数据(如头像照片、发表的文字、表情符的使用以及社交关系等)来预测大五人格。例如,通过分析图片语义,我们可以将其分为不同的类别,如卡通、自拍、合影、动植物等。在这个过程中,我们依然需要与心理学家合作。通过收集少量用户的调查问卷结果作为标注数据,我们将用户的行为特点和人格特征进行映射和联系,然后输入模型中训练。
为了让大家更好地理解,我们找了一批志愿者进行实证研究。这些志愿者提供了自己的数据并完成了问卷调查。这样我们既有用户的行为数据,也有人格调查数据。在训练完模型后,对于新用户,无需再进行问卷调查,模型便可以自动计算其人格。听起来很抽象吗?其实非常具体。例如,我们可以分析用户发表的文字与其性格之间的关系。大五人格的每一个维度都可以与用户的文字进行关联。一个经常在社交媒体上分享青春和自我经历的人可能比较外向;而经常发表关于失败和困境的内容的人可能在外向性上得分较低。还有一些用户经常分享关于时代、社会、成功的正面词汇,他们的尽责性可能较高;而有些人经常提及随性、可爱等词汇的尽责性则相对较低。这里的尽责性高低并非褒贬之分,而是反映了人们在追求过程中的不同侧重点。
借助人工智能和大数据技术,我们现在已经可以更加深入地探索和理解人类的内心世界了。我们通过对大五人格与用户头像进行深度研究,利用皮尔逊系数揭示了个体人格与头像之间的关联性。研究结果显示,外向性得分高的用户偏好使用充满笑脸的头像,而内向的用户则倾向于选择遮掩表情或侧脸的头像。开放性得分的用户喜欢用与朋友共度的瞬间作为头像,而得分较低的用户则更偏向于选择个人自拍照。基于这些观察,我们仅通过头像分析,就能使个体性格预测的准确性提升至0.6。为了进一步提升预测准确率,我们不仅针对每个维度设计了精准的特征提取策略,还运用了集成学习技术,将不同维度的行为数据有效融合,使大五人格的预测准确率超过0.75。
在深入解析用户行为模式后,我们开始探索如何利用这些知识使机器人具备像人一样复杂的思维。微软提出的“对话即平台”理念预示了未来人机界面将全面转向对话界面。类似《黑镜》中通过社交媒体和在线聊天数据合成虚拟人的科幻场景,实际上已离我们不远了。现实中,已有创业者利用亲友的短信数据训练出能模仿其性格的聊天机器人。
尽管技术飞速发展,现今最顶尖的聊天机器人仍无法展现出稳定的人格和情感。要让机器人的语言和行为更具个性,需要深入研究并获取更多用户语言数据。如同新闻报道所述,只要拥有足够的数据,我们就有可能塑造出与特定个体性格相符的聊天机器人。从儿童、学生到诗人的数据,都能为机器人提供独特的“人格特征”。设想一下,若我们集合所有现代诗人的智慧,是否也能训练出一个出口成诗的机器人?尽管目前这已不是天方夜谭,但要达到这一境界仍面临诸多挑战。尤其是如何让机器人拥有更真实的人类性格与情感,这需要与心理学家深入合作。
值得注意的是,最初的聊天机器人Eliza就已扮演了心理咨询师的角色。五十多年前,MIT的研究员Joseph开发出了一款名为Eliza的程序。该程序在对话中引入了心理学家罗杰斯的个人中心疗法,并更侧重于对话态度,比如尊重与同理心。在对话过程中,Eliza并不主动产生新内容,而是通过引导用户倾诉来实现交流。看似简单的Eliza项目却取得了出人意料的成功,令当时的用户和开发者Joseph都感到震惊。
Joseph为该项目取名为ELIZA,灵感来源于戏剧《卖花女》。剧中的Eliza处于社会底层,通过模仿上层社会的语言,试图伪装成上层人士。在Joseph的设想中,他希望机器也能像人一样伪装,并成功引领了一种难以被察觉的“ELIZA效应”。这种效应导致人们高估了机器人的能力,比如AlphaGo的出现让人们觉得电脑已经具备了围棋的智慧。但实际上,背后都是人类智慧的结晶。
受到Eliza项目的启发,微软亚洲研究院启动了DiPsy项目。该项目旨在让机器人能够通过聊天帮助人们克服心理问题。在这个过程中,我们借鉴了心理咨询中的认知行为疗法和正念疗法,引导对话自然有效地进行。DiPsy能够研究用户的心理过程,根据数据诊断心理特质和精神障碍。我们还尝试使用认知行为疗法(CBT)或早期干预,改变用户的思维和行为方式,以缓解和管理心理问题。
未来,我们期望这个项目能解决实际的社会问题,比如农村留守儿童的心理疏导。微软全球执行副总裁沈向洋提出了他想解决三个与人脑相关的疾病:儿童自闭症、中年忧郁症和老年痴呆症。我们希望技术能帮助他实现这一目标。这些研究项目仍处于起步阶段,我们期待最终能让机器拥有像人一样思考的能力,并在人们需要时提供陪伴和帮助。当你孤独时,至少有一个AI与你同在。