关于围棋人类3000年来犯了一个错
当“人机大战”的硝烟再次燃起,世界瞩目的焦点聚集于一场围棋巅峰对决。人类代表,世界围棋冠军柯洁,将迎战人工智能界的巨星——AlphaGo(阿尔法狗)。柯洁以坚定的信念和决心宣称:“我将以必胜的心态和坚决的信念迎战阿尔法狗,我一定要击败它!”
AlphaGo之父杰米斯·哈萨比斯却以另一种视角看待这场较量。他并非为了胜利而创造阿尔法狗,而是为了探索人工智能的无限潜力。他近期在母校英国剑桥大学的演讲中,阐述了其关于人工智能与阿尔法狗的多维度思考。哈萨比斯不仅是DeepMind的创始人,更是一位在人工智能领域具有深远影响的先驱者。
哈萨比斯的演讲充满了对人工智能未来的无限憧憬和探索的热情。他透露了AlphaGo背后的技术秘密,以及其与人类棋手之间的较量背后的科学原理。提及去年韩国棋手李世石输给阿尔法狗的原因时,他强调了人工智能在揭示围棋真理方面的独特能力,指出人类几千年来的研究,在人工智能面前仿佛只揭开了冰山一角。
关于即将与柯洁的对决,哈萨比斯表示:“柯洁在网上与阿尔法狗的对决后,深刻理解到人工智能在围棋领域的独特洞察力和能力。这并不是说人类的研究无用,而是我们尚未揭开围棋的真面目。”他的言辞中流露出对人工智能与人类共同进步的期待。
在演讲中,哈萨比斯详细阐述了人工智能的定义、发展历程以及未来的发展方向。他强调了通用学习系统的重要性,并指出DeepMind正在努力研发世界上第一台通用学习机。他提到的人脑与机器之间的类比,为我们揭示了未来人工智能可能的发展方向。
提及历史上著名的IBM与国际象棋冠军加里·卡斯帕罗夫的对决时,哈萨比斯强调了编程者的智慧与努力,是他们将人类的智慧转化为机器的语言和规则。但他也指出了当前技术的局限性,强调了真正的通用人工智能需要具备普适性和学习性。
想象一下我们的AI系统,这个主体需要理解自己所处的环境,并努力识别其目标。这个环境可能是实体的,例如机器人或虚拟世界,如游戏。主体通过与环境的互动来了解它:通过观察,先是通过视觉,也可能通过听觉、触觉等多感官。
在此基础上,主体要做的第二个任务更为复杂:建模并找出最佳行动方案。这涉及到预测、想象和假设检验。主体不断地在真实环境中行动,每当关键时刻到来,系统就会输出目前为止找到的最佳策略。这些策略可能会改变环境,进一步驱动观察结果,并反馈给主体。
这就是增强学习的核心原则。虽然示意图简单,但背后是复杂的算法和原理。如果我们能解决大部分问题,那么搭建出普遍适用的人工智能就有希望。从数学角度看,我的合作伙伴——一位博士,创建了一个名为“AI-XI”的系统,证明了在无限的计算机硬件和时间支持下,增强学习所需的信息是可以获取的。从生物学的角度,人类的大脑是受多巴胺驱动的,而多巴胺正是执行增强学习行为的关键。无论从数学还是生物学角度,增强学习都是解决人工智能问题的重要工具。
接下来,让我们深入探讨围棋——人工智能面临的一大挑战。围棋是一款古老而迷人的游戏,使用方形格状棋盘和黑白两色棋子进行对弈。尽管规则简单——棋盘上有纵横各十九条直线,分出三百六十一个交叉点,双方交替下棋,围地多者获胜——但其复杂性令人难以想象。
想象一下去年诞生的阿尔法狗技术。围棋的魅力在于其深度和广度:虽然规则简单明了,但棋局的复杂性却远超象棋等游戏。围棋没有固定的目标或明确的胜利条件,更多的是依靠直觉和策略。决定游戏的胜负往往取决于细微的差别和瞬息万变的局势。这也是为什么围棋被视为一项优雅的技艺:它不仅是一种策略游戏,更是一种艺术和智慧的体现。
围棋的复杂性给人工智能带来了极大的挑战。搜索空间极其庞大:每一个棋子都有数百个可能的位置选择。评价胜负变得异常困难:不同于象棋等游戏可以直接数棋子数量来评判胜负,围棋的局势瞬息万变,一个小棋子的位置都可能影响整个局势。“评价函数”——用来判断局势优劣的关键工具——在围棋中变得尤为重要且难以设计。因为每一个小变化都可能对整体格局产生重大影响。所以每一个棋子都有其至关重要的作用。这是围棋最困难的部分之一:与其他游戏不同围棋是一个建设性的过程开始时棋盘是空的然后逐渐填满棋子和局势都直接影响着游戏的发展让人惊叹不已令人叹为观止正是这些特点使得围棋成为人工智能领域的难题许多人工智能在围棋面前望而却步甚至著名的IBM人工智能深蓝在面临围棋挑战时也显得捉襟见肘那么我们能创造出一种算法来挑战世界围棋冠军吗?这无疑是人工智能领域面临的一大挑战我们面临两大挑战搜索空间庞大分支因数过高分支因数是指每一步决策可能产生的分支数量在围棋中每一步都有大量的选择分支因数远超象棋其次没有合适的评价函数来准确判断胜负在象棋中可以通过数棋子多少等简单的评价函数来判定胜负但围棋不同没有一种普遍适用的评价函数每个小棋子甚至每一小步都可能改变整个局面因此每个决策都至关重要因此我们必须找到一种全新的方法来解决这个问题才能真正实现人工智能在围棋领域的突破总的来说增强学习是一种有效的解决人工智能问题的工具尤其在解决像围棋这样的复杂问题上更是具有巨大的潜力通过不断地探索和研究我们将不断取得新的突破将人工智能推向新的高度为我们开启更加智能的未来提供强大的技术支持这正是我们所追求的也是我们正在努力实现的目标希望您能继续关注这一领域的发展期待我们一起见证人工智能未来的辉煌成就。在棋局中评估当前形势,象棋只需关注当前棋盘,而围棋则需预测未来局势以做出判断。围棋的复杂性远超象棋。尽管有人尝试将DeepBlue的技术应用于围棋,但结果并不理想,甚至无法战胜专业围棋手。
那么,人类是如何解决这一难题的呢?答案是依靠直觉。围棋从一开始就是直觉的游戏,而非纯粹的计算。象棋选手可以解释每一步的动机和目的,但在围棋中,即使是世界级的大师也很难解释每一步的决策原因,而是依靠直觉做出判断。
为了模仿人类的这种直觉行为,我们采用了人工神经网络算法,并通过加强学习的方式进行改进。我们训练了两个神经网络:决策网络和数值网络。决策网络通过模拟人类围棋行为来预测下一步的决策,而数值网络则用于评估赢的概率。这两个网络结合,通过蒙特卡洛算法预估当前形势。
当我们首次将阿尔法狗与欧洲围棋冠军对抗并获胜时,我们实现了首次突破。此后,我们在韩国设立了奖金,并邀请围棋界的传奇人物李世石进行了一场备受瞩目的比赛。阿尔法狗在这场比赛中以创新的玩法和强大的创新能力赢得了比赛,震惊了围棋专家和人工智能领域的专家。
其中,比赛的关键在于阿尔法狗在棋局中的一步创新。在第37步,阿尔法狗选择了一个看似非传统的落子位置,进军棋局的中部区域。这一决策震惊了观众和专家,因为它挑战了围棋传统智慧中关于棋盘分界线的看法。几千年来,人们认为在第三根线和第四根线上落子的重要性相同,但阿尔法狗的这一步似乎暗示着中部区域的重要性被低估了。
阿尔法狗的胜利并非仅仅基于模仿,而是在于其强大的创新能力。围棋是一种艺术,人类的情绪会产生无数想法,但并非所有想法都是好的。而阿尔法狗则是客观的,其目标就是赢得游戏。阿尔法狗的绝招在于其客观性和强大的创新能力结合,使其能够在围棋这一复杂且富有挑战性的游戏中取得胜利。在当前棋局中,左下角两个用三角标记的棋子似乎陷入了困境。仅仅15步后,这两个棋子的力量扩散至棋局中心,蔓延至棋盘右侧,使得第37步成为关键性的一步。这一步,阿尔法狗展现出了非凡的创新性。尽管我作为一个业余棋手,对这一步的理解有限,但世界级专家MichaelRedmond对此有着深刻的见解。
Michael是一位9段高手,他的评价是:“这一步非常令人震惊,初看像是错误的决定。”在实际的模拟中,Michael其实一开始将棋子放在了另一个位置,并没有预见到阿尔法狗会走出这样一步。在这场比赛中,阿尔法狗展现了许多此类创新。特别要感谢李世石先生,在我们前三局胜利后,他选择了退出。
在2016年3月,阿尔法狗挑战世界围棋冠军李世石,最终以4:1的总分战胜了人类。那三场比赛异常激烈,尤其是第一局。我们需要不断训练我们的算法,在此之前,阿尔法狗已经战胜了欧洲冠军,但这场比赛让我们明白了世界冠军与欧洲冠军之间的巨大差距。在比赛过程中,我们并不知道算法中有多少是过度拟合的,因此第一局对我们而言非常紧张。如果赢了第一局,我们就能证明我们的加权系统是正确的。
李世石在第四局时回归,也许压力得到了缓解。他做出了一步极具创新性的举动,被许多中国专家视为“黄金之举”。这一步迷惑了阿尔法狗,使其决策树发生了错误的估计。通过这个例子,我们可以看到围棋中蕴含了多么深刻的哲理。顶级专家们穷其一生,寻找这样的黄金举措。在这一步中,阿尔法狗意识到这是一个非常不寻常的举措,尽管他估计李世石获胜的可能性只有0.007%,但他仍然需要在两分钟内重新搜索决策计算。
谈到第四局的78步创新之举,我想提及直觉和创新。直觉是一种含蓄的表达方式,基于人类的经验和本能思维,不需要精确计算。在围棋中,我们为系统输入棋子的位置来评估其重要性,阿尔法狗正是在模拟这种直觉行为。而创新则是在已有知识和经验的基础上,产生新的、原创的观点。阿尔法狗显然展示了这两种能力。
至于神秘棋手Master是否是阿尔法狗的问题,我们今天的主题是“超越人类认知的极限”。我们一直在不断完善和改进阿尔法狗。虽然我们已经是世界冠军,但我们始终认为阿尔法狗还有改进的空间。我们希望通过研究和李世石的比赛,填充知识的空白;建立新的分支系统来困惑主系统;优化系统的行为,缩短训练时间等。我们还希望通过对比人类和阿尔法狗的决策,寻找新的知识。从本质上说,我们希望系统更加专业化。在与世界顶级专家的对决中,我们使用了假名Master并取得了连胜。顶级专家们对阿尔法狗的创新能力感到震惊,认为其在围棋领域开创了新的境界。
在比赛中,阿尔法狗展现出自我创新的能力。例如在某些情况下,它会落在棋盘上的第二根线内,这是一个新的、有效的位置。柯洁作为中国和世界的围棋冠军对此表示赞同人工智能和人类联合将开启新纪元以揭示围棋的真谛的观点异曲同工我们在比赛中看到科学的真理逐渐显现。神秘棋手Master在腾讯围棋对弈平台于2017年1月3日击败了围棋界的明星柯洁,引起全网热议。这位被称为Master的棋手,其实是AlphaGo的升级版,以其卓越的实力,执白中盘战胜了柯洁。
围棋的历史上,这样的划时代事件已经发生过两次。第一次是在1600年左右的日本,那时的围棋高手吴清源提出全新理论,将围棋带入一个新的境界。而如今,人工智能带来的变革被誉为围棋界的第三次重大进步。
为何人工智能在围棋领域的表现强于象棋呢?当我们观察国际象棋冠军芒努斯·卡尔森时,我们会发现他和之前的冠军并无太大差异,都极为优秀和聪明。当人工智能出现时,他们的表现却无法与之匹敌。我认为,这是因为国际象棋更注重战术,而阿尔法狗更注重战略。顶级国际象棋程序不会犯技术性错误,但人类难以避免。国际象棋拥有庞大的数据库和算法,在某种程度上已经接近极致。而围棋中的阿尔法狗却在不断创造新的想法和策略,这些新想法甚至能让顶级棋手在比赛中取得意想不到的胜利。正如欧洲围棋冠军樊麾所说,机器人的创新下法打破了人类的思维局限。
阿尔法狗的出现并不仅仅是为了赢取比赛,它更是围棋专家探索未知世界的工具。我们发明阿尔法狗是为了测试人工智能算法的有效性,并最终将其应用到真实世界中,为社会服务。在这个信息爆炸、系统复杂的时代,我们需要找到各种问题的规律和结构。人工智能可能是解决这些问题的关键。我们必须确保人工智能在人类的道德基准范围内被开发和利用。技术本身是中性的,但使用它的目的和范围决定了其功能和性质。
我的理想是让人工智能科学家或人工智能助理成为现实,通过这一技术真正加速技术的更新和进步。我们期待人工智能与人类的结合能创造出更多不可思议的奇迹,释放人类的真正潜力和天性。
人工智能培训
- 真正能和人交流的机器人什么时候实现
- 国产机器人成功完成首例远程冠脉介入手术
- 人工智能与第四次工业革命
- 未来30年的AI和物联网
- 新三板创新层公司东方水利新增专利授权:“一
- 发展人工智能是让人和机器更好地合作
- 新春贺喜! 经开区持续推进工业互联网平台建设
- 以工业机器人为桥 传统企业如何趟过智造这条河
- 山立滤芯SAGL-1HH SAGL-2HH
- 2015国际智能星创师大赛火热报名中!
- 未来机器人会咋看人类?递归神经网络之父-像蚂
- 成都新川人工智能创新中心二期主体结构封顶
- 斯坦德机器人完成数亿元人民币C轮融资,小米产
- 到2020年,智能手机将拥有十项AI功能,有些可能
- 寻找AI机器人的增长“跳板”:老龄化为支点的产
- 力升高科耐高温消防机器人参加某支队性能测试