打碎人工智能的黑匣子 科学家解析深度学习神经网络
Jason Yosinski坐在美国加州旧金山的玻璃办公室里,沉浸在人工智能的海洋中。身为优步公司的研究科学家,他正在对笔记本电脑上运行的人工智能进行一场细致的“脑外科手术”。
在众多改变人类现代生活的AI中,优步的无人驾驶汽车只是冰山一角。Yosinski手中的程序是一个深度神经网络,其架构仿佛大脑的镜像,充满神秘和深邃。正如人脑一样,这个程序的内部运作难以从外部洞察,如同一座黑箱。
这个特殊的AI能够通过无数标注图像进行训练,从而识别斑马线、消防车、安全带等物体。那么,它能否识别出Yosinski和摄像头前的记者呢?Yosinski放大了AI的独立计算节点(神经元),以观察其响应的源头。
两个幽灵般的白色椭圆状物体在屏幕上浮动。这些神经元似乎已经学会了如何探测人脸的轮廓。Yosinski解释:“它们会对你我的面部作出反应,无论大小、颜色,无论人脸的何种变化。”
这种网络并未经过人脸识别的专门训练。在训练图像中,人类并未被特别标注,但网络依然学会了识别人脸,可能是通过识别与人脸相关的物体,如领带、牛仔帽等间接信息。这个网络的复杂性超越了人类的理解,我们无法洞悉其做出决策的完整过程。
Yosinski的探索虽然为我们揭示了部分神秘面纱,但整体情况依然迷雾重重。他坦言:“我们拥有令人惊叹的模型,但实际上并不理解它们,这种情况随着年份的推移似乎在逐渐恶化。”
深度学习正在不断渗透到各个学科领域,它们能够预测合成有机分子的最佳方式,能够探测与自闭症相关的基因,甚至改变科学的进展方式。AI的无所不能给理论科学家带来了一个难题:这些模型为何能如此强大?
为了解答这个难题,学界和业界的新一代研究者正在不懈努力。他们开发出了各种工具来探究AI的内部运作,包括无需深入了解即可探测AI的工具、能与神经网络相媲美的更具透明度的替代算法,以及使用更多深度学习来窥探黑匣子的方法。这些努力汇集成了一门新的学科,Yosinski称之为“人工智能神经科学”。
例如,Marco Ribeiro,这位华盛顿大学的毕业生,在西雅图试图使用一种名为“反事实探针”的神经科学工具来打开黑匣子。他的想法是通过巧妙改变AI的输入,来查看哪些变化以及如何影响输出。
谷歌计算机学家Mukund Sundararajan也开发了一种新的探查方法,无需对网络进行数千次测试,就能有效地理解网络的重要决策过程。他的团队不是随机改变输入,而是引入一个空白的引文或者一个纯黑的图像等作为起点,然后逐步推向测试的实例。通过在网络中运行每一步并观察其确定的跳跃,他们能够通过轨迹推断出对预测至关重要的特征。
尽管有了这些进步,更深层次的未解问题依然存在。这一问题不仅来自科学界。欧盟的一项指令要求那些对公众有持续影响的算法公司必须解释其模型的内在机制。美国国防高级研究计划署也投入巨额资金试图解释用于无人机和情报挖掘作业的深度学习。谷歌机器学习研究者Maya Gupta表示,打开黑匣子的驱动力同样来自硅谷内部。
神经网络尽管如今比过去复杂得多,但其本质依然不变。在网络的另一端,是数以百万计的数据(如狗的照片)。这些数据被输入到拥有十几个或更多层的网络中,其中的神经连接会响应数据中的特征。每一层都会使内容更加抽象,最后一层则做出最终判断,比如从一张狗的图片中辨别出犬种。虽然系统初始可能笨拙,但随着与标记数据的反复对比和调整,它逐渐变得精准和可靠。经过深度学习和人工智能专家的研究和改进,神秘的黑匣子逐渐被揭开面纱。一种新方法使得神经网络的工作机制更加直观和可解释,如同微软的雷德蒙德研究院计算机科学家Rich Caruana所说,通过现代技术和大胆的尝试,我们能够让神经网络真正地活跃起来。网络内部的复杂性也让其变得如同黑匣子一般难以捉摸。对此,研究者们正在寻找不同的策略来处理这一问题。
Gupta博士的策略是绕开黑匣子的问题。她启动了一项名为GlassBox的项目,致力于将可预测性纳入神经网络的设计中。她的目标是将工程化的神经网络转化为可解释的形式,利用单调性关系作为指导原则。通过将这种单调性关系嵌入到被称为插值查询表的数据库中,她成功地添加了一个可预测性的层级计算知识,从而使得神经网络更加可控。
有时候我们无法回避黑匣子的存在。理论研究者开始探索深度学习的第三条道路——他们主张解释深度学习的方法可以是更深度的学习,而不是避开神经网络或试图完全理解它。对此,一些研究者正在尝试打开黑匣子,让神经网络的工作机制更加透明。
以Mark Riedl为例,他和他的团队使用上世纪80年代的电子游戏测试AI的决策过程。他们通过让人们实时发声描述策略,训练神经网络对语言进行转译,从而生成一个能够表达的综合性AI。这种“合理化”的方法有助于用户理解家庭机器人、自动驾驶汽车等机器的工作原理。虽然这种方法带来了一些新的理解,但同时也引发了关于错误理解和信任丧失的担忧。
与此Yosinski也采取了另一种策略来揭示神经网络的工作原理。他使用生成对抗网络(GAN)来识别网络中的问题并为任意图像编写描述。这个网络可以绑定到任何解决图像问题的网络上,从而揭示出网络的内部机制。尽管这只是一个开始,但GAN的应用前景广阔,仍有大量的空白领域等待填补和完善。尽管神经网络仍有许多未知领域需要探索和理解,但研究者们正在采取各种策略和方法来揭开它的神秘面纱,使其更加透明和可预测。随着技术的不断进步和研究的深入,我们有理由相信未来神经网络的工作机制将更加清晰明了。
机器人培训
- 打碎人工智能的黑匣子 科学家解析深度学习神经
- 傅盛:三大产业优势加速中国服务机器人出海
- 2018年第十届国际物联网博览会夏季展在深举办
- 详解 - 业内首个AIoT操作系统旷视「河图」
- 韩国周系列活动今夏重磅来袭
- 人脸识别技术的滥用现象分析现状与未来趋势预
- 推进车联网工业互联网及人工智能先导区建设
- 江苏省印发装备行业稳增长工作措施 涉及精密仪
- 用户需求洞察智能清洁机器人的前景与发展趋势
- 人工智能如何助力疫情防控
- 扫地机器人新品展望:头部企业发布新品,行业
- 英国皇家工程院院士杨广中:医疗机器人转化问
- 期待具备人性化的机器人,打开更多酒店服务新
- 扫地机器人“大变身”,“拓品”争霸谁将能胜
- 智能机器人与人类共处的未来挑战与新思考2025
- 埃夫特董事长许礼进谈“科技创新与高质量发展