吕建成 人工智能大模型时代的机遇与理论挑战
在不久前举办的2022昇腾AI开发者创享日·成都站上,四川大学计算机学院的院长吕建成就人工智能大模型时代的机遇与挑战进行了深入的探讨和精彩的演讲。随着人工智能技术的不断进步,它正在推动一场新的科技革命和产业变革。吕建成从深度神经网络的发展、大模型的发展与应用以及大模型的机遇与挑战三个方面进行了详细的解读。
深度神经网络的发展
吕建成强调,深度神经网络是人工智能的核心技术之一。从人工智能的诞生到现今,神经网络始终伴随着这一领域的发展,经历了两次繁荣与低谷。目前,网络学习和特征提取的相关研究已经趋于成熟,而网络规模的选择和硬件实现以及基础理论的研究仍是研究的重点。一方面,网络规模越来越大;另一方面,也有研究致力于网络的轻量化,以便更好地部署在终端设备上。
大模型发展与应用
谈及大模型的发展与应用时,吕建成提到,从2012年到2018年,神经网络的模型规模逐渐增大,处理数据的能力也越来越强。大模型的发展有三个重要驱动力:处理大数据的需要、应用的需要以及算力的快速发展。随着全球数据产生量的快速增长,需要更强的人工智能技术来处理这些数据。模型参数量越大,模型在应用中表现出的精度和能力也越高。算力的快速发展为大模型提供了强大的支持。
在大模型的发展过程中,有几个重要的工作值得一提:预训练微调思想的提出、“预训练+微调”成为大规模训练数据的主要方法以及语言大模型的问世等。大模型的成功离不开大规模数据、可大规模扩展的算法与大规模算力这三大基础设施。高质量的数据、复杂的数据收集流程以及先进的算法都是决定大模型性能的重要因素。目前,“大模型”已在实际经济生活得到应用,并有面向行业大模型发展的趋势。华为昇腾构建的大模型产业生态就是一个很好的例子。他们的大模型被应用于纺织生产的声音质检等领域帮助开发者探索大模型的应用落地。随着科技的发展和应用的需要将会有更多的领域出现类似的创新实践和应用案例。这也是大模型的未来机遇之一同时也是人工智能未来的发展方向之一。人工智能将在未来的科技和经济领域发挥更大的作用并推动社会的进步和发展。这也是吕建成对未来人工智能发展的期待和展望。随着人工智能技术的不断进步和发展我们期待更多的创新和突破带来更多的惊喜和机遇。对于大模型的未来挑战我们需要保持对新技术的研究和探索以便更好地应对和解决这些问题和挑战从而更好地发挥人工智能的价值和作用为社会的发展做出贡献。同时我们也期待更多的开发者和研究者加入到人工智能的研究和应用中来共同推动人工智能的发展和创新实践为人类带来更多的便利和进步!关于大模型的多个核心疑问,吕建成给出了深入解读。他提出了几个引人深思的问题:我们当前的大模型是否过于拟合,是否具有足够的鲁棒性,是否真的掌握了真正的知识?它们能否完全替代知识图谱呢?而大模型的规模真的是越大越好吗?究竟要发展多大才能满足未来的需求?我们能否承受得起越来越庞大的模型所带来的负担呢?
针对这些问题,吕建成指出了当前大模型的不足之处。现有的大模型经常局限于特定领域,无法像人脑那样拥有广泛连接和灵活的思维模式。而且,这些大规模模型的全网络运行方式导致了极高的能耗。但近期,研究人员已经开始探索新的构建大模型的方法。
基于对人脑的深入研究,他们提出了一种类脑超大规模系统。这个系统借鉴了人脑的层级网络结构,构建了一种多层级的网络结构模型。在这个模型中,不同的脑区相互协作、相互促进,这种设计理念也应用于构建类脑功能区。吕建成以视觉功能为例详细阐述了这一构建过程。视觉功能在脑中被划分为33个脑区,这些脑区可以进一步分为动作、颜色、形状和其他四个二级功能区域。同样地,对应的视觉类脑功能区也设计了四个子功能区。
那么,构建好的类脑功能区如何协同工作呢?在特定的任务场景下,它们会根据脑功能的相关脑区协作关系来协同工作。目前,此平台已经能够在单模态和两个模态的任务上灵活构建网络通路,实现各种目标要求。基于这一平台,已经开发了一些实际应用,如核工业缺陷检测、反应堆运维监测等。
吕建成总结道,人工智能已经步入大模型时代,这是一个充满机遇和挑战的时代。我们必须寻求新的思路来指导大模型的构建和发展。我坚信,随着科技的不断进步和创新思维的激发,我们一定能找到新的方向和方法来推动大模型的进步和应用落地。