阿里巴巴、智源研究院、清华大学联合发布全新
在科技的巅峰之路上,阿里巴巴携手智源研究院以及清华大学再次展现了我国在认知智能领域的卓越成就。他们联合发布了面向认知的超大规模新型预训练模型——“文汇”。这个模型不仅提升了AI的理解能力,更实现了基于常识的AI创作,预示着AI技术在文本理解、视觉问答等领域即将迈入全新的时代。
与传统的AI训练方法不同,“文汇”预训练语言模型开启了一种全新的学习模式。不再依赖人工标注数据,而是让AI自动学习大量的语言文字和图像数据。在记忆和理解这些信息以及人类语言表述的规律后,再进一步深入学习专业领域知识。这使得AI不仅能够掌握常识,更能涉猎专业知识,从而更深入地模拟人类的思维。
“文汇”模型的发布在国内引起了巨大的震动。作为目前国内规模最大的预训练模型,其参数量级高达113亿。该模型的成功训练得益于阿里自研的统一多种并行策略的高性能分布式框架,通过模型并行、流水并行、数据并行训练的方式进行分布式训练。这一模型的成功训练,不仅突破了多模态理解与生成的技术难题,而且可以轻松理解文本图像信息,完成创造性任务。
例如,只需输入诗歌题目、朝代和作者,“文汇”便可以自动生成仿古诗词。这一功能展示了“文汇”在文学创作领域的强大能力,预示着AI在文化艺术领域也将有广泛的应用前景。
达摩院智能计算实验室的负责人周靖人表示,预训练语言模型是过去70多年来最具创新性的自然语言模型之一。他认为,“文汇”预训练模型的设计难度远高于传统模型,达摩院研究团队将持续攻克算法及系统工程难题,助力人工智能向认知智能的迈进。
阿里巴巴作为国内最早投入认知智能研究的科技公司之一,其科研实力不容小觑。迄今为止,阿里巴巴已有30多项研究成果被国际顶级会议收录,并荣获世界人工智能大会最高奖项SAIL奖以及与清华大学联合获得的国家科学技术进步奖二等奖。其旗下图框架Graph Learn已经面向全球开源,旨在减少模型的算力、存储资源消耗,缩短算法开发上线周期,为人工智能的发展贡献力量。
随着“文汇”预训练模型的发布,我们仿佛可以看到一个全新的科技纪元正在向我们走来。在这个纪元中,AI不再仅仅是感知智能,而是具备了初步的推理能力,能够更深入地理解人类思维。这无疑是我们迈向认知智能时代的一大步。