国际AI测试项目现中国黑马，“稀疏化计算”如何打破算力瓶颈？

生活知识 2025-01-06 17:36www.robotxin.com生活百科

全球AI基准评测MLPerf近期公布了最新结果，国产新星崭露头角。在备受瞩目的MLPerf Inference v2.1榜单中，众多行业巨头展开激烈竞争。在这场顶尖对决中，墨芯人工智能的S30计算卡以其卓越性能脱颖而出。

在开放任务（Open division）测试环境下，墨芯S30计算卡表现出惊人的实力。它以95784 FPS的单卡算力，成功夺得Resnet-50模型算力全球桂冠。更令人惊叹的是，当面对BERT-Large高精度自然语言处理模型时，墨芯S30的计算能力达到了3837SPS，是英伟达A100的两倍，仅次于英伟达H100，展现了其在自然语言处理领域的出色表现。

墨芯人工智能的创始人王维在接受界面新闻等媒体采访时，对这个成绩赞不绝口。“这个成绩的亮点在于它验证了我们技术路线的正确性，并引起了行业内外的高度关注。这一成就不仅是对我们团队努力的肯定，也为国产AI技术的发展注入了新的活力。”王维表示。

此次MLPerf的评测结果，无疑为墨芯人工智能的发展注入了强大的动力。作为国产黑马的墨芯，其技术实力和创新能力得到了充分的展示，未来值得期待。墨芯人工智能（Moffett AI）——自2018年诞生于深圳，以云端和终端AI芯片加速方案的研发为核心。创始团队背景强大，来自赫赫有名的卡内基梅隆大学。墨芯的发展历程中，获得了众多知名投资机构的青睐。从天使轮到A轮，凯旋创投、创享基金、云天使基金、浪潮云海基金等纷纷为其注入资金。将门创投、真格基金、基石资本以及深圳的天使母基金等也参与了其Pre-A轮和A轮的投资。

在最近的测试中，墨芯的“稀疏化计算”技术大放异彩，成为MLPerf测试中的突破点。这种技术深受启发于人脑模型压缩方式，能够有效地加速AI计算。所谓的“稀疏化计算”，不仅代表着技术的先进性，更是未来AI发展的一种趋势和方向。墨芯以此技术为核心，展现出强大的研发实力和创新能力，为AI领域注入了新的活力。墨芯团队独创了一种新型稀疏化技术，通过精准抽离部分模型参数，让深度学习计算如同拆卸又重建的积木游戏。在保证AI模型稳固、不会“坍塌”的显著减少了矩阵运算所需的计算量。这一技术的核心优势在于大大缩短了获得准确结果的时间，提高了计算效率。压缩稀疏矩阵不仅能降低内存和带宽的占用，还广泛应用于所有类型的AI加速计算模型，包括当下火热的“大模型”。

墨芯首创的双稀疏算法展现了卓越的技术实力，目前已拥有超过30项全球专利。其首款Antoum处理器芯片已经成功出货，实现了最高达32倍的稀疏率。在全球范围内，墨芯的这种技术路线堪称独树一帜，鲜有类似者。

尽管学界对稀疏化计算早有探索，但此前的研究和实践面临诸多挑战。过去，尽管研究人员尝试抽出神经网络中高达95%的参数权重，但模型精简所需的时间往往超过节省的时间，且模型的精度损失难以弥补。一种模型的精简方法往往不适用于其他模型，这一现状使得稀疏化技术在应用上受到限制。墨芯团队通过持续的技术积累和深入研究，成功打破了这一僵局。尽管在当前的AI计算领域中，稠密数学计算仍然占据主导地位，但随着AI模型的日益通用化和规模的不断膨胀，内部模型稀疏化所带来的加速效应正逐渐受到重视。这一技术的崛起，无疑将在AI计算层面产生重大影响。以英伟达为例，其在Ampere架构A100 GPU中引入了稀疏性支持，通过训练神经网络，成功减少了约一半的权值（即实现了2倍稀疏率）。

随着稀疏化技术的深入发展，其效果日益显著。墨芯计算卡现已能够实现4至32倍的稀疏率。王维表示，通过计算卡优化模型，这个过程具有长久的效益，即一旦优化完成，对AI模型的加速效果将持续存在。相较于英伟达，墨芯计算卡更高的稀疏倍率意味着在算力、成本、能效比等方面拥有更大的优化空间。这不仅有助于提升AI计算的效率，同时也为产业发展带来了新的机遇和挑战。

在这个背景下，稀疏化计算技术已成为产业层面应用的新焦点。随着AI模型对计算资源的需求不断增长，如何有效利用稀疏化技术来提升计算性能，降低算力成本，已成为业界关注的焦点。墨芯计算卡在稀疏化技术方面的突破，为AI计算领域的发展注入了新的活力，也让我们看到了未来AI计算的新方向。他以目前风头正劲的自然语言大模型GPT-3为例向我们展示，GPT-3具备惊人的1700多亿参数，如果使用GPU来驱动它，需要动用十张A100加速卡。墨芯的独门秘籍——稀疏化算法，却能让这一庞然大物在一张S30卡上轻松运转，这无疑大大降低了运行成本。

除了算法模型的精细打磨，墨芯与英伟达以及其他AI芯片公司并肩作战，深度参与芯片、计算卡、开发工具的全方位研发。在这里，软硬件开发人员的比例达到了6:4，显示出墨芯对于软件研发的重视和投入。可以说，墨芯不仅拥有强大的硬件实力，更在软件层面下足了功夫。他们深知，只有软硬件的完美结合，才能推动AI技术的飞跃发展。王维解释道，虽然稀疏化计算更多是从算法层面进行的工作，但墨芯之所以参与芯片和计算卡的开发，是因为我们主张从算法出发，实现软硬协同设计，以此达到最佳的加速效果。我们深知，虽然算法的创新是核心，但仅有理论的创新是不够的，还需要考虑软硬件的平台支撑，将数学理论转化为实际的计算效果。

据王维透露，墨芯的下一步计划是在优化稀疏化推理平台的基础上，进一步布局稀疏化训练。我们正在努力研发新一代产品，预计将在明年年底正式推出，以满足不断增长的计算需求，并继续为用户提供高效、优质的计算体验。

上一篇：人类该如何跟机器人——这个自然界中的新物种相处？下一篇：AI人才争夺战：应届博士年薪涨至上百万，没出校门就被挖走

国际AI测试项目现中国黑马，“稀疏化计算”如何打破算力瓶颈？

人工智能机器人网搜索

人工智能机器人网导航

工业机器人

机器人培训

机器人技术

国际AI测试项目现中国黑马，“稀疏化计算”如何打破算力瓶颈？

生活小妙招

人工智能机器人网搜索

人工智能机器人网导航

工业机器人

机器人培训

机器人技术