国际AI测试项目现中国黑马,“稀疏化计算”如何打破算力瓶颈?
全球AI基准评测MLPerf近期公布了最新结果,国产新星崭露头角。在备受瞩目的MLPerf Inference v2.1榜单中,众多行业巨头展开激烈竞争。在这场顶尖对决中,墨芯人工智能的S30计算卡以其卓越性能脱颖而出。
在开放任务(Open division)测试环境下,墨芯S30计算卡表现出惊人的实力。它以95784 FPS的单卡算力,成功夺得Resnet-50模型算力全球桂冠。更令人惊叹的是,当面对BERT-Large高精度自然语言处理模型时,墨芯S30的计算能力达到了3837SPS,是英伟达A100的两倍,仅次于英伟达H100,展现了其在自然语言处理领域的出色表现。
墨芯人工智能的创始人王维在接受界面新闻等媒体采访时,对这个成绩赞不绝口。“这个成绩的亮点在于它验证了我们技术路线的正确性,并引起了行业内外的高度关注。这一成就不仅是对我们团队努力的肯定,也为国产AI技术的发展注入了新的活力。”王维表示。
此次MLPerf的评测结果,无疑为墨芯人工智能的发展注入了强大的动力。作为国产黑马的墨芯,其技术实力和创新能力得到了充分的展示,未来值得期待。墨芯人工智能(Moffett AI)——自2018年诞生于深圳,以云端和终端AI芯片加速方案的研发为核心。创始团队背景强大,来自赫赫有名的卡内基梅隆大学。墨芯的发展历程中,获得了众多知名投资机构的青睐。从天使轮到A轮,凯旋创投、创享基金、云天使基金、浪潮云海基金等纷纷为其注入资金。将门创投、真格基金、基石资本以及深圳的天使母基金等也参与了其Pre-A轮和A轮的投资。
在最近的测试中,墨芯的“稀疏化计算”技术大放异彩,成为MLPerf测试中的突破点。这种技术深受启发于人脑模型压缩方式,能够有效地加速AI计算。所谓的“稀疏化计算”,不仅代表着技术的先进性,更是未来AI发展的一种趋势和方向。墨芯以此技术为核心,展现出强大的研发实力和创新能力,为AI领域注入了新的活力。墨芯团队独创了一种新型稀疏化技术,通过精准抽离部分模型参数,让深度学习计算如同拆卸又重建的积木游戏。在保证AI模型稳固、不会“坍塌”的显著减少了矩阵运算所需的计算量。这一技术的核心优势在于大大缩短了获得准确结果的时间,提高了计算效率。压缩稀疏矩阵不仅能降低内存和带宽的占用,还广泛应用于所有类型的AI加速计算模型,包括当下火热的“大模型”。
墨芯首创的双稀疏算法展现了卓越的技术实力,目前已拥有超过30项全球专利。其首款Antoum处理器芯片已经成功出货,实现了最高达32倍的稀疏率。在全球范围内,墨芯的这种技术路线堪称独树一帜,鲜有类似者。
尽管学界对稀疏化计算早有探索,但此前的研究和实践面临诸多挑战。过去,尽管研究人员尝试抽出神经网络中高达95%的参数权重,但模型精简所需的时间往往超过节省的时间,且模型的精度损失难以弥补。一种模型的精简方法往往不适用于其他模型,这一现状使得稀疏化技术在应用上受到限制。墨芯团队通过持续的技术积累和深入研究,成功打破了这一僵局。尽管在当前的AI计算领域中,稠密数学计算仍然占据主导地位,但随着AI模型的日益通用化和规模的不断膨胀,内部模型稀疏化所带来的加速效应正逐渐受到重视。这一技术的崛起,无疑将在AI计算层面产生重大影响。以英伟达为例,其在Ampere架构A100 GPU中引入了稀疏性支持,通过训练神经网络,成功减少了约一半的权值(即实现了2倍稀疏率)。
随着稀疏化技术的深入发展,其效果日益显著。墨芯计算卡现已能够实现4至32倍的稀疏率。王维表示,通过计算卡优化模型,这个过程具有长久的效益,即一旦优化完成,对AI模型的加速效果将持续存在。相较于英伟达,墨芯计算卡更高的稀疏倍率意味着在算力、成本、能效比等方面拥有更大的优化空间。这不仅有助于提升AI计算的效率,同时也为产业发展带来了新的机遇和挑战。
在这个背景下,稀疏化计算技术已成为产业层面应用的新焦点。随着AI模型对计算资源的需求不断增长,如何有效利用稀疏化技术来提升计算性能,降低算力成本,已成为业界关注的焦点。墨芯计算卡在稀疏化技术方面的突破,为AI计算领域的发展注入了新的活力,也让我们看到了未来AI计算的新方向。他以目前风头正劲的自然语言大模型GPT-3为例向我们展示,GPT-3具备惊人的1700多亿参数,如果使用GPU来驱动它,需要动用十张A100加速卡。墨芯的独门秘籍——稀疏化算法,却能让这一庞然大物在一张S30卡上轻松运转,这无疑大大降低了运行成本。
除了算法模型的精细打磨,墨芯与英伟达以及其他AI芯片公司并肩作战,深度参与芯片、计算卡、开发工具的全方位研发。在这里,软硬件开发人员的比例达到了6:4,显示出墨芯对于软件研发的重视和投入。可以说,墨芯不仅拥有强大的硬件实力,更在软件层面下足了功夫。他们深知,只有软硬件的完美结合,才能推动AI技术的飞跃发展。王维解释道,虽然稀疏化计算更多是从算法层面进行的工作,但墨芯之所以参与芯片和计算卡的开发,是因为我们主张从算法出发,实现软硬协同设计,以此达到最佳的加速效果。我们深知,虽然算法的创新是核心,但仅有理论的创新是不够的,还需要考虑软硬件的平台支撑,将数学理论转化为实际的计算效果。
据王维透露,墨芯的下一步计划是在优化稀疏化推理平台的基础上,进一步布局稀疏化训练。我们正在努力研发新一代产品,预计将在明年年底正式推出,以满足不断增长的计算需求,并继续为用户提供高效、优质的计算体验。
生活小妙招
- 国际AI测试项目现中国黑马,“稀疏化计算”如何
- 人类该如何跟机器人——这个自然界中的新物种
- 人工智能超越人类会如何?计算机或可自我复制
- 电动汽车初创公司Rivian第四季度营收6.63亿美元,
- 智能制造重塑劳动力市场!广东企业急需高学历
- 长虹空调亮相AWE 《品质宣言》 树立绿色高质量
- 中国手术机器人现已攻克技术难关,一台售价2
- 全球科技趋势未来至2025年技术发展预测概览
- 磁驱微型软体机器人实现输卵管内靶向递药
- 2015航空制造十大亮点 机器人与绿色制造是关键
- 对话唐文斌,最强大脑如何助推物流行业战略升
- 用工高成本及低利润成LED照明规则
- 河北省石家庄市3支代表队获全国机器人科技运动
- AMTS 2017 蔚来汽车成功背后的故事
- 2020中国(安徽)智慧城市与公共安全博览会
- 机器人“焊”将