浪潮AI服务器:“长期主义”的领跑逻辑

工业机器人 2021-06-01 09:04www.robotxin.com工业机器人教育
浪潮AI服务器又上“热搜”了!

在最近公布的全球“最严格”AI基准测试MLPerf成绩榜单中,浪潮凭借自研的AI服务器NF5488A5打破了18项推理性能纪录,成为打破纪录最多的AI服务器,成功问鼎AI“机王”。不仅如此,在焦点赛道ResNet50基准性能测试中,NF5488A5更是以54.9万/秒的推理性能问鼎榜首,相比2019年榜单服务器全球最好成绩性能提升高达3倍。

无独有偶,IDC日前发布的最新一期《2020H1中国AI加速计算报告》中也显示,2020年上半年,虽然受到疫情的影响,但浪潮AI服务器销售额仍达6.88亿美元,市场份额占比达53.5%,同比2019上半年提升3.3个百分点,持续领跑AI算力市常

毫无疑问,无论是成功问鼎AI“机王”,还是连续独占AI服务器市场“半壁江山”的背后,本身就是浪潮坚持“长期主义”的一种最佳印证,而这种专注和坚守的态度,以及勇于创新和超越自我的追求,不仅是浪潮在AI服务器市场中实现领跑的根本逻辑,更是在“新基建”的大背景下,浪潮未来加速赋能整个产业智能化转型的关键所在。

“长期主义”的领跑逻辑

众所周知,浪潮在AI服务器市场的布局,最早可以追溯到2012年,经过大约5年时间的不断探索和沉淀,从2017年开始浪潮迎来了人工智能爆发的风口,由此开始在市场中实现了“攻城掠地”般的高速增长,因界很多人往往把浪潮能够领跑市场的原因,归结为“做的早”,更赶上了AI爆发的风口。

浪潮AI&HPC产品线总经理刘军

不过,作为见证浪潮AI服务器在市场中崛起的“亲历者”,浪潮AI&HPC产品线总经理刘军却有不同的看法。他认为,尽管有技术创新的外部因素,但首当其冲的还是浪潮始终把战略坚定地聚焦在人工智能这个方向上,还一直坚持在产品、研发、市场上的大手笔投入,这才是浪潮取得高速增长的重要原因。

事实上,作为国内领先的算力供应商,浪潮在早期更多的感受是,摩尔定律已经出现了衰退的迹象,从原来的主频增长变成核数增长,这对超算性能的提升造成了很大的影响,浪潮最早涉足这一市场,其实是在加速计算以及异构计算领域进行投入,目的是希望解决超算对性能的需求。

“在2016年以前,浪潮坚持在加速计算以及异构计算领域投入是相当痛苦的,因为当时异构计算应用主要集中在高性能计算的领域,相对来说市场比较狭窄,商业回报也不是很高,但即便遇到这样的问题和困难,浪潮也没有放弃坚定投入的战略,仍然持续不断地在异构计算领域做更多的探索和的创新。”刘军说。

正所谓“功夫不负有心人”。从2015年开始,浪潮注意到异构加速从传统的HPC领域转入到深度学习领域,采用GPU加速成为此时市场新的选择。浪潮当年就果断决定展开与NVIDIA的联合创新,并推出了当时性能世界第一的AI服务器AGX-2,这为浪潮在人工智能领域的“起跑”开启了新的赛道;而在软件优化方面,源于对异构计算的深刻理解,浪潮也积极开始对深度学习框架单机版进行异构扩展优化工作,并在2016年的GTC大会上基于Caffe推出了全球首款Caffe-MPI版本并向社区正式开放。

刘军谈及当时的选择说“那时候GPU刚进入到深度学习领域,为了打造性能更强的计算系统,NVIDIA当时推出了NVLink技术,不过很多服务器厂商对这个新技术都抱有质疑的态度,大部分都处在观望的状态,认为做起来挑战和难度都特别大。”

但浪潮同样“义无反顾”做了投入的战略决定,当时浪潮是全球第一家全力投入研发基于NVLink高速互联的AI服务器公司,这个决定今天看来非常有远见性,因为产品的研发至少需要十几个月的周期,当这款AI服务器于2017年大规模面向客户商用时,正好迎来了人工智能爆发的热潮,如同早年的苹果手机一样,这款机器一上市就受到了客户的热烈追捧,出现了“一机难求”的火爆销售局面。

值得一提的是,也正因为浪潮在AI服务器领域还坚持“软硬兼施”的策略,当人工智能于三年前在各行各业兴起的时候,作为国内拥有强大GPU硬件、软件移植优化团队的公司,浪潮无论是和大型互联网客户,还是大量新创AI公司的合作中,都受到了一致的认可和信任,这同样也是友商无法比拟的先发优势,让浪潮在这之后实现了对市场的持续领跑。

由此可见,浪潮这种对技术演进方向前瞻性的判断,以及坚定不移地推动战略目标的执行,是其连续三年以过半份额的绝对优势领跑中国AI服务器市场的根本原因,是浪潮对“长期主义”坚持的一种胜利,而这种“长期主义”的一个重要特质,就是专注和耐心,即不论环境如何变化,不管短期是否有可观的回报,浪潮都始终坚持自己的既定战略和敢于大胆的市场投入,由此迎来了整个市场的“开花结果”。

“头部效应”的全新价值

今天,浪潮已跃升成为全球领先的AI计算提供商,业务覆盖芯片、平台、管理和框架的全栈AI计算领域,旗下产品包括全球AI计算性能最强,每秒达2千万亿次的人工智能超级服务器AGX-5,全球首款集成HBM2的人工智能计算可重构加速卡F37X,支持TensorFlo的FPGA计算加速引擎TF2等。

,通过在AI软件领域的长期投入,浪潮还向市场推出了AIStation推理平台,该平台可以对训练推理进行一站式管理,进一步简化AI开发、训练、优化到部署的全业务过程,最大化的提速AI生产交付过程。

在此过程中,为了更好的推动AI产业化和产业AI化进程,浪潮今年也决定参加全球权威的MLPerf Benchmark(基准测试),MLPerf是当前全球最具影响力的AI计算基准评测组织,由图灵奖得主大卫帕特森(DavidPatterson)联合谷歌、斯坦福、哈佛大学等机构共同成立,每年组织全球AI训练和AI推理性能测试并发榜。

刘军认为“好的Benchmark是整个AI产业良性发展的重要条件,例如今年MLPerf中比拼测试的场景就比往年丰富了许多,都是一些更加贴近AI场景的应用模型和方法,这样的Benchmark结果,对于客户选择硬件系统的设计,软件系统的优化,都有非常好的指导意义和重要的参考借鉴价值,能够让整个产业获得一个更加健康,更加良性,更加快速的发展。”

据介绍,今年MLPerf的AI推理基准测试中,全球共有23家公司和机构参与,在数据中心及边缘等场景进行AI计算产品的性能“大比武”,而浪潮NF5488A5创下了数据中心22个赛项中的13项性能纪录,以绝对优势领先,NVIDIA DGX取得了5项数据中心性能纪录。不仅如此,浪潮NF5488A5在开放优化(Open)和固定任务(Closed)的ResNet50推理测试中表现优异,相比2019年MLPerf推理榜单的服务器最好性能提升了3倍。而且,在此前的MLPerfAI训练基准测试中,NF5488A5就在Res50训练任务上刷新了全球性能纪录。

浪潮NF5488A5创造18项MLPerf推理性能记录

对于浪潮这次参与MLPerf基准测试取得成绩,刘军也是相当骄傲的。一方面,MLPerf的组织方式是开放和快速迭代的,Benchmark榜单的发布更新速度非常快,对于参与测试的厂商来说,就意味着必须具备非常敏锐的技术跟踪和创新能力,还需要把技术架构进行落地,考验的是参与厂商的综合性能力。

另一方面,浪潮能够在此次MLPerf推理测试中创下领先的性能记录,这背后的关键原因,就在于除了硬件本身实力强劲之外,还需要非常强的底层硬件优化和上层软件算法优化的整合能力,而浪潮能够强势霸榜,也证明了浪潮在AI服务器领域真正具备了全球领先的能力。

更为关键的是,浪潮如此优秀的Benchmark测试成绩,除了能够给AI用户提供非常好的参考性之外,也会产生更大的“头部效应”为更多的客户提供更高质量,更高性价比的AI服务器,由此进一步形成规模化的优势;而在此基础上,也会让浪潮有机会围绕头部AI客户做更加有针对性的价值创新,最终为AI产业化和产业AI化转型奠定更为坚实的基矗

“元脑生态”的决心与诚意

客观的说,虽然过去几年AI得到了快速的发展,业界也认识到AI产业化和产业AI化给千行百业带来的巨大价值,但它却很难在一夜之间实现大规模的“普惠化”,其落地之路仍然任重道远。

“AI具备强大的革命性生产力,但要将这个革命性的生产力释放出来,还需要整个产业界共同的努力,这就如同一颗颗良种,要发芽长大,就需要园丁经常施肥浇水,不断的尝试,不断的改造,在建设中脚踏实地,慢慢地培养,直到它真正长成参天大树,最终成为一个全新的生态。”刘军说。

从这个角度来看,释放AI的强大算力,不仅是个技术问题,也是个生态问题。基于此,浪潮去年正式发布了“元脑生态”计划,由浪潮、具备AI功能开发核心能力的左手伙伴和具备实施行业AI整体方案交付能力的右手伙伴共同组成,聚合了AI最强算力平台、最优质的算法模型开发能力和最优质的集成、部署和服务能力,将支撑和加速行业智能的构建,让各个行业具备可感知、自学习、可进化的能力,最终目标是帮助用户完成业务智能转型升级,以生态之力成就行业AI大脑。

经过一年半时间的发展,目前浪潮“元脑生态”已汇聚左右手伙伴近200家,并在金融、铁路、电力、交通、智慧城市、石油石化及泛行业落地了一系列产业化AI解决方案。而在IPF2020上,浪潮正式宣布投入亿元资金成立“E 基金”发展元脑生态,在联合技术创新、市场推广、AI人才培养等维度对生态伙伴提供更大的支持。

对此,刘军也坦诚的说“AI生态的打造不是一蹴而就的,现在整个生态发展就处于努力爬坡的困难阶段,当把这个阶段迈过去之后,我们希望生态内部会产生新的反应,即生态伙伴之间能够相互的升级合作,最终让生态聚合产生更大的价值,这个目标尽管很难,但浪潮一定会坚持去做,且一定会把生态做好。”

总的来看,多年的专注和坚守,除了让浪潮的市场份额遥遥领先之外,浪潮从战略高度上对整个产业的判断,如早在四年前提出的智慧计算、产业化AI化以及今年上半年提出的智算中心等方向和理念,今天都已经逐渐“深入人心”,可以说这也是浪潮对于整个中国计算产业发展做出的特殊贡献。

而在“新基建”提速的大背景下,浪潮践行的“长期主义”战略,对于技术创新的不断追求,以及开放赋能的决心和诚意,一定会加速产业AI化进程,让整个产业最终呈现出“百花齐放”的状态,进而推动中国数字经济高质量发展迈上一个崭新的台阶。

Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by