服务云原生 Graviton2处理器带来40%性价比提升 AW

人工智能 2022-06-19 08:08www.robotxin.com人工智能专业
[an error ourred hile processing the directive]

【人工智能机器人网】2月5日消息,日前,亚马逊云服务(AWS)正式宣布,由 AWS Graviton2 处理器提供支持的 Amazon Elastic Compute Cloud (Amazon EC2) M6g、C6g 和 R6g 实例(注1)已在由光环新网运营的 AWS 中国(北京)地区和由西云数据运营的 AWS 中国(宁夏)区域推出。这是AWS自研处理器落地中国区域。

截至2021年1月,AWS推出了近400种Amazon EC2实例,被全球几百万客户广泛使用。

作为一款AWS自研、基于Arm架构、原生为云而设计开发的芯片,AWS Graviton2 处理器于2019年12月在AWS re:Invent大会上正式发布。历时1年多正式落地中国,AWS大中华区云服务产品管理总经理顾凡表示,Graviton2 处理器将给客户带来很多惊喜,Graviton2的使用场景会打破大家对于ARM在企业级应用适用范围的原有认知。

事实上,因为海外业务需求增长,国内企业涂鸦智能和大觥科技均已率先采用Graviton2 处理器支持的Amazon EC2实例来赋能公司业务发展。

据涂鸦云端开发部首席架构师陈亚焱介绍,涂鸦提供全球化AI+IoT平台,每天处理设备请求840亿次,请求高峰达150万次/秒,日处理1.2亿次AI语音交互。去年的黑五、圣诞、元旦,涂鸦均迎来一波流量增长高峰,这就要求平台必须做到非常实时的扩容。目前涂鸦已经将公司约40%的实例切换至Graviton2架构的实例上。基于Graviton2实例,涂鸦CPU性能提升100%,CPU占用率从之前的27%降到12%;服务器单价降低20%,整体性价比提升2.5倍。

大觥科技有限公司是一家专注AI影像处理领域科研和应用的公司,该公司服务多家电影厂、电视台、影视后期等企业级客户,针对个人用户,推出了国内app“你我当年”,以及海外app“Remini”。大觥科技副总裁袁泉介绍,2020年2月,海外Remini业务量出现猛烈增长,使得公司算力支持遇到瓶颈,于是开始跟AWS合作。通过对比Graviton系列的C6g和传统架构的C5.large两款机型,发现C6g在性能上提升了30%,在成本上节约了38%。

根据AWS官方提供的更全面的对比测试数据显示,与同配置X86实例相比,由AWS Graviton2处理器提供支持的Amazon EC2 M6g、C6g和R6g实例的性价比提高了40%。

Graviton2处理器何以有如此高的性能提升,近日AWS大中华区云服务产品管理总经理顾凡和AWS大中华区产品部计算与存储总监周舸接受了人工智能机器人网等的采访,对Graviton2处理器及其支持的EC2实例背后的关键技术及产品服务发展战略进行了解读。

AWS自研芯片

谈及Graviton2处理器就不得不谈AWS的自研芯片战略。

2013年AWS开始跟Annapurna labs合作研发第一代Nitro。此后,Amazon收购了Annapurna labs,将其变成自己的半导体设计公司,由此揭开了自研半导体芯片的发展历程。

目前,AWS的自研芯片有3条主线。

第一条是AWS Nitro。2017年AWS第一次公开介绍Nitro,Nitro的研发升级旨在为用户提供更高的网络访问性能。到2020年,Nitro已经发展到了第四代。Nitro架构及Nitro卡的升级迭代,让AWS网络能力从最初10G的时代跨入到100G再到2020年的400G,存储带宽能力提升好几倍。

第二条,针对机器学习,AWS在2019年推出了AWS Inferentia专门用于推理的芯片;,AWS计划在2021年推出自研的专门为训练工作负载设计的AWS Trainium芯片。

第三条,就是在CPU部分的投入和研究。2018年的时候,AWS推出基于ARM架构的Graviton第一代CPU芯片。2019年re:Invent,AWS推出第二代产品Graviton2。此后的2020年开始有很多客户迁移至Graviton2。

Graviton2的设计关键

周舸强调,Graviton2是最新的基于ARM架构自研的芯片,也是第一个真正的以云为原生设计的,适合运营现代化应用负载提供云服务的芯片。

AWS究竟是如何思考和设计ARM架构的CPU?Graviton2到底跟传统的X86有什么不一样?对此周舸进行了解读。

周舸介绍,设计Graviton2的目标很简单,希望每一个核在Graviton2里面,都能够达到最好的真实性能,满足客户现代化应用的需要。,我们希望在一个CPU里,放尽量多独立的核,以便最大程度的让它充分发挥平行扩展的能力。

通过比较基于Graviton2的实例C6g.large和基于X86架构英特尔CPU的实例C5.large,这种差异化设计更能一目了然。

C5.large是AWS基于Intel内核的计算密集型实例。C6g.large实例基于Graviton2内核实现。

周舸介绍,这两个实例最明显的区别是,C5.large一个核里可以跑两个线程,每一个线程相当于一个独立的任务在运行,通过SMT去控制和协调。两个线程共享一级和二级缓存。这是标准的Intel的内核设计特色。Graviton2采用两个物理核,每一个核只跑一个线程,只完成一个任务,独享L1和L2缓存,互相不受干扰。

周舸强调, 基于Graviton2的C6g.large实例一级缓存多了4倍,二级缓存增大2倍。这些都充分让Graviton2内核的CPU能够最大程度的适应云原生可平行扩展的微服务化应用,能够充分发挥它的能力。这是我们设计Graviton2的最关键的一些特点。

与第一代AWS Graviton处理器相比,AWS Graviton2处理器性能达到前者7倍、计算核心数量达到4倍、缓存达到2倍、内存速度达到5倍。AWS Graviton2处理器具有全天候运行的256位内存加密功能,每个核心的加密性能速度比第一代AWS Graviton处理器提高50%。

目前,AWS Graviton2 处理器提供支持的 Amazon EC2 M6g、C6g 和 R6g 实例已经正式落地中国。

其中,Amazon EC2 M6g为通用型实例,为工作负载提供均衡的计算、内存和网络资源,可用于开源软件应用程序,例如微服务、游戏服务器和消息队列等;C6g为计算优化型实例,计算资源配比较高,适用于计算密集型应用程序,例如高性能计算、批处理、广告服务、视频编码、游戏、科学建模、分布式分析和基于CPU的机器学习推理等工作负载;R6g为内存优化型实例,内存资源配比较高,适用于内存密集型应用程序,例如开源数据库、内存数据库和实时大数据分析。三类实例都分别有8种资源大小可供选择,分别为1个、2个、4个、8个、16个、32个、48个和64个vCPU,并且可以作为按需实例、预留实例或Spot实例购买,充分体现了云计算资源配置的灵活性。

AWS大中华区云服务产品管理总经理顾凡表示,云计算的创新始终没有停止,客户的需求始终是AWS创新的动力源泉。AWS与英特尔、AMD、英伟达、赛灵思等芯片厂商都有着深入的合作,我们推出自研处理器,旨在为客户提供更多样化的计算实例选择,在提供出色性能的节省大量成本,满足客户不同应用场景的需求。

顾凡也向人工智能机器人网强调,我们把选择权交给客户,让客户根据自己的需求去选择合适的产品。我们会在客户充分地体会到Graviton2带来的性价比提升的情况下,帮助他们在中国区域用起来。 (文/宁萌)

(注1实例是AWS提出的一个云计算基本概念,它是指在一段时间内分配的一组计算资源。用通俗的叫法,实例也被称作云服务器、虚拟服务器、云主机、虚拟机等等。)

Copyright © 2016-2025 www.robotxin.com 人工智能机器人网 版权所有 Power by