推进云计算以及生成式 AI 英伟达 H100 GPU 已对亚马逊 AWS 云服务用户开放
英伟达官网最新公告宣布,亚马逊云科技正式推出了全新的Amazon Elastic Compute Cloud(EC2)P5实例,其强大动力源自英伟达H100 Tensor Core GPU。这一创新服务为用户带来了无与伦比的便捷性,通过浏览器即可轻松扩展生成式AI和高性能计算(HPC)等应用的运行。
英伟达H100 GPU的一大亮点在于其对Transformer技术的优化。这一优化确保了H100在诸多先进的AI应用中表现出更高的性能和效率,而这些应用正广泛采用Transformer技术作为核心。
IT之家深入调查发现,虽然亚马逊Web服务(AWS)目前尚未就集成AMD MI300芯片到其云服务中公开发表任何承诺,但亚马逊弹性计算云副总裁Dave Brown已证实AWS正在积极考虑这一合作方案。
随着大型语言模型(LLMs)在AI领域的持续火热,开发人员和研究人员正不断探索其新应用场景。英伟达表示,推动这些新用例走向市场需要计算效率的加速。而英伟达H100 GPU凭借其架构创新,提供了超级计算级别的性能。其中包括第四代Tensor Cores、专为加速LLMs设计的新Transformer引擎,以及最新的NVlink技术,这些都将带来极其显著的性能提升。
值得一提的是,EC2 P5实例非常适合用于训练和运行复杂的LLMs以及计算机视觉模型的推理。这些强大的神经网络正是驱动最复杂、计算最密集型的生成式AI应用程序的动力源泉,包括但不限于问答、代码生成、视频和图像生成以及语音识别等。英伟达与亚马逊云的强强联手,无疑将为生成式AI和高性能计算领域带来前所未有的发展机遇。