苏妈杀疯了:移动端最强算力达,最强芯片挑战英伟达

机器之心报道

作者:杜伟、亚鹂

你方唱罢我登场。一年一度的Computex科技大会成为了GPU厂商们秀肌肉的舞台,其中当属英伟达和AMD最为亮眼。英伟达现场拿出了量产版Blackwell芯片,还公布了未来三年的产品路线,包括下一代RubinAI平台。

AMD当然也不甘示弱,CEO苏姿丰亮出了旗下的CPU、GPU产品及路线图,包括全新Zen5架构的桌面端Ryzen9000系列CPU、AIPC芯片、数据中心芯片和GPU。

苏姿丰

全新Zen5架构

锐龙9000桌面系列芯片首次亮相

苏姿丰在演讲中着重介绍了基于Zen5架构的全新桌面端RyzenCPU,它们经过优化可以通过神经网络处理器来加速AI工作负载。

下图为下一代高性能CPU核心Zen5的各项规格,它不仅是当前Ryzen9000系列处理器的核心,也将成为今年下半年推出的TurinEpyc霄龙服务器CPU的核心。

苏姿丰表示,Zen5是AMD迄今设计的性能和能效均最高的核心,而且它是从头开始设计的。其中,该核心拥有一个新的并行双管道前端,旨在提高分支预测准确性并减少延迟,并能够在每个时钟周期提供更高的性能。

此外,Zen5具有更宽的CPU引擎指令窗口,可以并行运行更多指令,以实现领先的计算吞吐量和效率。与Zen4相比,Zen5的指令带宽增加了一倍,缓存和浮点单元之间的数据带宽增加了一倍,AI性能增加了一倍,同时具有完整的AVX512吞吐量。

苏姿丰现场首次展示了采用Zen5架构的Ryzen99950X。

Ryzen99950X拥有16个核心和32个线程,加速后运行速度可以高达5.67GHz。Zen5的平均每个核心指令比之前的Ryzen芯片以及「Genoa」Epyc9000系列处理器中使用的Zen4核心多16%。此外,TDP为170W,L2 L3缓存为80MB。

下图为Ryzen9000全系列CPU,包括了Ryzen99950X、Ryzen99900X、Ryzen79700X、Ryzen59600X以及规格比较。这些产品预计今年7月上市。

AMD给出的内部游戏测试数据显示,Ryzen99950X对游戏性能的提升幅度不一。比如在《无主之地3》中的表现仅比英特尔Corei9-14900K高出4%,在《杀手3》中高出6%,在《赛博朋克2077》中高出13%。此外,Ryzen99950X在《F12023》中的表现较英特尔提升了16%,在《DOTA2》中提升了17%,在《地平线零之曙光》中提升了23%。

50TOPS

AMD最强移动端NPU算力

苏姿丰展示了下一代AIPC芯片——锐龙AI300系列APU(第三代)。

下图为锐龙AI300系列芯片实拍。

锐龙AI300系列芯片旨在提供下一代AIPC体验,因而要求NPU、CPU和GPU均要达到最佳。

锐龙AI300系列首发提供了两款型号,锐龙AI9HX370和锐龙AI9365。下图为锐龙AI9HX370的参数规格。

锐龙AI300系列采用了XDNAAINPU,号称移动端最强NPU,算力达50TOPS,不仅达到了微软对新一代AIPC「NPU算力40TOPS以上」的标准,还超过了高通骁龙XElite的45TOPS、英特尔LunarLake的40-45TOPS。

AMD表示,搭载锐龙AI300系列的笔记本将于今年7月起陆续上市。

最高192核心384线程

第五代EPYC霄龙问鼎数据中心芯片

苏姿丰现场也展示了第五代「Turin」EPYC霄龙芯片,它号称全球最强数据中心CPU。

下图为第五代AMD霄龙Turin芯片的参数规格。目前没有透露太多细节,从基础信息参数来看,Turin具有192个Zen5核心和384个线程,采用与GenoaEpyc9004s相同的SP5插槽适配。

Turin芯片可能会被命名为「Epyc9005s」。可以期待的是,在IPC方面,它与RyzenZen5芯片相近。相较于Zen4核心,IPC改进可能在15%到20%之间。苏姿丰展示了Turin芯片的一些早期基准测试数据。

如下图所示,图上为具有128个核心的Turin芯片在NAMD分子动力学应用程序中运行STMV基准测试的性能。Turin芯片模拟了2000万个原子,并计算了计算引擎在24小时内可以处理多少纳秒的分子相互作用。可以看到,苏妈杀疯了:移动端最强算力达,最强芯片挑战英伟达128核心的Turin芯片是64核心英特尔「EmeraldRapids」XeonSP-8592 工作量的约3.1倍。

图下为基于MetaLlama27B模型的AI吞吐量基准测试,该模型以INT4数据格式处理,推理token生成设置为50毫秒。128核心的Turin芯片是英特尔竞品CPU性能的2.5倍到5.4倍之间,具体数值取决于工作负载。

对标英伟达

AMD的InstinctGPU也一年一更

讲完了CPU,接下来的重头戏就是InstinctGPU了,它将是AMD未来产品战略的一个重要抓手。

苏姿丰表示,「Antares」MI300系列是AMD历史上增长最快的产品,在HPC和AI工作负载方面的可用性看起来有点像英伟达GPU,不过其所提供的性能优势以及HBM内存容量、带宽优势较为突出。

比如在推理工作负载方面,通过对Llama3(具有700亿参数)进行推理检验性能的结果来看,一台配备8个MI300XGPU的服务器性能约为一台配备8个H100GPU加速器的英伟达HGX性能的1.3倍。而在Mistral7B模型上,单个MI300X的性能则是英伟达H100GPU的约1.2倍。

随后,苏姿丰公布了2024-2026年的InstinctGPU路线图,今年推出MI325X,2025年推出MI350,2026年推出MI400。

MI325X将具有更大的算力规模,并转向HBM3E内存。下图为MI325X的基础性能规格,内存增加了2倍,最高可达288GB;带宽增加了30%,达到了6TB/秒。

下图为MI325X的数据传输速度与英伟达H200(141GB内存)比较的结果。值得一提的是,1万亿参数的模型将适配一台配有八个MI325X的系统主板,每个GPU都有288GB的HBM3E内存容量。

据悉,MI325X最快将在今年第四季度推出。不过到那时,英伟达将在该领域中凭借B100占据一席之地,并将大规模量产H200。因此,AMD感受到了危机,并且迅速行动。

这也是为什么AMD提前推出MI350X的原因,它采用了全新CDNA4架构、台积电3纳米工艺、288GB的HBM3E内存以及FP6、FP4数据类型。MI350X也将成为AMDInstinctMI350系列的第一款产品。

在推理性能方面,CDNA4架构是CDNA3的35倍。

MI350的内存容量将是英伟达2025年推出的B200(BlackwellUltra架构)芯片的1.5倍,AI计算能力是后者的1.2倍。

AMD这波就是奔着英伟达去的,到时候有好戏看了。

原文链接:

https://www.nextplatform.com/2024/06/03/amd-previews-turin-epyc-cpus-expands-instinct-gpu-roadmap/

参考链接:

https://www.anandtech.com/show/21415/amd-unveils-ryzen-9000-cpus-for-desktop-zen-5-takes-center-stage-at-computex-2024

免责声明:本网站部分内容由用户自行上传,若侵犯了您的权益,请联系我们处理,谢谢!联系QQ:2760375052

分享:

扫一扫在手机阅读、分享本文

熙旋

这家伙太懒。。。

  • 暂无未发布任何投稿。

最近发表