苏妈杀疯了：移动端最强算力达，最强芯片挑战英伟达

心合医疗科技 2024-07-17 1048 0 苏妈杀疯了移动端最强算力达最强芯片挑战英伟达

机器之心报道

作者：杜伟、亚鹂

你方唱罢我登场。一年一度的Computex科技大会成为了GPU厂商们秀肌肉的舞台，其中当属英伟达和AMD最为亮眼。英伟达现场拿出了量产版Blackwell芯片，还公布了未来三年的产品路线，包括下一代RubinAI平台。

AMD当然也不甘示弱，CEO苏姿丰亮出了旗下的CPU、GPU产品及路线图，包括全新Zen5架构的桌面端Ryzen9000系列CPU、AIPC芯片、数据中心芯片和GPU。

苏姿丰

全新Zen5架构

锐龙9000桌面系列芯片首次亮相

苏姿丰在演讲中着重介绍了基于Zen5架构的全新桌面端RyzenCPU，它们经过优化可以通过神经网络处理器来加速AI工作负载。

下图为下一代高性能CPU核心Zen5的各项规格，它不仅是当前Ryzen9000系列处理器的核心，也将成为今年下半年推出的TurinEpyc霄龙服务器CPU的核心。

苏姿丰表示，Zen5是AMD迄今设计的性能和能效均最高的核心，而且它是从头开始设计的。其中，该核心拥有一个新的并行双管道前端，旨在提高分支预测准确性并减少延迟，并能够在每个时钟周期提供更高的性能。

此外，Zen5具有更宽的CPU引擎指令窗口，可以并行运行更多指令，以实现领先的计算吞吐量和效率。与Zen4相比，Zen5的指令带宽增加了一倍，缓存和浮点单元之间的数据带宽增加了一倍，AI性能增加了一倍，同时具有完整的AVX512吞吐量。

苏姿丰现场首次展示了采用Zen5架构的Ryzen99950X。

Ryzen99950X拥有16个核心和32个线程，加速后运行速度可以高达5.67GHz。Zen5的平均每个核心指令比之前的Ryzen芯片以及「Genoa」Epyc9000系列处理器中使用的Zen4核心多16%。此外，TDP为170W，L2 L3缓存为80MB。

下图为Ryzen9000全系列CPU，包括了Ryzen99950X、Ryzen99900X、Ryzen79700X、Ryzen59600X以及规格比较。这些产品预计今年7月上市。

AMD给出的内部游戏测试数据显示，Ryzen99950X对游戏性能的提升幅度不一。比如在《无主之地3》中的表现仅比英特尔Corei9-14900K高出4%，在《杀手3》中高出6%，在《赛博朋克2077》中高出13%。此外，Ryzen99950X在《F12023》中的表现较英特尔提升了16%，在《DOTA2》中提升了17%，在《地平线零之曙光》中提升了23%。

50TOPS

AMD最强移动端NPU算力

苏姿丰展示了下一代AIPC芯片——锐龙AI300系列APU（第三代）。

下图为锐龙AI300系列芯片实拍。

锐龙AI300系列芯片旨在提供下一代AIPC体验，因而要求NPU、CPU和GPU均要达到最佳。

锐龙AI300系列首发提供了两款型号，锐龙AI9HX370和锐龙AI9365。下图为锐龙AI9HX370的参数规格。

锐龙AI300系列采用了XDNAAINPU，号称移动端最强NPU，算力达50TOPS，不仅达到了微软对新一代AIPC「NPU算力40TOPS以上」的标准，还超过了高通骁龙XElite的45TOPS、英特尔LunarLake的40-45TOPS。

AMD表示，搭载锐龙AI300系列的笔记本将于今年7月起陆续上市。

最高192核心384线程

第五代EPYC霄龙问鼎数据中心芯片

苏姿丰现场也展示了第五代「Turin」EPYC霄龙芯片，它号称全球最强数据中心CPU。

下图为第五代AMD霄龙Turin芯片的参数规格。目前没有透露太多细节，从基础信息参数来看，Turin具有192个Zen5核心和384个线程，采用与GenoaEpyc9004s相同的SP5插槽适配。

Turin芯片可能会被命名为「Epyc9005s」。可以期待的是，在IPC方面，它与RyzenZen5芯片相近。相较于Zen4核心，IPC改进可能在15%到20%之间。苏姿丰展示了Turin芯片的一些早期基准测试数据。

如下图所示，图上为具有128个核心的Turin芯片在NAMD分子动力学应用程序中运行STMV基准测试的性能。Turin芯片模拟了2000万个原子，并计算了计算引擎在24小时内可以处理多少纳秒的分子相互作用。可以看到，苏妈杀疯了：移动端最强算力达，最强芯片挑战英伟达128核心的Turin芯片是64核心英特尔「EmeraldRapids」XeonSP-8592 工作量的约3.1倍。

图下为基于MetaLlama27B模型的AI吞吐量基准测试，该模型以INT4数据格式处理，推理token生成设置为50毫秒。128核心的Turin芯片是英特尔竞品CPU性能的2.5倍到5.4倍之间，具体数值取决于工作负载。

对标英伟达

AMD的InstinctGPU也一年一更

讲完了CPU，接下来的重头戏就是InstinctGPU了，它将是AMD未来产品战略的一个重要抓手。

苏姿丰表示，「Antares」MI300系列是AMD历史上增长最快的产品，在HPC和AI工作负载方面的可用性看起来有点像英伟达GPU，不过其所提供的性能优势以及HBM内存容量、带宽优势较为突出。

比如在推理工作负载方面，通过对Llama3（具有700亿参数）进行推理检验性能的结果来看，一台配备8个MI300XGPU的服务器性能约为一台配备8个H100GPU加速器的英伟达HGX性能的1.3倍。而在Mistral7B模型上，单个MI300X的性能则是英伟达H100GPU的约1.2倍。

随后，苏姿丰公布了2024-2026年的InstinctGPU路线图，今年推出MI325X，2025年推出MI350，2026年推出MI400。

MI325X将具有更大的算力规模，并转向HBM3E内存。下图为MI325X的基础性能规格，内存增加了2倍，最高可达288GB；带宽增加了30%，达到了6TB/秒。

下图为MI325X的数据传输速度与英伟达H200（141GB内存）比较的结果。值得一提的是，1万亿参数的模型将适配一台配有八个MI325X的系统主板，每个GPU都有288GB的HBM3E内存容量。

据悉，MI325X最快将在今年第四季度推出。不过到那时，英伟达将在该领域中凭借B100占据一席之地，并将大规模量产H200。因此，AMD感受到了危机，并且迅速行动。

这也是为什么AMD提前推出MI350X的原因，它采用了全新CDNA4架构、台积电3纳米工艺、288GB的HBM3E内存以及FP6、FP4数据类型。MI350X也将成为AMDInstinctMI350系列的第一款产品。

在推理性能方面，CDNA4架构是CDNA3的35倍。

MI350的内存容量将是英伟达2025年推出的B200（BlackwellUltra架构）芯片的1.5倍，AI计算能力是后者的1.2倍。

AMD这波就是奔着英伟达去的，到时候有好戏看了。

原文链接：

https://www.nextplatform.com/2024/06/03/amd-previews-turin-epyc-cpus-expands-instinct-gpu-roadmap/

参考链接：

https://www.anandtech.com/show/21415/amd-unveils-ryzen-9000-cpus-for-desktop-zen-5-takes-center-stage-at-computex-2024

免责声明：本网站部分内容由用户自行上传，若侵犯了您的权益，请联系我们处理，谢谢！联系QQ：2760375052

苏妈杀疯了：移动端最强算力达，最强芯片挑战英伟达

心合

好文推荐

热门文章

最近发表

标签列表

苏妈杀疯了：移动端最强算力达，最强芯片挑战英伟达

相关文章

心合

好文推荐

热门文章

最近发表

标签列表