苏妈联手OpenAI,AMD发布3nm怪兽MI355X,性能碾压英伟达B200
AMD在Advancing AI大会发布了3nm工艺的MI355X以1850亿晶体管、288GB HBM3e显存实现最高2.2倍于英伟达B200的推理性能;明年推出的MI400系列更将搭载423GB HBM4显存。
就在昨天,AMD Advancing AI大会上,AMD董事长兼首席执行官苏资丰一口气推出了其史上最强的AI新品组合!

这些新产品有:
AMD Instinct MI350系列AI芯片
AMD Instinct MI400系列AI芯片(明年推出)
全新AI软件栈ROCm 7.0
「Helios」AI机架级基础设施(明年推出)
全新AMD开发者云

其中Instinct MI350系列,包括MI350X和旗舰MI355X,基于台积电3纳米工艺节点的全新CDNA 4架构,集成高达1850亿个晶体管。
这两款芯片的主要区别在于散热方式不同,前者使用风冷,后者使用更先进的液冷。
新芯片支持最新的FP6和FP4人工智能数据类型,并配备了超大容量的HBM3e内存。

在FP6推理精度上,AMD Instinct MI355X相比B200有2.2倍的速度提升。

现场,苏妈还补充了MI400系列的细节。
MI400将采用HBM4显存,每颗GPU提供423GB容量,并通过Pensando网卡支持300GB/s的连接,将于明年推出。
性能相比Instinct MI355X又是巨大的飞跃。

基于MI400系列芯片的AMD首个AI机架「Helios」,也将在明年推出。
Helios支持将多达72个MI400集成,支持高达260T/s的扩展带宽,FP4峰值算力达到了2.9EFLOPS。
「这是世界上最好的AI机架解决方案」,苏妈表示。

奥特曼压轴登场,AMD开启与OpenAI合作
现场的一个亮点是OpenAI CEO奥特曼作为嘉宾压轴出场,他表示OpenAI将使用AMD的AI芯片。
苏妈表示对与OpenAI的合作感到兴奋。

「当你最初向我介绍规格时,我简直不敢相信,那听起来太疯狂了,」奥特曼说「不过这东西绝对会很厉害」。

AMD的机架式设计会让芯片看来就像一个整体系统,这对大多数客户,比如云服务商和大语言模型公司来说非常重要。
这些客户想要的就是「超大规模」的人工智能计算集群,能覆盖整个数据中心,当然耗电量也会超级大。
「可以把Helios想象成一个机架,但它运作起来就像一台超强的单体计算引擎,」苏妈说。

AMD的新机架技术令苏妈有底气与黄仁勋掰掰手腕。英伟达是AMD的主要也是唯一的对手。
据透露,英伟达的大客户OpenAI一直在给AMD的MI400系列芯片提建议。
这种芯片功耗更低,运行成本更便宜,而且AMD采用激进的定价策略来挑战英伟达。
苏妈表示,尽管英伟达有独家的CUDA软件,但即使MI355X芯片性能就可以超过英伟达的Blackwell芯片。
「这说明我们的硬件很强,也表明开源软件框架取得了巨大进步,」苏妈说。
AMD的AI路线图更加清晰
Instinct MI350系列
AMD Instinct MI350系列是AMD迄今为止最先进的生成式AI平台,标志着数据中心AI计算的重大突破。
这款芯片采用3nm制程工艺,集成了1850亿颗晶体管,基于AMD CDNA 4架构,配备288GB HBM3e内存,内存带宽高达8TB/s。
单颗MI350 GPU即可运行参数量高达5200亿的大型模型,展现了其在AI训练和推理中的强大能力。

MI350系列在FP4/FP6精度下的峰值算力达到20PFLOPS,是上一代MI300X的4倍,其推理性能更是提升了35倍。
在运行DeepSeek R1模型时,MI350系列的推理吞吐量超越了英伟达B200,展现出强劲的竞争力。
MI350系列包括MI350X和MI355X两款产品,均采用相同的计算架构和内存配置。

相比MI300系列,MI355X在低精度数据类型处理上进行了大幅优化,以满足现代AI应用的需求。
MI350系列采用UBB8版型设计,每个节点配备8块GPU,通过153.6GB/s的Infinity Fabric双向链路实现高效通信。
在8卡配置下,MI355X系统提供2.3TB HBM3e内存和64TB/s内存带宽,FP4/FP6精度下峰值算力高达161PFLOPS。

在机架级部署中,MI350系列展现出强大的扩展能力。
风冷机架最多支持64块GPU,提供18TB HBM3e内存;直接液冷机架可容纳128块GPU,内存容量达36TB,FP4性能高达2.6E FLOPS。
这种超大规模的系统配置,使MI350系列能够轻松应对复杂AI工作负载,为企业级AI应用提供坚实支持。

AMD Instinct MI400系列(明年推出)
苏妈还公布了其下一代AI芯片Instinct MI400系列的细节。
这款预计于2026年推出的芯片专为大规模AI训练和分布式推理设计,性能较前代MI355X提升高达10倍。

MI400系列在算力上实现了巨大突破。
在FP4精度下,其峰值算力高达40PFLOPS(每秒40千万亿次浮点运算),FP8精度下也能达到20PFLOPS的出色表现。
MI400系列搭载了432GB的HBM4内存,内存带宽达到惊人的19.6TB/s。
这种超高带宽的内存设计显著提升了数据处理效率,为复杂AI任务提供了强大的支持。
此外,每块GPU支持300GB/s的横向扩展带宽,通过Pensando NIC和超以太网技术实现跨机架和集群的高效互连,确保分布式计算环境下的无缝协作。

相比上一代MI355X,MI400系列通过引入HBM4内存、优化计算单元和增强互联技术,实现了性能10倍的飞跃。
此外,MI400系列在能效和扩展性上的优化,使其在应对多样化AI工作负载时更具灵活性。
无论是训练超大规模语言模型,还是进行分布式推理,MI400都能提供高效、稳定的计算支持。

在MI400系列的发布会上,OpenAI首席执行官Sam Altman亲自登台,对MI450型号给予高度评价。
他表示,OpenAI与AMD工程团队密切合作,深入探讨市场需求,助力MI400系列的开发。
全新AI软件栈ROCm 7.0 重磅来袭
预计2025年第三季度,ROCm 7将全面上线,支持MI350系列GPU。

亮点如下:
性能暴涨:相比ROCm 6,ROCm 7推理性能提升超3.5倍,训练性能提升3倍!这得益于对FP4、FP6等低精度数据类型的支持、通信栈优化以及更高的GPU利用率和数据移动效率。在Llama 3.1 70B、Qwen2-72B、DeepSeek R1等模型上,ROCm 7推理和训练性能比前代提升3.2~3.8倍。

分布式推理更强:ROCm 7引入强大的分布式推理方法,与SGLang、vLLM、llm-d等开源框架深度合作,开发共享接口和原语,实现在AMD平台上的高效分布式推理。相比之下,英伟达的TensorRT-LLM不支持DeepSeek R1的FP8精度,而AMD合作的开源框架完美支持,MI355X的推理吞吐量比英伟达B200高出30%。
企业级AI解决方案:ROCm企业级AI软件栈首次亮相,打造全栈MLOps平台,专为企业AI操作设计,提供安全、可扩展的交钥匙工具,支持模型微调、合规性、部署和集成。
端侧AI开发新体验:ROCm扩展到Ryzen笔记本电脑和工作站,支持AI辅助编码、自动化定制、推理和模型微调。
AMD通过开源战略和ROCm的持续创新,不仅在AI性能上大步向前,还为开发者、企业和用户带来了更开放、更高效的AI生态!
「Helios」AI机架级基础设施(明年推出)
明年,AMD将推出下一代AI机架解决方案——Helios,集成更强悍的EPYC 「Venice」 CPU、MI400系列GPU和Pensando 「Vulcano」 NIC。

这套架构支持超以太网(Ultra Ethernet)实现横向扩展,结合UALink(Ultra Accelerator Link)实现纵向扩展,还配备Fabric Manager作为ROCm生命周期管理的一部分,助力基础设施自动化,省心又高效。
2026年,下一代Pensando 「Vulcano」 AI NIC将作为MI400系列的标配推出。
Vulcano采用3nm制程,提供800G网络吞吐量,每GPU横向扩展带宽是上一代的8倍,支持UAL和PCIe Gen6,带宽翻倍,可扩展至100万块GPU,且软件完全向前向后兼容。

全新AMD开发者云
AMD首次推出了开发者云,助力开发者轻松上手AI开发!
无需自购硬件或繁琐配置,只需一个Github账号或邮箱,就能即刻访问ROCm和AMD GPU。
这个全托管平台提供对MI300X GPU的即时访问,省去硬件投资和本地设置的麻烦。Docker容器已预装热门AI软件,节省安装时间,同时保留代码定制的灵活性。
计算选项灵活可扩展:
小型:1个MI300X GPU(192GB GPU内存)
大型:8个MI300X GPU(1536GB GPU内存)
首批注册的开发者可获25小时免费使用时长,通过ROCm Star开发者证书等计划,还能额外获得最多50小时的免费时间。

参考资料:
https://www.reuters.com/business/amd-ceo-unveils-new-ai-chips-2025-06-12/
https://fortune.com/2025/06/12/amd-new-chips-top-nvidia-ceo/
https://www.forbes.com/sites/karlfreund/2025/06/12/amd-announces-mi350-gpu-and-future-roadmap-details/?ss=ai
本文来自微信公众号“新智元”,作者:新智元,36氪经授权发布。
-
-
苏妈联手OpenAI,AMD发布3nm怪兽MI355X,性能碾压英伟达B200
AMD在Advancing AI大会发布了3nm工艺的MI355X以1850亿晶体管、288GB HBM3e显存实现最高2.2倍于英伟达B200的推理性能;明年推出的MI400系列更将搭载423GB HBM4显存。就在昨天,AMD Advancing AI大会上,AMD董事长兼首席执行官苏资丰一口气2025-06-13 17:56:00
查看详情
-
-
6月5日,任天堂在全球同步发售最新一代主机Switch 2,国际多语言版官方售价为69980日元(约合人民币3399元),另外还将推出一款包含热门游戏《马里奥赛车》的捆绑版,港版定价约合人民币3489元。京东最新数据显示,目前Switch 2累计预约量已突破40万,成为近期消费者最为关注的新一代游戏
2025-06-05 10:07:00
查看详情
-
-
健康中国看山西:北大六院司天梅教授专家团队助力大同六院公立医院高质量发展工作有序推进
为了进一步加强医院专科建设和促进大同市第六人民医院公立医院示范项目高质量发展工作有序推进,2025年5月30日,北大六院司天梅医疗专家团队应邀莅临大同市第六人民医院开展学术讲座及业务指导。学术讲座上,司天梅教授分享了《癫痫患者精神药物使用的思考》专题讲座,从癫痫及精神病性障碍共病、癫痫和抑郁/焦虑/2025-06-04 20:07:00
查看详情
-
-
英伟达Q1营收同比增长69%,通信ETF(159695)涨超1.5%,万马科技涨超16%
5月29日,光模块CPO概念表现活跃,截至发稿,国证通信指数涨1.61%,成分股中,万马科技涨超16%,中海达、新易盛、万集科技、天孚通信等跟涨。相关ETF中,通信ETF(159695)截至发稿涨1.58%,换手率3.86%。通信ETF(159695)跟踪国证通信指数,该指数反映了中国证券市场上通信2025-05-29 10:49:00
查看详情
-
-
一起聊点经济学:什么是数据资源?我们乘“数”而上的底气何在?
来源:【人民日报中央厨房-麻辣财经工作室】新闻报道中,谈到我国数字经济优势时,“数据资源丰富”常被提及。什么是数据资源,它又能怎样推动经济社会发展?今天我们一起聊聊。根据国家数据局发布的解释,数据资源,是指具有价值创造潜力的数据的总称,通常指以电子化形式记录和保存、可机器读取、可供社会化再利用的数据2025-05-19 18:16:00
查看详情
- 1 外交部回应中方破获菲律宾间谍案
- 2 我为群众办实事丨“促消费 惠民生”网民留言征集
- 3 新加坡媒体:“娃娃脸”不利于升职?
- 4 永顺县 “土特产”成金字招牌
- 5 受天气影响,崂山风景区、二龙山景区暂停开放
- 6 2名基层干部被不当问责,上级纪委督促纠正:不能让一般干部替领导受过!
- 7 湖北公开征集涉黑涉恶举报线索
- 8 莫兰特伤退,雷霆29分逆转灰熊拿到赛点
- 9 雷神能源上涨4.63%,报5.87美元/股,总市值9993.67万美元
- 10 新民快评丨“爱心专座”本就是强烈标示
- 11 提升爱鸟意识 践行生态文明
- 12 “一街、一线、一城”,青岛汇聚浪漫元素,延长甜蜜经济产业链
- 13 食品安全责任再压实,“双总监”能否成为“双保险”
- 14 果然财经|换帅!余承东不再担任华为车BU董事长
- 15 保罗:下个月就40岁了 我热爱篮球但也想陪伴家人
- 1 人民日报看湖南|一场展会里的开放共赢
- 2 清华陕氢申请固体氧化物燃料电池电堆在线漏气故障诊断方法专利,提高计算效率
- 3 经常缺觉的人全身处于炎症状态 一个方法帮你缓解
- 4 茅台集团及子公司发展战略务虚会召开
- 5 2025中非电影周在长沙举行
- 6 楼市重磅!这个一线城市拟全面取消限购、限售、限价
- 7 苏妈联手OpenAI,AMD发布3nm怪兽MI355X,性能碾压英伟达B200
- 8 “这是一条会呼吸的岸线”,城市观察团探访百里长江生态廊道青山段
- 9 河北景县多部门织密监管网 全链条严打“假肉”患
- 10 庄浪:城镇建设让幸福感在“家门口”升温
- 11 伊朗放话:已越过所有红线,对以色列采取“无限制”报复!迹象表明,以色列的袭击未能突破伊朗核设施的保护层
- 12 存起火风险,北京奔驰召回部分国产EQC汽车
- 13 比“苏超”更草根!苏北县城“男子汉杯”足球赛已连办35届
- 14 朱一龙,官宣喜讯!
- 15 “光明守护-2025”电力应急救援综合演练在广东清远举行