来源:财通社
据路透社报道,美国芯片厂商AMD、英伟达相继收到美国总部通知,对中国区客户断供高端GPU芯片。
英伟达(Nvidia Corp., NVDA)股价周三在盘后交易中下跌,该公司在提交给美国证券交易委员会(SEC)的一份公告中透露,美国对该公司向中国和俄罗斯销售的A100和即将推出的H100集成电路实施了新的许可证要求,这是英伟达在服务器上性能最高的产品。公告特别指出,英伟达对当前财季的预测包括对中国的数据中心销售额预计为4亿美元,这可能会受到此举的影响;英伟达目前没有向俄罗斯销售产品。
英伟达发言人在一份电邮声明中表示,该公司正在与中国客户合作,提供替代产品以满足他们计划中的购买或未来的购买,如果替代产品不够用,可能会寻求许可;新许可要求目前唯一适用的产品是A100、H100和包括它们的DGX等系统。
英伟达股价收盘下跌2.4%,至150.94美元,在盘后交易中跌幅超过4%。今年以来,由于核心的游戏芯片业务面临挑战,该股已累计下跌48.7%,同期标普500指数累计下跌16.4%。
SEC公告称,新的许可证要求可能会影响该公司及时完成H100的开发或支持A100现有客户的能力,并可能要求该公司将某些业务转移到中国以外,该公司正在与美国政府合作并正在为公司的内部发展和支持活动寻求豁免。
英伟达表示,联邦政府的新许可证要求是为了解决涉及的产品可能被用于或转移到中国和俄罗斯的军事最终用途或军方最终用户的风险。多年来,美国一直在采取措施阻止中国军方获得高性能半导体技术,包括阻止中国母公司拟议的收购和限制销售。
其他美国服务器芯片制造商的股价也在周三的盘后交易中下跌,不过英伟达似乎是受这一决定影响最大的公司。Advanced Micro Devices Inc. (AMD)股价下跌约2%,英特尔(Intel Corp., INTC)股价下跌约0.3%。
GPU断供型号梳理
总结来看,本次美国宣布对中国断供GPU的几个关键信息:1)应用领域:数据中心高端GPU;2)涉及厂商:AMD、NVIDIA两大龙头;3)产品型号:AMD旗下MI100和MI200系列、NVIDIA旗下A100和H100系列;4)断供节奏:暂停发货并统计已发货清单,预计2-3天后会发布对客户与合作伙伴的沟通口径。
具体断供产品介绍如下:
1)AMD MI100(全称AMD Instinct MI100加速器)
产品简介:AMD MI100发布于2020年11月16日,主要应用领域包括人工智能、离子物理研究、星系模拟等。
架构设计:采用AMD CDNA的GPU设计架构,拥有120 个计算单元(7,680个核心),核心频率1502 MHz。
工艺制程:采用台积电7nm FinFET技术。
计算性能:峰值双精度(FP64)性能11.5 TFLOPS、峰值单精度(FP32)性能23.1 TFLOPs、峰值半精度(FP16)性能184.6 TFLOPs、bfloat16峰值性能92.3 TFLOPs、矩阵峰值性能46.1 TFLOPs FP32。
GPU内存:显存32 GB、显存时钟频率1.2GHz、显存带宽1228.8GB/s。
功耗(TDP):300W
2)AMD MI200(全称AMD Instinct MI200系列加速器)
产品简介:AMD Instinct MI200系列加速器是 AMD 最新推出的数据中心GPU,应用于百亿亿级超级计算系统在内的主流服务器和超级计算机加速,帮助科学家应对从气候变化到疫苗研究等带来的计算需求。MI200系列包括三个细分型号:MI210(发布于2022年3月22日)、MI250(发布于2021年8月11日)、MI250X(发布于2021年8月11日)。以下参数介绍以MI250X为例。
架构设计:采用AMD CDNA2的GPU设计架构,拥有220个计算单元(14,080个核心),核心频率1700 MHz。
工艺制程:采用台积电6nm FinFET技术。
计算性能:峰值双精度(FP64)性能47.9 TFLOPS、峰值单精度(FP32)性能47.9 TFLOPs、峰值半精度(FP16)性能383 TFLOPs、INT8 计算性383 TOPs、矩阵峰值性能95.7 TFLOPs FP64。
GPU内存:显存128 GB、显存时钟频率1.6GHz、显存带宽3276.8 GB/s。
功耗(TDP):560W
3)NVIDIA A100(全称NVIDIA A100 Tensor Core GPU)
产品简介:NVIDIA A100 Tensor Core GPU发布于2020年11月16日,可针对AI、数据分析和HPC应用场景,助力更高性能的弹性数据中心。A100可划分为七个 GPU 实例,以根据变化的需求进行动态调整,提供 40GB 和 80GB 显存两种版本。以下参数介绍以80GB版本为例。
架构设计:采用NVIDIA Ampere架构,拥有6912 个 CUDA 内核,核心频率1410 MHz。
工艺制程:采用台积电7nm工艺。
计算性能:峰值双精度(FP64)性能9.7 TFLOPS、峰值单精度(FP32)性能19.5TFLOPs、峰值半精度(FP16)性能624 TFLOPs、INT8 计算性1248 TOPs、bfloat16峰值性能624 TFLOPs。
GPU内存:显存80 GB、显存带宽2093 GB/s。
功耗(TDP):400W
4)NVIDIA H100(全称NVIDIA H100 Tensor Core GPU)
产品简介:NVIDIA H100 Tensor Core GPU发布于2022年3月22日,在数据中心级部署H100GPU可提供出色的性能,并使所有研究人员均能轻松使用新一代百亿亿次级(Exascale)高性能计算(HPC)和万亿参数的AI。H100提供H100 SXM和H100 PCIe两个版本,以下参数介绍以H100 SXM为例。
架构设计:采用NVIDIA Hopper架构,拥有18432个 CUDA 内核,核心频率1.8GHz。
工艺制程:定制版的台积电4nm工艺(4N)。
计算性能:峰值双精度(FP64)性能30 TFLOPS、峰值单精度(FP32)性能60 TFLOPs、峰值半精度(FP16)性能2000 TFLOPs、INT8 计算性4000 TOPs、bfloat16峰值性能2000 TFLOPs。
GPU内存:显存80 GB、显存带宽3TB/s。
功耗(TDP):700W
机构观点:高性能芯片国产替代正当时
海通科技郑宏达表示,传闻美国或对中国断供高端GPU,AMD和英伟达已接到通知。目的是阻止中国HPC的发展。HPC包括GPU和CPU,国内GPU领域有一些知名创业公司发展迅速,二级标的可关注寒武纪和景嘉微。CPU建议关注海光信息。
天风电子潘暕团队表示,新闻涉及的AMD的MI100和MI200,NVDA的A100和H100是高端型号,针对企业客户,数据中心应用,同性能目前国产没有替代的。从限制14nm以下的半导体设备,到限制3nm以下EDA,再到美国芯片法案签署,新的国际环境下,高性能芯片自主可控愈发迫切,相关高性能芯片产业链国产上市公司值得关注:
CPU:海光信息、龙芯中科
GPU/加速卡:景嘉微、寒武纪
FPGA:复旦微电、紫光国微、安路科技
服务器存储:澜起科技、聚辰股份
EDA/IP:华大九天、芯原股份、概伦电子、广立微