黄仁勋换上了唐装
如果英伟达未来还要接受非市场的干预,很可能中国市场会彻底向他关上大门。
黄仁勋最近为了中国市场,已经拼了。
2025年7月,北京最热的时候,黄仁勋依旧一身皮衣,不远万里来参加“链博会”,并且直言中国AI市场非常大,对美国公司十分重要。
第三届链博会上黄仁勋接受媒体群访
一个多月前,他曾罕见穿着西装飞往北京,跟贸促会领导会见。算上这次参加展会,半年多的时间里,黄仁勋往来中国不下三次,几乎到了一个月来一次的地步,一次比一次态度亲和,甚至跟媒体大打亲情牌。
终于,7月15日,他对记者宣布了一个对英伟达来说天大的好消息。
“美国政府已经批准了我们的出口许可,我们可以开始发货了,所以我们将开始向中国市场销售H20.我非常期待能很快发货H20.对此我感到非常高兴,这真是个非常、非常好的消息。”
所谓H20.是英伟达为突破美国对华芯片出口限制,于2023年年底推出的针对中国市场的芯片,算是中国特供版A800/H800芯片的阉割版——其互联速度砍至H100的1/15.算力芯片频率也做了调整,整体性能只有旗舰级H100芯片的20%左右。
但就是这枚被“阉割”两次的芯片,4月份也突然遭到美国政府的封禁。而解禁的消息出来后,英伟达的市值一夜暴涨超1.16万亿元人民币,坐稳全球市值第一公司的宝座。
在现场明显感受到黄教主松了一口气。
在第二天链博会的开幕式上,他罕见地脱下皮衣,穿上了唐装。
黄仁勋在链博会开幕式
放不下的中国市场
实际上,黄仁勋已经做出选择,不遗余力往返中美,其想法昭然若揭。
黄仁勋对美国媒体说过,他准备通过所有手段,也要保住在中国市场的影响力,背后,是实在放不下的收入蛋糕。
“这里聚集着全球最聪明的AI大脑”,黄仁勋在今年第三次访华时反复强调这个观点。数据显示,中国AI开发者数量已突破700万,占全球总量的51%;2024年中国数据中心加速卡市场规模达487亿美元,其中英伟达虽仍以50%份额居首,但较2022年的95%已大幅下滑。
问题是对于英伟达来说,尽管其在中国的市场份额近年来骤减,但中国仍然是一个巨大市场,在上一财年占其销售额的13%。
“中国客户正在重新定义AI应用场景。”黄仁勋在英伟达内部信中写道,“当美国还在争论要不要卖芯片时,中国企业已经用我们的芯片做出了会跑的AI(指智能汽车)”。
第七届进博会安波福展台
这种市场活力让英伟达难以割舍——尽管美国本土业务增长迅猛,但中国区营收想象空间巨大,仍是支撑其股价的重要支柱。
也因此,黄仁勋曾直言“无论有没有美国芯片,中国的人工智能都会继续发展”,若阻止美国公司在中国竞争,最终可能导致美国失去在全球人工智能领域的领先地位。
这一番话,不仅是对中国人工智能发展潜力的认可,也道出了英伟达不愿放弃中国市场的深层原因。
来自美国的压力山大
某种程度上,黄仁勋的最大竞争对手,不是同行,而是美国政府。
今年4月H20的猝死成为英伟达对华政策的转折点。
这款曾占英伟达中国区营收85%的芯片,在2024年创造120亿—150亿美元收入后,因美国商务部一纸禁令被迫停售,直接导致英伟达计提55亿美元库存损失,放弃150亿美元潜在订单。
这已经不是美国政府第一次让英伟达吃亏。
早在2023年,初代A800通过降低内存带宽规避禁令,却在同年10月被列入管制清单。
“每代产品都像俄罗斯套娃,打开一层还有一层限制。”某半导体分析师无奈表示。
英伟达参展芯片
这种绞杀的技术细节令人唏嘘。H20采用的台积电CoWoS封装技术被严格限制后,英伟达不得不改用传统封装工艺;即将量产的B40更彻底放弃HBM高带宽内存,转而使用GDDR7显存,算力缩水至国际版Blackwell的15%—20%。
“就像给超级跑车换了拖拉机轮胎。”行业工程师如此比喻。美国商务部的红线划得越来越细——最新规则将带宽限制在1.7—1.8TB/s,恰好卡在B40的设计阈值上。
政策反复给企业带来巨大混乱。某自动驾驶公司CTO对小巴吐槽:“4月刚采购2000片H20.禁令一来全部搁置,现在解禁又要重新测试兼容性,光人力成本就浪费了800万。”
这种不确定性迫使英伟达启动“双轨制”——在美国保留最先进技术,在中国市场则建立独立的“阉割芯片”研发线。
黄仁勋在内部会议上警告:“我们正在失去技术代差优势,华为的追赶速度超出想象。”
国产替代的追赶者
“华为Cloud Matrix 384的性能已经超过我们了。”黄仁勋在Computex 2025上的罕见表态震惊业界。
这款国产芯片,实现了300 PFLOPS算力,接近英伟达GB200 NVL72系统的两倍。更致命的是其创新的分级通信机制,较传统架构降低30%带宽消耗,恰好击中H20的软肋。
国产芯片的崛起正在重塑市场格局。
2024年华为昇腾以24.8%的国内份额实现技术突围,在智算中心建设中斩获超60%订单;天数智芯天垓100则以高性价比渗透金融、电力行业。IDC数据显示,2025年上半年国产算力占比已达42%,较去年提升7.4个百分点。
新一代昇腾AI云服务发布
图源:中国日报网
生态建设同样取得突破。
“以前跑模型只能用英伟达,现在实验室里部分国产芯片的使用率已经超过30%,”清华大学AI实验室教授透露,“学生们开始主动学习(国产),这在两年前不可想象。”
中信建投证券指出,近期上市公司密集披露的2024年年报及2025年一季报显示,AI算力产业链相关公司业绩表现亮眼,印证行业持续高景气。
随着全球AI大模型训练及推理需求激增,算力基础设施投资加速,服务器、光模块、数据中心等细分领域企业订单饱满,带动盈利能力显著提升。
长江计算人工智能服务器产线
更何况,如果说2024年是百亿参数模型的天下,2025年这个数字已经被推到万亿的标准。刚刚开源的Kimi K2就是一个万亿参数模型,华为盘古5.5也有7000多亿的参数指标。
这些大模型开始跑在中国底层算力之上,越来越多的模型跑通,让中国国产算力芯片的水平得到认可,进而产生合力。
这是黄仁勋并不想看到的。如果英伟达再不回来,很可能中国的算力市场会对其关上大门。
黄仁勋的苦只有自己知道。
不想拿出的B方案
实际上,在4月份H20被禁后,黄仁勋已经在悄悄准备B方案。
根据《联合早报》和路透社的相关新闻显示,英伟达预计将为中国市场推出一款基于Blackwell架构的人工智能(AI)芯片,其售价将显著低于先前的H20型号,预计最快将于最近几个月启动大规模生产。
GB200 Grace Blackwell超级芯片
据说这款采用最新Blackwell架构的AI处理器,预计售价将在6500至8000美元之间,这一价格明显低于H20型号每块1万至12000美元的定价。
价格腰斩的背后,是英伟达在美国出口管制红线上的极限操作。
投资银行杰富瑞(Jefferies)的研报显示,新规则将带宽限制在每秒1.7至1.8太字节(TB),而H20型号的带宽高达每秒4TB。
换句话说,如果H20还有互联网大厂能拿来做百亿参数级别的模型训练,这款新的芯片除了中小企业的模型推理服务,其他的技术规划都有些勉为其难。
这种设计被业内称为“螺蛳壳里做道场”,意味着黄仁勋和英伟达,不得不在美方划定的技术牢笼中,通过剥离关键模块实现合规销售。
也因此,黄仁勋在Computex 2025上承认:“为了迎合美国商务部的规定,向中国出口芯片中Hopper架构已无法进一步修改。”
Computex 2025英伟达展台
但其实这颗芯片的能力,跟消费级显卡比没有太大的优势。有行业内的工程师预计,根据现在披露的数据,可能仅比4090的显卡高出不到20%的算力增幅。
这意味着对中小算力需求的企业来说,可能这颗芯片还有长期的用途,但对互联网大厂来说,就变成了一个食之无味弃之可惜的鸡肋。
所以,黄仁勋一直没放弃对于H20的解禁。据相关美国媒体报道,最近多次拍到其与白宫官员密会的场景。
现在看,很可能为了H20.黄仁勋付出了很多本不该付出的代价。
螺蛳壳里看未来
现在重新解禁的H20如果做千亿参数深度的模型训练,可能力有不逮;但是放到推理应用领域,他对于整体承接英伟达CUDA平台训练的模型来说,属于一脉相承,后续使用的效果很好,投入会更低。
再加上这颗芯片成本确实低,一个4块卡的推理服务器,可以完全把成本压到60万以内,还能保证不错的推理效果,这让英伟达的H20.对于只需要推理的中小企业来说,有着不小的吸引力。
资深半导体分析师张悦铭对此表示:“英伟达在用价格换时间——只要在国产芯片完全成熟前锁住客户,就有翻盘机会。”
当然,解禁之后的悬念仍存,尤其是国产芯片的替代会不会受影响?研发的阻力会不会进一步增大?
这可能才是英伟达想通过这颗芯片带给中国市场的答案。
在宣布这个消息的现场,黄仁勋的兴奋溢于言表。这个很好理解,英伟达的“特供芯片”策略,本质是全球化技术生态遭遇地缘政治时的妥协方案。
当黄仁勋在台北电脑展上感叹“全球市场割裂”时,中国客户也在权衡:短期低价获取尚可用的算力,延续CUDA开发惯性;但也具备长期风险,那就是美国政策反复可能使特供芯片再次“猝死”,H20的突然禁售已是前车之鉴。
黄仁勋在台北国际电脑展发表主题演讲
其实在这场博弈中,技术、政策、商业的三角关系从未如此紧绷。问题是,古话说的叫事不过三,如果英伟达未来还要接受非市场的干预,很可能中国市场会彻底向他关上大门。
到那个时候,黄仁勋的一切努力都会变成水中月、镜中花。