令人震荡的是,基于内核数量、事情频率、TDP等参数估算,比较Gaudi 3国际版,中国“特供版”HL-328芯片性能或降落约92%。
中国特供版有何不同
详细硬件规格方面,中国特供版的Gaudi 3与原版比较,具有相同的96MB SRAM片上存储,128GB HBM2e高带宽存储,带宽为3.7TB/s,拥有PCIe 5.0 x16介面和解码标准。但是,由于美国对付AI芯片的出口牵制规则限定,使得这类高性能AI的综合运算性能(TPP)须要低于4800才能出口到中国, 这意味中国特供版的Gaudi 3的16bit性能不能超过150 TFLOPS。

根据英特尔公布的资料显示,Gaudi 3在FP16/BF16上可以达到1835 TFLOPS,比较英伟达H100在大模型演习方面快40%、推理能效高50%。
显然,中国特供版的Gaudi 3须要大幅降落AI性能,才能合规出口。因此,中国特供版Gaudi 3须要大幅减少内核数量(原版拥有8个矩阵数学引擎和64 个张量内核)和事情频率。
去年7月,英特尔就发布了面向中国市场的Gaudi 2。比较国际版Gaudi 2,面向中国市场推出的加速卡在性能上差别不大,而集成以太网RDMA端口数量从24个端口减到21个,以符合美国芯片出口牵制规定。
美国如何挟制算力
20世纪90年代,美国占环球芯片产量的三分之一以上,这一份额到2020年已降至12%旁边。为了掩护半导体领域的领先地位,自2022年8月美国发布《芯片和科学法案》(CHIPS and Science Act,下称“《芯片法案》”)以来,美国对中国履行了全面的半导体出口牵制,从芯片本身到芯片制造设备,限定方法不断升级。
《芯片法案》是拜登政府复兴家当政策的核心,其利用美国政府资金规复对国家安全和经济增长至关主要的技能部件的海内生产。该法案禁止得到补贴的美国及其盟友伙伴的企业十年内在中国和其他关怀的国家新建或扩大前辈制程芯片厂。
2022年10月、2023年10月,美国商务部工业和安全局(BIS)连续两次发布对中国的前辈半导体和打算设备的出口牵制,企图让中国前辈制造受影响,并且英伟达、AMD、英特尔的多款GPU和 AI 芯片产品已不能再出口到中国,就连高端游戏显卡RTX 4090都受到了限定。
2023年12月,美国商务部BIS宣告启动对成熟制程节点的半导体供应链展开调查,更是明晃晃地针对中国芯片半导体家当。
北京韶光今年3月30日凌晨,美国商务部下属的工业与安全局(BIS)发布“履行额外出口牵制”的新规方法,修订了BIS于2022、2023年10月制订的两次出口限定新规,全面限定英伟达、AMD以及更多更前辈 AI 芯片和半导体设备向中国发卖。
这次新规中,制裁大棒再次摆荡。BIS删除和修订了部分关于美国、中国澳门等地对华发卖半导体产品的限定方法,包括中国澳门和D:5国家组将采纳“推定谢绝政策”,并且美国对中国出口的 AI 半导体产品将采纳“逐案审查”(case-by-case review)政策规则,包括技能级别、客户身份、合规操持等信息全面查验。
英特尔勇气何来
虽然还未上市,但英特尔的特供版Gaudi 3极有可能带来一些潜在的问题。例如,性能降落可能会影响中国企业用户体验和运用效果;同时,如果特供版芯片在价格上没有上风,那么其市场竞争力可能会受到一定影响。因此,英特尔须要在产品设计和定价等方面做出合理的权衡。
两个月前,英伟达对华“特供版”AI芯片H20的终端产品已可接管预订。产品形态包括打算卡和搭载8张H20打算卡的做事器。从性能上来看,英伟达H20性能约为H100的六分之一,但价格并未显著降落,因此性价比并不高。
今年年初,据知情人士透露,自去年11月以来,阿里巴巴、腾讯等中国大型企业一贯在测试英伟达的特供芯片样本。他们已向英伟达表明,今年向英伟达订购的芯片数量将远远少于此前原操持购买的、已经被禁的英伟达高性能芯片。
即便面临营收下滑风险,但是英特尔依旧在“一个钱打二十四个结”下过得不错。在美国政府《芯片法案》推出近2年后,老牌芯片巨子英特尔3月份宣告得到高达85亿美元确当局补贴以及多达110亿美元的分外贷款支持。据理解,英特尔所得到的补贴支持来自于2022年拜登政府所出台的《芯片法案》,该法案力争帮助芯片公司在美国建造更多的芯片工厂,将美国打造为芯片制造强国,英特尔目前可谓是“芯片制造业回流美国”这一背景下的最大受益者。
从AI市场看,目前英伟达在芯片市场霸占着绝对上风,英特尔希望用产品撬走份额并不随意马虎。富国银行统计显示,目前英伟达在数据中央AI市场拥有98%的市场份额,而AMD公司的市场份额仅有1.2%,英特尔则只有不到1%。因此对付英特尔来说,紧跟美国政府反而是明哲保身之举。
算力紧俏,国产替代进行时
算力是大数据时期的生产力,伴随数字经济的高速发展,特殊是AI的爆发,全体社会对算力的需求呈现快速增长态势。据IDC和浪潮信息联合推出的《2023-2024年中国人工智能打算力发展评估报告》显示,2022-2027年期间,估量中国智能算力规模年复合增长率达33.9%,到2027年智能算力规模达1117.4 EFLOPS。
与此同时,中国信息通信研究院南方分院的事情职员在CITE 2024上表示,目前我国智能算力环球占比超30%,紧张依赖美国英伟达GPU芯片,国产自主算力份额仅为5%,海内TensorfiowPyTorch、Caffe等美国AI框架利用率超过90%。
从运用上来看,目前海内如昇腾、寒武纪、天数智芯等主流芯片厂商已完成对主流大模型的适配。业内剖析认为,虽然相较于英伟达、AMD的前辈芯片还有很大差距,但昇腾910系列等国产GPU 芯片目前基本可以支撑海内的大模型运用,科大讯飞董事长刘庆峰在去年1024 开拓者节上曾表示,华为的GPU能力已能对标英伟达A100,并基于昇腾生态推出了“飞星一号”大模型算力平台。而在此前,寒武纪思元(MLU)系列云端智能加速卡与智象未来自研的“智象多模态大模型”也已完成适配,其声称在产品性能和图像质量方面均达到了国际主流产品的水平。
中国大规模替代入口AI芯片的进程正在加速。对付英特尔们来说,关键在于如何在知足美国政策哀求的同时,兼顾中国市场需求,保持产品的竞争力和大客户体验。另一方面,这也为中国本土的AI芯片厂商供应了发展的宝贵机遇,这些厂商须要密切关注市场动态和技能发展趋势,以应对潜在的竞争压力。