量子位 | "大众年夜众号 QbitAI
英特尔,开始正面硬刚英伟达了。

就在深夜,英特尔CEO帕特·基辛格手舞足蹈地亮出了最新AI芯片——Gaudi 3:
他为什么愉快到现场直接蹦迪?
看下Gaudi 3的性能结果,就一览无余了:
演习大模型:比英伟达H100快40%推理大模型:比英伟达H100快50%不仅如此,虽然基辛格没有在现场给出直接的数据,但他还表示:
Gaudi 3的性能将与英伟达H200相称,在某些领域的性能乃至会更好。
如此直面对标英伟达,到底效果如何,我们连续往下看。
硬刚英伟达的Gaudi 3英特尔表示,Gaudi 3已经在Llama上做了测试,可以有效地演习或支配AI大模型,包括文生图的Stable Diffusion和语音识别的Whisper等等。
在现场,基辛格也展示了集成最新英特尔芯片的AI PC,能够快速处理的多项任务,例如快速处理邮件:
再如语音处理:
以及图像渲染:
英特尔演示操作的同事还非常调皮地展示了用AI PC天生的卡通版基辛格:
据理解,Gaudi 3采取5纳米工艺制造,与历代Gaudi其它性能上的详细比拟,如下表所示:
英特尔表示,Gaudi 3芯片将在今年的第三季度向客户大规模供应,包括戴尔、惠普和超微电脑在内的公司将利用该芯片。
至于详细的价格,目前英特尔方面还并未透露。
不过更令人意外的是,Gaudi 3还只是在这次英特尔Vision活动中发布的产品之一。
Xeon,步入第六代没错,去年年底英特尔刚刚上市第五代Xeon,仅时隔数个月,第六代Xeon又来了!
(英特尔这次还真没有挤牙膏)
在现场,基辛格还亲切地叫它“little baby”:
第六代Xeon包含两种架构,分别是Sierra Forest和Granite Rapids。
Sierra Forest基于英特尔更小、低功耗的E-cores,而Granite Rapids则由更大但性能更高的P-cores 组成。
基辛格在现场称二者像双胞胎:
更详细而言,Sierra Forest架构的英特尔Xeon 6处理器,其机架密度提高2.7倍。
客户能以近3:1的比例更换旧系统,大幅降落能耗,帮助实在现可持续发展目标。
而Sierra Forest架构的英特尔Xeon 6处理器包含了对MXFP4数据格式的软件支持。
与利用FP16的第四代Xeon处理器比较,可将下一个token的延迟韶光最多缩短6.5倍,能够运行700亿参数的Llama-2模型。
至于英特尔Xeon 6处理大模型的速率到底有多快,基辛格做了更加直接的比拟。
他将第四代、第五代和最新的第六代Xeon放到了一起,来了一个现场速率的大比拼。
从直不雅观的天生速率来看,第六代Xeon明显要比“前任们”快上许多。
详细到精确的延时数值,第六代Xeon运行Llama 2 70B只有82ms。
同等条件下,第六代Xeon与“前任们”的延时数值比拟如下:
据理解,Sierra Forest架构的第六代Xeon处理器将于今年第二季度推出。
网友揭秘英特尔“秘方”这场硬刚英伟达的发布会,同样也激起了不少网友们的热议。
例如Gaudi 3封装的一处细节,即利用HBM2e存储芯片,有网友对此表示惊异:
他们利用的是HBM2e,这是英伟达A100在2020年利用的。
而最前辈的HBM3e英特尔原来也操持采取,但很可能由于供应不敷,这次没能抢到足够的订单。
对此,这位网友进一步表示:
这是英特尔的秘方之一。
他们总能靠旧技能遇上/超越新技能,直到当前的技能在生产、获取和集成上变得更随意马虎。
实际上,制造上风也是英特尔在半导体领域的关键上风之一,作为半导体家当的首创者之一,英特尔险些拥有芯片家当的所有资源和要素能力。
但何时能够和英伟达全面一较高下?这也是不少网友关注的问题:
这次英特尔硬刚的是H100/H200,那什么时候可以对标英伟达最新的“核弹”B200?
或许答案只有交给韶光来回答。
但无论如何,英特尔这次的发布,确实是给AIGC时期的算力,多供应了一项“快好省”的选择。
参考链接:[1]https://www.anandtech.com/show/21342/intel-introduces-gaudi-3-accelerator-going-bigger-and-aiming-higher[2]https://www.servethehome.com/intel-vision-2024-keynote-live-coverage/[3]https://news.ycombinator.com/item?id=39981032
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一韶光获知前沿科技动态










