首页 » 智能 » 最强AI芯片英伟达H200,Llama2-70B推理提速90%,2024年二季度发货_英伟_内存

最强AI芯片英伟达H200,Llama2-70B推理提速90%,2024年二季度发货_英伟_内存

乖囧猫 2024-11-13 22:07:26 0

扫一扫用手机浏览

文章目录 [+]

编辑:蛋酱、陈萍

芯片巨子英伟达,又打出一张王牌。

最强AI芯片英伟达H200,Llama2-70B推理提速90%,2024年二季度发货_英伟_内存 最强AI芯片英伟达H200,Llama2-70B推理提速90%,2024年二季度发货_英伟_内存 智能

英伟达在 2023 年环球超算大会(SC2023)上发布了目前天下上最强的 AI 芯片 H200。

最强AI芯片英伟达H200,Llama2-70B推理提速90%,2024年二季度发货_英伟_内存 最强AI芯片英伟达H200,Llama2-70B推理提速90%,2024年二季度发货_英伟_内存 智能
(图片来自网络侵删)

这款新的 GPU 基于 H100 进行了升级,内存带宽提高了 1.4 倍,内存容量提高了 1.8 倍,提高了处理天生式 AI 任务的能力。
该公司高性能打算和超大规模数据中央业务副总裁 Ian Buck 表示:「英伟达在硬件和软件上的创新正在缔造新型 AI 超算。

英伟达在官方博客中表示:NVIDIA H200 Tensor Core GPU 具有改变游戏规则的性能和内存功能,可增强天生式 AI 和高性能打算 (HPC) 事情负载。
作为首款采取 HBM3e 的 GPU,H200 借助更大更快的内存可加速天生式 AI 和大型措辞模型 (LLM) 的运行,同时推进 HPC 事情负载的科学打算。

除此以外,Buck 还展示了一个做事器平台,该平台通过 NVIDIA NVLink 互连连接四个 NVIDIA GH200 Grace Hopper 超级芯片。
四核配置在单个打算节点中配备了多达 288 个 Arm Neoverse 内核和 16 petaflops 的 AI 性能,以及高达 2.3 TB 的高速内存。

大模型推理加速 1.9 倍

NVIDIA H200 基于 NVIDIA Hopper 架构,与 H100 相互兼容,这意味着已经利用先前模型进行演习的人工智能公司将无需变动其做事器系统或软件即可利用新版本。

H200 是首款以 4.8 TB/s 速率供应 141 GB HBM3e 内存的 GPU,这险些是 NVIDIA H100 Tensor Core GPU 容量的两倍。
H200 还配备了高达 141GB 超大显存,与 H100 的 80GB 比较,容量险些翻倍,并且带宽还增加了 2.4 倍。

H200 更大更快的内存可加速天生式 AI 和 LLM 的运行,同时以更高的能源效率和更低的本钱推进 HPC 事情负载的科学打算。

例如,在处理 Llama2 等 LLM 时,H200 的推理速率比 H100 GPU 提高了近 2 倍。

运行 GPT-3 等模型时,NVIDIA H200 Tensor Core GPU 的推理性能提高了 18 倍。
不仅如此,在其他天生式 AI 基准测试中,还能在 Llama2-13B 上每秒可处理 12000 个 tokens。

内存带宽对付 HPC 运用程序至关主要,由于它可以实现更快的数据传输,减少繁芜的处理步骤。
对付那些内存密集型 HPC 运用如仿照仿真、人工智能研究等,H200 更高的内存带宽可确保高效地访问和操作数据,与 CPU 比较,给出结果的韶光最多可加快 110 倍。

随着 H200 的推出,能源效率和 TCO 达到了新的水平。

下图为 H200 一些参数先容:

英伟达表示,从明年开始,亚马逊网络做事、谷歌云、微软 Azure 和甲骨文云根本举动步伐将成为首批支配基于 H200 实例的云做事供应商。

官网信息显示,H200 将于 2024 年第二季度开始向环球系统制造商和云做事供应商供货。
但对付 H200 的价格,英伟达还没有透露详细数字。
CNBC 宣布称,上一代 H100 的售价估计为每台 2.5 万美元至 4 美元,须要数千台才能以最高水平运行。

关于 H200 是否会像 H100 一样供应紧张,英伟达对此并没有给出答案。

在给 The Verge 的邮件中,英伟达发言人 Kristin Uchiyama 表示 H200 的亮相不会影响 H100 的生产:「你会看到我们整年的总体供应量有所增加,并且我们将连续长期购买供应。

最新一期超算 Top500 出炉

8 成新上榜系统利用英伟达 H100

与此同时,SC23 大会还发布了最新一期超算 TOP500 榜单。
Frontier 系统仍保持榜首位置,并且仍旧是榜单上唯一的百亿亿次打算机,但前十名的格局已经被五个新的或升级后的系统改变。

榜单地址:https://www.top500.org/lists/top500/2023/11/

在新一期榜单中,利用英伟达技能的超算系统数量达到了有史以来的最高水平 379 台,个中包括 49 台新上榜超算中的 38 台。
这一数字在今年 5 月份是 372 台。

英伟达为这些系统供应了超过 2.5 exaflops 的高性能打算性能,高于 5 月份的 1.6 exaflops。
个中,在前 10 名中,英伟达就贡献了近 1 exaflops 的高性能打算性能和 72 exaflops 的 AI 性能。

比如,微软 Azure 的 Eagle 系统在 NDv5 实例中利用了 H100 GPU,以 561 petaflops 的成绩位列第 3,在新上榜的超级打算机中遥遥领先,巴塞罗那的 Mare Nostrum5 排名第 8,英伟达 Eos(最近在 MLPerf 基准测试中创造了新的 AI 演习记录)排名第 9。

基于强大的性能,英伟达未来将为天下各地的超算中央供应更好的算力做事。
就在 SC23 大会上,多家超算中央宣告了正在为自己的超算集成 GH200 系统。

比如,德国尤利希超算中央将在「木星」(JUPITER)上利用 GH200 超级芯片,这将成为欧洲第一台百亿亿次超级打算机。

参考链接:

https://blogs.nvidia.com/blog/efficient-ai-supercomputers-sc23/

https://www.theverge.com/2023/11/13/23958823/nvidia-h200-ai-gpu-announced-specs-release-date

标签:

相关文章

TDX易语言,开启编程新纪元

在信息化时代,编程已经成为了一种必备技能。对于编程初学者来说,学习一门编程语言并非易事。在这种情况下,TDX易语言应运而生,为编程...

智能 2025-01-04 阅读0 评论0

Toad语言在数据库管理中的应用与价值

随着信息技术的高速发展,数据库已成为现代企业、政府机关及科研机构的核心资源。为了更好地管理和维护数据库,各种数据库管理系统(DBM...

智能 2025-01-04 阅读0 评论0

UV技术在C语言编程中的应用与优势

随着信息技术的飞速发展,编程语言已经成为现代信息技术的重要工具。C语言作为一种经典的编程语言,广泛应用于操作系统、嵌入式系统、网络...

智能 2025-01-04 阅读0 评论0

V4双栈协议,互联网通信的基石与未来展望

互联网的飞速发展,使得网络通信技术日新月异。在众多通信协议中,V4双栈协议因其独特的优势,成为了互联网通信的基石。本文将从V4双栈...

智能 2025-01-04 阅读0 评论0