首页 » 科学 » ChatGPT背后的大年夜模型需要若何的芯片?_芯片_模子

ChatGPT背后的大年夜模型需要若何的芯片?_芯片_模子

南宫静远 2024-11-18 08:03:15 0

扫一扫用手机浏览

文章目录 [+]

大模型的崛起,也为AI技能的地基——芯片带来了主要的商机与严厉的技能寻衅。
据Lambda实验室测算,如果采取英伟达V100 GPU和当时最便宜的云做事进行打算,GPT-3演习一次须要355个GPU年(一块GPU运行355年的运算量)、花费460万美元。
大模型须要若何的AI芯片,AI芯片企业又该如何应对?带着这样的疑问,采访了有关专家和企业家。

算力需求:对付AI芯片的哀求全面拉升

ChatGPT背后的大年夜模型需要若何的芯片?_芯片_模子 ChatGPT背后的大年夜模型需要若何的芯片?_芯片_模子 科学

4年的韶光、1500倍的参数量提升,大型措辞模型展现出强劲的扩展态势。
2018年,OpenAI推出第一代天生式预演习措辞模型GPT-1,拥有1.17亿个参数。
2019年推出的GPT-2拥有12亿参数,是GPT-1的10倍多。
一年后面世的GPT-3,参数量达到1750亿个,是GPT-2的100多倍,预演习数据量高达45TB。
ChatGPT正是基于GPT-3.5——一个基于GPT-3的微调版本。

ChatGPT背后的大年夜模型需要若何的芯片?_芯片_模子 ChatGPT背后的大年夜模型需要若何的芯片?_芯片_模子 科学
(图片来自网络侵删)

与参数量一起飙涨的,是大模型的算力需求。
燧原科技创始人、董事长兼CEO赵立东向《中国电子报》表示,以ChatGPT为代表的天生式AI模型为了实现高质量的内容天生,具备两大特性:参数规模巨大的模型、海量的演习数据集。
因此,大模型在底层算子支撑、系统架构方案、软件生态支持方面都和原来的决策式AI模型有着显著的差异,须要芯片厂商打造更加领先的系统级软硬件方案,并在技能和产品层面冲破原有的路线与壁垒。

“反响到算力芯片角度,紧张有三方面的需求:一是分布式打算能力,包括数据并行、模型并行、流水并行等分布式打算方案,打算效率尤其关键。
二是大容量高带宽的内存方案,在每个AI芯片内部有效提升数据处理能力和算力利用率,结合HBM以及CXL等新型存储技能进一提升本地存储能力和算力利用率。
三是更高的单芯片打算能力,以降落整体系统繁芜度,并降落TCO本钱。
”赵立东说。

昆仑芯科技也向表示,伴随着ChatGPT的迭代,大模型算法对算力的哀求不断提高,而算力的核心便是人工智能芯片。
“大模型对打算的哀求紧张表示在三个方面,一是算力,二是互联,三是本钱。
大模型的热潮也将加速AI芯片技能的创新和进步,包括芯片架构、算法优化、功耗掌握等方面的提升。
AI芯片公司可以在这些方面进行研发和创新,不断提高产品竞争力。

除了在已有的AI芯片路径持续迭代调优,得到更优的算力、效率、功耗、本钱。
大模型强烈的高算力需求,也呼唤芯片电路与架构层面的进一步创新。
北京大学集成电路学院研究员贾天宇向《中国电子报》指出,大模型技能的涌现和遍及,将进一步推动AI芯片的发展,拉升多方运用家当对付AI芯片的需求,对付提升AI芯片的主要性和不可或缺性有积极的意义。
但同时应认识到,支持大模型打算的AI芯片算力需求高、设计繁芜度高,其设计哀求和门槛也随之提升。

“由于传统芯片技能发展的限定,当前芯片设计的电路与架构面临着存算力瓶颈、能效瓶颈、设计繁芜度瓶颈等多方面寻衅。
如何办理算力需求和芯片设计瓶颈之间的抵牾还须要多方的创新和技能进展。
”贾天宇说。

技能路径:通用与定制的平衡

在AI芯片的发展过程中,通用性和定制化像是两个相互拉扯的浸染力,衍生出一系列的芯片架构。
个中,GPU和ASIC分别是通用性和定制化的代表架构,也有着各自的上风和局限。

“GPU架构供应了大量数据并行构造,因此能够供应大量的AI并行打算,适用于AI演习等。
ASIC等定制化AI芯片针对特定的运用处景进行芯片优化,能够取得更高的打算能效,但通用性相对较弱。
”贾天宇表示。

好在,随着芯片技能的发展,通用性与定制化已不再壁垒森严。
一方面,英伟达在GPU架构中引入了Tensor Core(张量打算核心),一种专门针对深度学习运用而设计的专用ASIC单元,使GPU更加适宜深度学习。
与此同时,定制化芯片也逐步增加了通用打算单元,并引入可编程或部分可编程的架构,增强芯片的场景覆盖能力。

“过去被认为只具备专用性的ASIC或DSA(领域专用架构),现在不仅含有用于AI加速打算的专用单元,还含有与英伟达GPU中CUDA Core类似的通用打算单元,同样可以实现对各种指令的处理。
因此,无论是GPU、ASIC或DSA架构,云端AI芯片企业在架构设计中须要关注的是通用和专用打算单元的搭配,以便应对AI打算持续演化带来的寻衅。
”昆仑芯科技向表示。

“鉴于大模型对付大算力的显著需求,以及模型演习算子的多样性,具有大算力、通用性的芯片将是大算力运用的首选。
在现存的技能方案中,GPU是能够供应算力和开拓生态的选择。
然而,由于GPU的功耗过高,类GPU架构的定制化大算力AI芯片也将存在市场,知足对付芯片打算能效的提升需求。
”贾天宇指出。

昆仑芯科技在环球人工智能开拓者先锋大会的展位

而通用与定制的“配比”,要根据详细场景设计。
昆仑芯科技表示,在通用性、易用性和性能之间实现平衡,须要在实际设计中结合需求。
除了单一技能或者算力指标,更要看重产品的综合竞争力是否均衡。
百度的AI运用处景,为昆仑芯供应了验证和调优机会。
就大模型而言,昆仑芯在产品定义上已经做告终构,昆仑芯2代AI芯片相较昆仑芯第1代产品大幅优化了算力、互联和性能,在百度内外部的大模型场景中都有落地,昆仑芯在研的下一代产品将为大模型和AIGC等运用供应更佳的性能体验。

“硬件和场景是双轮驱动的,场景催生新的技能方案,新的技能匆匆使场景更好发展。
大模型作为一个趋势场景,其需求定义清楚了,设计和实现技能就会迎刃而解。
”昆仑芯科技见告。

其余,无论是通用芯片还是定制芯片,抑或是通用、专用打算单元兼而有之,设计环节之后的制造、封装环节,也将浸染于AI芯片的性能提升。

“无论GPU还是定制化AI芯片路线,Chiplet、3D堆叠等前辈集成与封装技能将成为进一步提升大模型打算能力的主要技能手段,也将在未来AI芯片发展中起到主要浸染。
”贾天宇表示。

海内企业:需进一步增强软件及系统能力

虽然ChatGPT还没有进入盈利阶段,但英伟达已经成为第一波吃到红利的企业。
从2023年第一个美股交易日至今(截稿前末了一个交易日2月24日),英伟达的股价增幅超过60%,为处于下行周期的半导体家当增长了一丝亮色。
在北京韶光2月23日凌晨的财报发布中,英伟达创始人兼首席实行官黄仁勋表示,从初创公司到大型企业,对付天生式AI的多功能性与能力的兴趣越来越浓厚。
英伟达将帮助客户从天生式AI 和大型措辞模型技能的打破中获取上风。

英伟达在AI芯片的先发上风和占比上风,固然有硬件性能的缘故原由,但更关键的是软件生态的加持。
在21世纪初,GPU的并行打算能力引起了学术界和家当界的关注。
但是,开拓者想要调用英伟达GPU的打算能力进行图形处理以外的任务,必须编写大量的底层措辞代码,这对付习气高等措辞的程序员极其不便。
2006年,英伟达推出CUDA平台,支持开拓者用熟习的高等程序措辞进行编程,灵巧调用GPU的算力。
自此,GPU的利用范围不再局限于显卡,而是扩展到所有适宜并行打算的领域。
GPU与CUDA组成的软硬件系统,形成了英伟达的产品壁垒。

近年来,海内AI芯片企业在架构创新、算力性能、平台方案等领域呈现出一系列成果,但仍旧须要在软件、系统和生态层面进一步向国际领先企业看齐。
赵立东表示,针对大模型对付AI芯片的需求,芯片厂商一方面通过拆解大模型的系统级需求,快速迭代下一代芯片,从底层提升性能和支持效率。
另一方面,要基于既有的芯片打造系统级方案,通过软件升级办理大模型加速碰着的内存容量小、通信占比高档核心痛点问题。

“要对标国际领先的AI芯片厂商,须要在三个层面开拓优化:一是芯片升级,在算力、内存、微架构等层面针对大模型打算做优化;二是软件升级,从传统的单卡以及单机多卡为主的支持能力拓展至万卡级别大集群支持,有效供应面向大模型支持的分布式打算、稠浊并行、内存优化等整体软件方案;三是系统方案,以AI芯片为核心,结合打算、存储、网络打造深度优化的系统级方案,面向大模型供应极致的性能和本钱上风。
”赵立东说。

燧原科技邃思2.0芯片

据先容,燧原科技已经基于千卡演习集群进行大模型演习,并将推理产品通过云做事商,为内容天生模型开拓商供应算力支撑。
基于系统级大集群大模型,燧原将持续创新迭代,重点聚焦生态培植,知足运用开拓者对AI算力的强劲需求。

昆仑芯科技也表示,详细到软件生态,AI算法和运用开拓者在构建AI运用和业务的过程中,须要一套成熟的编程措辞,以及完善的软件工具集来快速迭代开拓任务。
昆仑芯SDK可以供应从底层驱动环境到上层模型转换等全栈的软件工具,已经适配百度飞桨、PyTorch、TensorFlow等主流框架和做事器,逐渐完善生态培植。
“要实现像OpenAI的ChatGPT这样的大规模深度学习模型,须要大量的数据和算法优化,以及干系领域的专业知识。
因此,要更好地实现ChatGPT的商用落地,须要相应的技能团队和研究机构,与AI芯片企业协同推进。

没有百亿参数的大模型,不敢奢谈ChatGPT
北京支持头部企业打造对标ChatGPT大模型
作者丨张心怡
编辑丨陈炳欣
美编丨马利亚
监制丨赵晨

标签:

相关文章

C语言SPK,详细介绍编程之美

在计算机科学领域,C语言一直以其高效、简洁、灵活等特点受到程序员们的喜爱。而在C语言的众多特色中,SPK(Structure, P...

科学 2025-01-06 阅读0 评论0