首页 » 智能 » 专访北京超算:国产芯片15天旁边可跑通大年夜模型高端算力仍需各方努力_模子_芯片

专访北京超算:国产芯片15天旁边可跑通大年夜模型高端算力仍需各方努力_模子_芯片

萌界大人物 2024-11-11 15:27:40 0

扫一扫用手机浏览

文章目录 [+]

2023,随着ChatGPT的横空出世,大模型迎来了前所未有的关注。
2024,业内普遍认为,大模型将迎来落地运用热潮。

大模型落地运用元年,人工智能技能也行至家当运用的临界点。
红星成本局采访多家海内大模型企业,聚焦大模型运用行业前沿关键节点。

专访北京超算:国产芯片15天旁边可跑通大年夜模型高端算力仍需各方努力_模子_芯片 专访北京超算:国产芯片15天旁边可跑通大年夜模型高端算力仍需各方努力_模子_芯片 智能

算力与数据,是支撑超大规模演习模型发展的两大根本举动步伐。
面对环球追逐大模型热潮,高端AI芯片短缺,算力问题也成为各行业实现人工智能普惠的最大难点。

专访北京超算:国产芯片15天旁边可跑通大年夜模型高端算力仍需各方努力_模子_芯片 专访北京超算:国产芯片15天旁边可跑通大年夜模型高端算力仍需各方努力_模子_芯片 智能
(图片来自网络侵删)

近期,北京超级云打算中央运营实体北京北龙超级云打算有限任务公司CTO甄亚楠在接管红星成本局等媒体专访时谈到了超算中央与智算中央转换、大模型利用国产芯片的情形、大模型算力供给等问题。

他见告红星成本局,目前帮国产大模型“嫁接”国产芯片,只需15天旁边就可以跑通。
他认为算力共享会是行业大趋势,高端GPU算力资源须要各方努力。

甄亚楠

超算转智算会是趋势吗?

一样平常来说,算力分为通用算力(根本算力)、智能算力和超算算力三大板块。

个中,根本算力紧张由基于CPU芯片的做事器供应,用于支持如云打算和边缘打算等根本通用打算。
智能算力则由基于GPU、FPGA、ASIC等AI芯片的加速打算平台供应,紧张用于人工智能的演习和推理打算。
而超算算力则由超级打算机等高性能打算集群供应,紧张用于尖端科学领域的打算。

各种算力中央在打算办法和善于领域等方面互异,近几年各地也在加快智算中央的培植。

“实在外洋并未区分‘超算’‘智算’的观点,他们专门用来做打算的这类机器都叫做super computer(超级打算机)。
”甄亚楠认为,智算中央在海内看起来利用率比较高,紧张还是供需关系决定的。

“现在做大模型的企业比较多,大家都在‘抢韶光’研发,急迫须要有更大量的算力资源,短韶光之内高端GPU算力资源大家都是按月或者按年的办法去租赁。
以是这个机器只要一上线,就有大量的客户把这些资源拿走去用,这就看起来智算中央的利用率更高一些。

甄亚楠表示,超算和智算办理的都是同一类问题,即打算密集型问题。
“如何给用户供应足够量的资源池,如何供应稳定永劫光的打算,如何能够在打算过程中性能是高效的,不管对付超算还是智算,都属于共性问题。

甄亚楠认为,算力中央的培植就须要具有一定的“适度超前性”,由于要承载未来3~5年的利用诉求。
为了应对空闲,北京超算采纳的是“分批次”的按需培植模式。
“比如需求兴旺的时候,增加培植几百台乃至几千台,当利用率饱和的时候,再进行有效的扩容。
”此外,关于超算智算之间的转换,他表示超算架构加上GPU卡就可以做事AI智算。

数据显示,截至去年我国就有十余家超算中央,超30个城市提出或正在培植智算中央。

甄亚楠见告红星成本局,各个地方培植算力中央,北京超算也在积极关注,“如果地方培植了大型的算力中央,是不是能找到客户、做事好客户?是不是能把平台高效运营起来实现经济效益的转化?这些是我们持续关注的点。

甄亚楠还提到了另一个关注点,即未来算力家当。
“实质上它受限于算法和算力芯片技能的快速迭代和更新。
以英伟达来讲,都会有非常明确的算力芯片发展方案。
未来高端芯片出来后,是不是低端芯片会逐步被替代掉,这也是一个值得磋商的问题。

国产芯片跑通大模型有障碍吗?

近年来,我国人工智能算力芯片的市场格局紧张由英伟达主导,其霸占了80%以上的市场份额,一贯保持着无可匹敌的竞争上风。
然而,随着美国对高性能芯片出口限定方法不断加强,国产AI芯片肩负起补充市场空缺的主要义务。

“我们也非常关注国产芯片的发展,据理解,海内自研的大模型,乃至一些开源的大模型都在不断往国产芯片上去做移植。

甄亚楠指出,现在从芯片利用角度来讲,有些模型已经可以跑通运行了,须要追赶的方面紧张在类似GPU这种高性能。

“全体的国产化是分层级的,芯片属于硬件这一层,除此之外还有软件的生态。
对付国产的芯片来讲,不管是框架还是生态,都须要有一定的造就周期。
”甄亚楠呼吁,终极的运用方要给到国产芯片足够的信心。
他透露,目前北京超算有专门的团队,在国产芯片各种辅导文档比较完好的情形下,历时15~20天,开展做事器根本环境支配、性能测试到模型移植、性能优化、加速库更换等事情,可以帮助客户完成国产算力的模型移植与支配。

甄亚楠坦言,从全体生态角度,须要硬件、软件、模型企业共同努力。
“实质上来讲还是个非常繁芜的系统性问题,国产芯片是可以‘跑起来’,办理‘可用’的问题,但剩下的性能问题,也便是达到‘好用’的程度,则须要大家共同努力。

大模型算力供给是否存在困难?

红星成本局把稳到,从去年开始,就有专家学者指出,大模型时期,智能算力成为“稀缺资产”。
如何善用算力资源,发挥其最大效益,已经成为每个参与者必须面对的寻衅。

甄亚楠认为,对付大模型需求多少算力,运用上有所区分。

比如,做基座大模型的企业,对算力资源的总量哀求比较高,可能动辄便是5000卡,乃至万卡的规模,甄亚楠表示,目前能够拿出空闲5000卡旁边的算力资源的智算中央在海内还是非常少的,以是基座大模型企业算力依然紧缺。
特殊是对付那些顶级的基座大模型研究企业,目前缺卡的情形依然存在。

其余一类是行业大模型或者垂类大模型,一样平常都是在基座大模型的根本之上,利用自有数据做微调。
甄亚楠指出,这种对算力总量需求相对来讲比较小,海内有很多算力做事单位都可以知足,这里存在的便是如何去优选做事的问题。

目前从大模型的算力供给量来讲,是否还存在制约?甄亚楠认为长远看,供需关系会发生变革,但当下,高端算力资源供货周期不可控,导致其依然“难求”。

甄亚楠提到,算力中央的培植投入是最直接的“制约”,周期长,耗资巨大。
另一方面,培植多大的算力资源池,与大模型企业的长期方案更是有直接关系。

“我们必须和企业保持及时且长期的沟通,针对他们的业务发展走向,提前做布局。
才能在方案韶光内储备足够的算力资源池。

甄亚楠坦言,高端GPU算力资源须要各方努力。
“一方面我们自己建,另一方面我们也和海内的运营商、地方政府在洽谈,他们在培植算力方面有资金以及政策支持。
算力共享在这个行业里会是大趋势,须要各方共同去钻营算力上的互助。

红星新闻 王田

编辑 杨程

(下载红星新闻,报料有奖!

标签:

相关文章