量子位 | "大众号 QbitAI
人工智能毫无疑问是当今一项主要议题,通过大模型、垂类运用、智能体等多种办法推动着数字经济的发展。
然而,做事AI的根本举动步伐——算力和数据,是限定人工智能发展的瓶颈,也成了进一步谈论的话题。

为什么到现在仍旧存在这样的瓶颈?又该如何冲破?
我们在成立一年的北电数智所做的事里看到了一些答案——
一座集结了“开箱可用”的国产算力的“AI工厂”,已然在北京浮出水面。
“AI工厂”剑指算力焦虑无论是对付单一从业者还是全体行业,有效算力的缺少都是一个亟待办理的痛点。
站在需求侧来看,以大模型为代表的天生式AI发达发展,激烈的“百模大战”,推理时期的即将到来,无疑都带来了巨量的算力需求增长。
中国工程院等十余家机构联名在Science子刊Intelligent Computing上揭橥的一份报告指出,人工智能所需的打算能力每100天翻一番,照这样打算,估量在未来五年内将增加超过100万倍。
而且,人工智能时期,对算力的需求已经不仅仅是FLOPS的数量,算力需求的构造也发生了很大变革。
AIGC时期,算力的构造形式已经从CPU+加速器转变为以GPU主导的大规模并行打算,智能算力占比快速提升。
但当前,国产芯片,特殊是高端芯片,在很多方面与业界前辈产品在算力性能、功耗墙、卡间通信速率等存在代际差距。
非芯片成分也在限定着算力的高效利用,如节点间的网络传输能力不敷、配套软件生态不完善等等,不胜列举。
在这样的现实之下,大部分的国产智能算力无法高效利用,催生出了业界对算力的第二重焦虑。
造成这样焦虑的根本缘故原由,在于利用方对多芯特殊是国产算力的能力认知不足清晰,可以概括为几个方面:
海内大规模多芯集群能力欠缺,无法支持大规模的、靠近生产环境的算力适配、评测。换言之,单芯片测试只能对卡间互联、打算节点间给出预估数据,对付加速比的数据更是却为空缺;现有平台以指数型评测指标为主,不能和用户业务场景进行联系,没有完备打通从业务场景到底层芯片的适配链路,也便是说实际的利用方,无法理解和判断多芯集群是否能够知足自己的需求;海内短缺多芯异构的做事性平台,也短缺多芯异构、稠浊演习、推理任务的考试测验。总体来说,需求方不知道供给方能够供应的做事以及对自己实际业务的支持程度,供给方缺少一个平台来展示自身能力和能够做到的事情,同时有一个公道且清晰的评估和标准。
为了冲破这样的认知,破解算力焦虑的迷局,一个名为“星火·智算”的AIDC品牌应运而生。
“星星之火,可以燎原”,选择“星火”这样的名称,是方案供应者希望这一品牌能够以燎原之势,实现全国范围的复制。
提出这一方案的,是北电数智——北京电控旗下一家专注于人工智能的高科技企业。
北电数智认为,算力是人工智能时期一种新的生产力形式:
在农耕时期,大地便是算力;机器时期,电力、蒸汽力便是算力;在人工智能时期,算力便是煤水电一样,是第生平产力的办法。
为了把算力变成电力一样的生产力要素,目光就不能就不能再只做大略的芯片、做事器、机柜的堆叠,而是要从“算力仓库”向着“AI工厂”的方向转型,配备相应的新质生产关系。
这也是北电数智在打造星火·智算时的新思路。
详细来讲,星火·智算一方面通过供应普惠算力,如水电煤般支持人工智能技能的创新和运用。
另一方面,以“AIDC 即做事”理念,供应底座大模型、行业大模型以及一站式工具链等配套做事,让企业可以方便快捷地搭建出想要的运用或者重构现在的产品,实现生产办法的创新。
目前,“星火·智算”品牌的首个标杆项目——北京市数字经济算力中央已经开工培植,未来将作为模板推向全国。
为更好地助力算力升级,北电数智还有两款核心产品,全面向着家傍边的算力焦虑出击:
提高·AI异构打算平台,针对当下高端算力资源紧缺局势,配置最符合海内市场需求的多芯异构方案;宝塔·大模型适配平台,向下广泛适配芯片,使芯片与大模型广泛解耦和适配;两个产品“一体两面”,从不同的维度办理算力焦虑。
提高·AI异构打算平台作为全栈国产算力迭代验证平台,能够实现多种算力的统一管理与调度,同时首推效果式计费,用户无需节制底层细节即可按需运用,并实现多种算力之间的平滑迁移。
为了让算力能够更好被利用,星火·智算也通过统一通信、编译优化等技能打破,提高·AI异构打算平台可以让国产芯片性能提升2-3倍,吞吐量提升6-7倍。
在为用户供应算力支持的同时,提高·AI异构打算平台还打造了“芯片×模型×场景”的全新评测模式,帮助冲破厂商与利用者之间的信息不对称,助力芯片厂商破局,让国产芯片从“可用”到“好用”。
这意味着,在给用户供应算力支持的同时在推动国产芯片实现全面提升,带来更多的源头算力。
宝塔·大模型适配系统则是赋能模型和运用侧,支持模型支配、管理,做算力的风雅化运营管理,进一步向上支撑人工智能运用。
让高质量数据流利起来如果说算力毛病是AI大厦上的一朵“乌云”,那么数据上的不敷便是当之无愧的另一朵。
北电数智首席科学家、复旦大学打算机科学技能学院特聘教授窦德景的公开演讲表示,数据规模与质量,决定了AI的“上限”——无论是演习还是推理,都须要高质量的数据作为支持。
以Meta最新发布的开源大模型Llama 3.1为例,其第三代模型在超1.6万个H100 GPU上花费的演习数据量为15T tokens,是第二代的7倍,这也造诣了两代之间相同参数规模下的性能飞跃。
在我国,数据供给侧的现状也与算力一样面临焦虑——总量丰富,但高质量数据烟囱林立。
据IDC测算,2022-2027年,中国的数据量规模将由23.88ZB增长至76.6ZB,处于天下一流,但是可获取的高质量语料数据集依然相对匮乏。
在数量已经匮乏的条件下,高代价数据又面临着“供不出、流不动、用不好”的窘境,难以发挥代价,让本就有限的数据资源变得更加紧张。
另一方面,数据的集成化程度也严重不敷,大量数据散落在家当侧或垂直系统内,而且未被构造化,无法直接用于大模型演习。
这背后的深层次缘故原由,是缺少成熟的技能和可信机制来支撑数据的安全,拥有数据的企业“不知、不敢、不能、不会”让数据任意流利,这“四不”的现状进一步造就了本日数据集的短缺,形成了一道去世循环。
以是当务之急,便是建立起一套可信的安全的数据机制。
为此,北电数智推出了另一个主要产品——红湖·可信数据空间,让数据要素充分聚拢,让场景得以充分开放。
红湖·可信数据空间是环绕“可信”构建的多层次办理方案,旨在盘活数据供应高质量可信数据做事,打造“安全共享、可信流利”的数据环境。
从技能上看,红湖·可信数据空间搭载了可信数据沙盒,利用“逻辑数仓”等技能导入、修正和删除数据,并通过隐私打算+区块链技能,担保数据安全、无泄露,担保数据的可追溯和透明性,做到“全链条可控”。
这种做法使数据可信、可控、可用、可审计、加密保护,从而创造多方互信、数据流利协议履行的数据共享、运用环境。
有了这样全流程可控的安全方法,才能让数据的拥有者敢于将手中的数据资源投入市场流利,并以点带面地拉动更多的数据拥有者参与个中。
有了前期的数据投入,数据供应的生态也将走向成熟,数据共享的形式也会更加完善便捷,流动的高质量数据将为行业发展注入更多的新鲜血液。
同时,北电数智自身也为行业带来了高质量数据,在医疗、教诲、文化等行业布局了垂类模型矩阵,让人工智能企业更好地找到落地场景。
以是,北电数智到底是谁,又是如何孕育出这样一套全面针对人工智能行业痛点的办理方案的呢?
人工智能时期的“发电厂”,家当链的“串珠人”北电数智,是北京电控集团旗下高科技企业,专注于人工智能,自身定位是全栈AI做事商。
北电数智成立之前,正逢GPT-3.5发布,彼时,新一轮人工智能时期全面开启,AI竞争也正日趋白热化。顺应时期发展与市场需求,北电数智应运而生。
成立之时,北电数智承接的第一个项目便是北京市数字经济算力中央,定位是向公共供应智算算力,实现算力的普惠。
换言之,这个算力中央就像一座“发电厂”,让算力像水电煤一样赋能从基座到运用的完全AI家当分层。
北电数智计策与市场卖力人杨震先容,这是北电数智和数科公司的不同,北电数智的第一要务,是要把人工智能家当支撑起来,让人工智能企业或者个人开拓者能够快速利用到人工智能、享受到人工智能。
在全体人工智能家傍边,杨震认为北电数智扮演了家当链“串珠人”的角色——如果这个家当链上已经有珠子了,就把它们串上;如果没有的话,就把它造出来。
比如前文提到的对国产芯片的加速、在行业模型垂类模型的布局、可信数据空间,都是这个家当链上的一颗颗“珠子”。
除了供应算力产品,北京市数字经济算力中央还专门设计了互换、展示空间,让处于相同或不同领域的AI从业者碰撞互换,促进更全面更深层次的创新。
未来,这个算力中央中的开放空间还将作为“算力科技公园”面向公众年夜众开放,让更多人理解人工智能时期的生产变革之力。
总之,北电数智将以智算中央为支撑,串联起芯片、做事器、大模型、AI运用、家当投资等高下游技能、产品和做事,促进人工智能家当发展和繁荣,并带动区域经济家当升级。
截止目前,北电数智已有AI家当生态伙伴干余家,覆盖了AI赞助药物研发、通用机器人/具身智能、无人驾驶、AI智能体等明星赛道。
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一韶光获知前沿科技动态