首页 » 科学 » 类脑AI技能重要一步!英特尔宣告神经拟态系统Hala Point相当于猫头鹰大年夜脑_拟态_英特尔

类脑AI技能重要一步!英特尔宣告神经拟态系统Hala Point相当于猫头鹰大年夜脑_拟态_英特尔

乖囧猫 2025-01-12 22:35:17 0

扫一扫用手机浏览

文章目录 [+]

英特尔发布了代号为Hala Point的大型神经拟态系统。
Hala Point基于英特尔Loihi2神经拟态处理器打造而成,旨在支持类脑AI领域的前沿研究,办理AI目前在效率和可持续性等方面的寻衅。
在英特尔第一代大规模研究系统Pohoiki Springs的根本上,Hala Point改进了架构,将神经元容量提高了10倍以上,性能提高了12倍。

英特尔研究院神经拟态打算实验室总监Mike Davies表示:“目前,AI模型的算力本钱正在持续上升。
行业须要能够规模化的全新打算方法。
为此,英特尔开拓了Hala Point,将高效率的深度学习和新颖的类脑持续学习、优化能力结合起来。
我们希望利用Hala Point的研究能够在大规模AI技能的效率温柔应性上取得打破。

类脑AI技能重要一步!英特尔宣告神经拟态系统Hala Point相当于猫头鹰大年夜脑_拟态_英特尔 类脑AI技能重要一步!英特尔宣告神经拟态系统Hala Point相当于猫头鹰大年夜脑_拟态_英特尔 科学

Hala Point在主流AI事情负载上展现了出色的打算效率。
研究显示,在运行传统深度神经网络时,该系统能够每秒完成多达2切切亿次(20 petaops)运算,8位运算能效比达到了15TOPS/W,相称于乃至超过了基于GPU和CPU的架构。
Hala Point有望推动多领域AI运用的实时持续学习,如科学研究、工程、物流、智能城市根本举动步伐管理、大措辞模型(LLMs)和AI助手(AIagents)。

类脑AI技能重要一步!英特尔宣告神经拟态系统Hala Point相当于猫头鹰大年夜脑_拟态_英特尔 类脑AI技能重要一步!英特尔宣告神经拟态系统Hala Point相当于猫头鹰大年夜脑_拟态_英特尔 科学
(图片来自网络侵删)

目前,Hala Point是一个旨在改进未来商用系统的研究原型。
英特尔估量其研究将带来实际技能打破,如让大措辞模型拥有重新数据中持续学习的能力,从而有望在AI广泛支配的过程中,大幅降落演习能耗,提高可持续性。

深度学习模型的规模正在不断扩大,参数量可达万亿级。
这一趋势意味着AI技能在可持续性上面临着严厉的寻衅,有必要探索硬件架构底层的创新。
神经拟态打算是一种借鉴神经科学研究的全新打算方法,通过存算一体和高细粒度的并行打算,大幅减少了数据传输。
在本月举行的声学、语音与旗子暗记处理国际会议(ICASSP)上,英特尔揭橥的研究表明,Loihi2在新兴的小规模边缘事情负载上实现了效率、速率温柔应性数量级的提升[1]。

Hala Point在其前身Pohoiki Springs的根本上实现了大幅提升,基于神经拟态打算技能提升了主流、常规深度学习模型的性能和效率,尤其是那些用于处理视频、语音和无线通信等实时事情负载的模型。
例如,在今年的天下移动通信大会(MWC)上,爱立信研究院(Ericsson Research)就展示了其如何将Loihi2神经拟态处理器运用于电信根本举动步伐效率的优化。

Hala Point基于神经拟态处理器Loihi2打造,Loihi2运用了浩瀚类脑打算事理,如异步(asynchronous)、基于事宜的脉冲神经网络(SNNs)、存算一体,以及不断变革的稀疏连接,以实现能效比和性能的数量级提升。
神经元之间能够直接通信,而非通过内存通信,因此能降落整体功耗。

Hala Point系统由封装在一个六机架的数据中央机箱中的1152个Loihi2处理器(采取Intel4制程节点)组成,大小相称于一个微波炉。
该系统支持分布在140544个神经形态处理内核上的多达11.5亿个神经元和1280亿个突触,最大功耗仅为2600瓦。
Hala Point还包括2300多个嵌入式x86处理器,用于赞助打算。

在大规模的并行构造中,Hala Point集成了处理器、内存和通信通道,内存带宽达每秒16PB,内核间的通信带宽达每秒3.5PB,芯片间的通信带宽达每秒5TB。
该系统每秒可处理超过380万亿次8位突触运算和超过240万亿次神经元运算。

在用于仿生脉冲神经网络模型时,Hala Point能够以比人脑快20倍的实时速率运行其全部11.5亿个神经元,在运行神经元数量较低的情形下,速率可比人脑快200倍。
虽然Hala Point并非用于神经科学建模,但其神经元容量大致相称于猫头鹰的大脑或卷尾猴的大脑皮层。

在实行AI推理负载和处理优化问题时,Loihi2神经拟态芯片系统的速率比常规CPU和GPU架构快50倍,同时能耗降落了100倍[1]。
早期研究结果表明,通过利用稀疏性高达10比1的稀疏连接(sparseconnectivity)和事宜驱动的活动,Hala Point运行深度神经网络的能效比高达15TOPS/W[2],同时无需对输入数据进行批处理。
批处理是一种常用于GPU的优化方法,会大幅增加实时数据(如来自摄像头的视频)处理的延迟。
只管仍处于研究阶段,但未来的神经拟态大措辞模型将不再须要定期在不断增长的数据集上再演习,从而节约数千兆瓦时的能源。

天下各地领先的学术团体、研究机构和公司共同组成了英特尔神经拟态研究社区(INRC),成员总数超过200个。
携手英特尔神经拟态研究社区,英特尔正致力于开拓类脑AI前沿技能,以将其从技能原型转化为业界领先的产品。

(8666870)

相关文章