然而,随着摩尔定律的闭幕,以及针对特定领域定制的更多功能,芯片行业正朝着专用打算的方向发展,而AI则彷佛在朝相反的方向提高,这种不合可能会迫使未来芯片和系统架构发生重大变革。
01

周期差异带来抵牾
随着平面缩放技能靠近极限,以及越来越多的功能被专门针对特定运用领域优化,半导体行业正在探索新的平衡点。一方面,高度定制化的多芯片或多芯片封装可以带来显著的性能和能效提升;另一方面,通用型组件仍旧具有本钱上风和灵巧性。
目前大约有30%到35%的芯片设计工具发卖给了大型系统公司,用于设计那些不会公开发卖的专用芯片。
Ansys半导体部门产品营销总监Marc Swinnen表示:“在定制芯片上运行软件可以带来很多好处,由于它比竞争对手更具上风。您的软件运行速率更快,功耗更低,并且专为运行您想要运行的内容而设计,拥有现成硬件的竞争对手很难与您竞争。”
这些内部利用的芯片每每能够通过提高性能效率来抵消设计和制造本钱。然而,这种权衡在某些情形下变得更加不愿定。
自ChatGPT问世以来的18个月里,呈现出大量软件初创公司探索新的架构和技能,并且这种趋势很可能会连续下去,然而定制化芯片的生产周期每每超过18个月。这意味着,当定制化芯片进入大规模生产阶段时,AI算法可能已经发生了根本性的变革,使得原来高度优化的硬件变得过期。
但这并不虞味着专用芯片的闭幕。
02
既是技能问题
也是商业问题
曾经有许多定制芯片公司在短韶光内取得了成功,但随后失落败了。只管无论是在架构还是办理新的市场需求上,他们已经取得了一定进步,但随后通用芯片奋起直追。由于通用芯片常日会得到更多投资、更广泛的运用市场、更多的研发职员,他们不可避免地超越定制芯片,历史的钟摆也随之摆向通用芯片。
然而,摩尔定律的放缓改变了两者之间的工艺节点和差距。如果不能跟上最新节点的采取,通用途理器就很难往前发展,这会为专用芯片带来更多的机会。西门子的 Klein 说:“当您向通用途理器添加加速器开始走不通时,由于想要更快或更高效,您开始实施定制化模块。系统越不通用,它就越详细,常日我们要从中获取的性能越高,效率就越高。而且,在性能和效率方面,它险些总是乃至是一定能够击败通用加速器”
同时,随着AI事情负载的激增,纵然是传统的打算资源也开始面临压力,必须适应不断变革的技能环境。
“在天生式AI领域取得的进步极其迅速,”Expedera的首席科学家Chole说,“然而目前没有任何可用的东西能够在本钱和功耗方面跟上硬件的哀求。纵然是GPU也没有足够的出货量(虽然有订单,但是出货量不敷)。没有足够的打算能力来实际支持天生式AI的事情负载。”
并且,据TechInsights调研预测,未来五年 AI 芯片将花费环球超 1.5% 电力,产生超 10 亿吨碳排放。
数据中央综合考虑投资回报和支配本钱、电力本钱、热本钱、冷却本钱等方面,正在支配越来越多的异构处理,每种架构都针对不同的任务进行了优化,相较于单一的通用CPU,这些架构能够供应更好的性能。
只管大多数关注点集中在大型数据中央(新模型被演习的地方),但终极的收益将来自利用这些模型进行推理的设备(边缘AI),而这些设备无法承受用于演习的巨大功耗。“用于演习AI的硬件相对标准,”Ansys的产品营销总监Marc Swinnen说,“购买NVIDIA的芯片就可以演习AI。但一旦模型构建完成,如何在终端运用中实行这个模型,这常日是须要为该AI算法定制的专用芯片。要想得到高速率、低功耗的AI模型实现办法,唯一的路子便是为此构建一个定制芯片。AI端侧落地将成为驱动每个模型实行过程中定制硬件的主要成分。”
03
总结
目前最精良的架构是否足以支撑未来的需求?AI的快速发展意味着没有人能给出确切的答案。考虑到AI可能会花费环球能源的很大一部分,未来硬件设计必须兼顾性能和能耗。GPU及其上的软件抽象层已经为AI的快速发展供应了足够的框架,但这并不虞味着它是效率最高的平台。随着更多专用硬件的涌现,AI模型的开拓方向很可能会受到硬件资源的影响。
综上,AI与芯片行业的不合不仅表示在开拓速率上,还表示在硬件的定制化程度和通用性之间。面对这一寻衅,芯片行业正在探索新的办理方案,如Chiplet技能和更灵巧的架构设计,以期找到平衡点,知足AI不断变革的需求。未来几年将是AI与硬件领域共同进步的关键期间,而如何在这两者之间找到最佳结合点将成为决定性成分。










