作者|八度
编辑|王博
“集成光路将是半导体领域60年一遇的‘换道超车’。”

去年底,在2023环球硬科技创新大会上发布的《光子时期:光子家当发展白皮书》序言的末了一段,有着这样一句话。
光打算芯片在算力、数据传输上的上风毋庸置疑,海内团队的研究成果也时常见诸报端,但一提到规模化商用,不少人仍心存疑虑。2023年,一位从事微纳光子器件科研的研究生在知乎上发帖谈论光打算芯片干系问题时就直白地说:“既然没有商用,肯定是还有很大问题的。”
那么,光打算芯片从论文里走出来了吗?
矩阵规模(算力密度)和单节点光辨识度(算力精度)是衡量光打算芯片性能的关键指标,业内公认的达到商用标准的矩阵规模是128×128,2021年环球范围内有两家企业完成了64×64的光打算芯片流片,此后三年内这个瓶颈一贯没有被打破,有的企业乃至转战了其它赛道。
而在近期举行的2024天下人工智能大会(WAIC)期间,「甲子光年」理解到,海内光打算芯片公司光本位科技已完成首颗算力密度和算力精度均达到商用标准的光打算芯片流片,这颗芯片的矩阵规模为128×128,峰值算力超1700TOPS。
光本位科技研发的矩阵规模为128×128的光打算芯片,图片来源:光本位科技
“我们目前对标的便是英伟达A100,”光本位科技联合创始人程唐盛见告「甲子光年」,“128×128芯片将被制作成板卡,其终极形成的算力将与英伟达的电子芯片产品具有可比性。同时,我们的初代产品功耗大约是它们的十分之一到十五分之一。此外,在延时方面,光打算芯片也会有数量级的降落。”
128×128的矩阵规模,意味着国产光打算芯片离家当化更近一步,而不仅仅是“勾留在纸面上”“只生活在实验室里”。
光本位科技创始人熊胤江表示,公司正在进行128×128光打算板卡调试,估量将于2025年内推出商业化光打算板卡产品,用更高的能效比、更大的算力赋能大模型、AI算力硬件、智算中央、具身智能等家当,同时公司即将完成更大矩阵规模的光打算芯片研发。
“我认为目前可能正处于一个临界点上,”一位关注芯片行业投资人见告「甲子光年」,“大家已经从最初认为光打算芯片完备无法实现的态度,转而认为它有可能实现。”
光打算芯片行业的水温,正在发生变革。
1.“你相信光吗?”
“你相信光吗?”
这一句网络盛行语,也是光打算芯片行业的真实写照。
在过去的50多年里,芯片的算力一贯遵照着摩尔定律持续增长。以往,行业更习气采取的是电芯片算力,但当下电芯片的算力正面临增长瓶颈。
比如,量子隧穿效应限定了晶体管尺寸的进一步缩小;随着性能增长,能量花费和热量积累对芯片的散热提出了更高哀求;旗子暗记延迟,芯片内部传输速率和数据传输瓶颈限定了处理速率;可扩展性问题,现有技能框架下晶体管数量靠近上限。
供给面临瓶颈,而需求仍在增加。摩尔线程创始人兼首席实行官张建中今年5月在「甲子光年」举办的「AI创生时期——2024甲子引力X科技家当新风向」大会上直言:“大多数AI创业公司纵然融到了数十亿或数亿资金,也难以建立算力中央。再加上算力资源的稀缺,使得许多企业心有余而力不敷。包括OpenAI在内的全体行业面临的问题是如何办理算力资源匮乏导致的迭代难题。”
如何破局?光打算芯片供应了一种新的思路。
光打算芯片是光子芯片的一种运用形式,专注于打算任务的光学实现,具有超高速率、超强并行性、超高带宽和超低损耗的特点。
实在几十年来,科学家们对光的探索,从未停滞。在20世纪40年代,傅立叶变换被引入光学中,发展出傅立叶光学。1980年至2004年是光打算的黄金年代,在此期间,科研职员提出了大量光打算技能,包括光学模式识别、逻辑光打算、光学神经网络、光互连和光学全息存储等。
但是,由于对光打算的运用需求和运用处景不清晰,并且缺少与之相匹配的光学硬件体系,此前光打算技能的发展比较缓慢。
近几年,随着人工智能家当的爆发,光打算芯片也进入了快速发展期。
2021年,环球光子产品总及干系做事的估值则高达7万亿美元以上,约占环球天下经济总量的11%。
而现在,光打算作为一个专业涉及面广、理论和技能哀求极高的新兴家当,被视为中国与国际竞争对手站在同一起跑线上,乃至能够实现技能超越的潜在领域。
2.128×128:算力与功耗的双重打破
只管光打算芯片被寄予厚望,但过去很永劫光里,光打算是一项被困在实验室的技能。
2017年,光打算领域涌现了第一篇Nature文章,之后一些公司陆续成立。然而,全体家当链还不足成熟,从封装到电芯片合营方面都没有太多可参考的范例。到了2022年,光本位科技成立的那一年,行业经由五年的发展,技能和家当链逐渐成熟,但光打算芯片还是没有像传统电芯片那样大规模商业化。
熊胤江认为这紧张有两个维度的缘故原由:一是过去光打算芯片本身设计的不成熟,无法与现阶段领先的电方案直接比拟;二是将其落地成产品的家当链不成熟,光电领悟归根到底还是非常有寻衅的工程化事情。
“海内很多高校里的光打算芯片都是3×3或是4×4这种更小规模,一些初创公司,也最多只能做到64×64,这代表它并没有具备商业化能力,还在研发阶段。”峰瑞成本早期项目卖力人李罡见告「甲子光年」。
而这一次,光本位科技的这颗矩阵规模为128×128的光打算芯片成功流片,意味着国产光打算芯片走到了商业化的临界点。
要实现规模化商用,光打算芯片需办理非线性打算、存算一体等难题,无论是科研院所,还是家当界,都认为构建光电领悟生态是一条必经之路。光本位科技基于PCM相变材料实现了存算一体的存内打算,存储单元与打算单元完备领悟,目前已迭代出以光打算芯片为核心的电芯片设计能力,并与海内顶尖封装公司建立深度计策互助,共同开拓前辈光电合封能力。
“128×128矩阵规模可以与谷歌的TPU或是华为的昇腾等采取的架构相媲美。对我们来说,光打算在算力密度和矩阵规模上已经等同于电子打算,这因此前光打算未能实现的,而我们首次做到了。”熊胤江说。
光本位科技的光子存算一体原型机,图片来源:光本位科技
光打算芯片的矩阵规模对应的便是算力。
例如,从64×64矩阵规模提升到128×128矩阵规模,算力至少增加了四倍,但功耗的增加是线性的。
详细来说,在64×64矩阵规模时,芯片配备了64个模数转换器(ADC)和64个数模转换器(DAC)。当矩阵规模到了128×128时,虽然算力提升了四倍,但所需的ADC和DAC数量仅增加到原来的两倍,这意味着算力效率至少提升了一倍。
同时,这款光打算芯片的精度也实现打破,达到了AI推理的标准精度。
更为主要的是,128×128矩阵中的每个单元都是可调的,这使得该芯片成为一个完备通用的平台,能够处理任何类型的AI打算任务,这一点与之前固定权重、只能处理单一运用的其它光打算芯片形成了光鲜比拟。
这样的技能打破并非一挥而就,而是十年技能积累的结晶。
2014年开始,牛津实验室就首创了相变材料与硅光结合的研发,2017年成功研发环球首个光子存算一体芯片。在牛津大学读博士期间,程唐盛师从环球“相变材料光打算”第一人——牛津大学材料系教授、英国皇家工程院院士Harish Bhaskaran,他还主导、参与了牛津大学的相变材料光打算芯片、新型超低功耗纳米相变材料的研发。
程唐盛见告「甲子光年」,从在牛津读博士开始,他多年来一贯动手办理光打算技能在实际运用中的问题,研究如何降落功耗和扩大规模,以期知足人工智能发展等运用对算力的需求。
光本位科技创始团队在光打算领域不断打破。2022年创业,更是“有备而来”。
“从公司成立之初,我们就已经意识到市场上现有的光打算芯片矩阵规模较小,这限定了它们的算力密度和算力规模。因此,从公司成立的第一天起,我们就明确了首先要将矩阵规模从64×64提升至128×128,然后进一步扩展至256×256,以及512×512。”程唐盛见告「甲子光年」。
去年,光本位科技利用前代的光打算芯片,完成了板卡架构的完全运行,包括封装、与电芯片结合,并运行了通用AI网络如ResNet-50等。
今年,光本位科技进一步优化芯片,一方面是提升矩阵规模至128×128,以提高算力密度和算力规模;另一方面,针对每个独立的光器件进行优化、仿真,并进行针对性的流片,以实现全体系统的全面优化。
“我们基本上每三个月到半年会进行一次流片。我认为只有将产品迅速做出来,并且不断迭代,公司才是真正的稳健。”熊胤江说。
这一次128×128光打算芯片,正是由前3次的产品迭代而来。
那么,这样的光打算芯片产品的商用场景在哪里?
3.光打算芯片被谁须要?
对付运用层来说,光打算芯片将为它们供应更高算力和更低功耗的支撑。
更高算力,意味着光打算芯片可以处理更繁芜的模型,更繁芜的模型则可以催生更好的运用;更低功耗,意味着无论是在演习模型时的本钱,还是用户在实际利用时的推理本钱,都会在很大程度上降落。一旦光打算芯片被商用,将是后摩尔时期的一道曙光,形成一种良性循环。
技能运用的每次变革都源于算力的打破。正是算力的提升,人工智能的颠覆性时候才得以涌现。
以是光打算芯片的紧张场景,便是人工智能。“当下人工智能快速发展,这一场景的运用和需求变得非常明确。光打算芯片能够针对当前的大型模型干系运用快速进行适配和优化。”李罡说。
在大模型领域,光打算将帮助下贱客户降落本钱、提高效率。它可以使得未来推理本钱降至现在的千分之一或万分之一,利用户在访问大模型时险些无本钱,从而显著提高大模型公司的毛利率。
算力本钱的降落对付大模型运用落地非常主要,否则企业将不得不每天都头疼开销,从而减小模型规模,降落演习质量。
一位人工智能初创企业的创始人见告「甲子光年」,算力本钱降落会有助于运用产品的发展,“我以为现在大家该当逐渐更加清晰地想明白token是花费越多越好,而不是想办法只管即便做一个节省token的运用。”
同时,光打算芯片算力的大幅提升,也能够为当古人工智能、大数据剖析、自动驾驶等热门技能场景供应强大的动力。
熊胤江先容,在自动驾驶领域,目前L3级别的算力在200-500TOPS,而要达到L5级别,估量须要2000TOPS以上的算力。如果基于现有技能,功耗将在2kW以上,这对付新能源智能驾驶汽车的续航能力是一个寻衅。
因此,必须探求一种低功耗、高算力的办理方案,而光打算芯片,恰好能够知足这一需求。
而对付当下火热的具身智能来说,光打算芯片能够在端侧进行大量打算,并且不须要花费过多能量,使机器人在保持“高智商”的同时,还能进行大量机器操作。
如果具身智能要达到通用人工智能(AGI)的能力和认知力,所需的算力将远超现有水平。光打算芯片的高算力潜力,将使具身智能能够独立思考,乃至可能具备超越人类的思维逻辑和判断能力,这将是光打算技能的终极潜力所在。
不可否认,光打算芯片以其超高速、高能效的特性,未来一定还会催生出全新的算法范式,从而推动全体打算科学领域的进步和创新。
4.“左手钉子、右手锤子”的家当化之路
随着128×128矩阵规模光打算芯片流片,未来两年,将是光打算芯片工程化的关键期间。也便是说,光打算芯片要真正开始接管“真实而繁芜”的场景磨练。
“2025年,将是光本位科技的打破年,届光阴打算芯片将进入商业化元年,光本位科技将与下贱大规模打仗并适配,建立商业互助关系。2026年,光打算芯片有望实现大规模出货。”熊胤江预测。
他见告「甲子光年」,光本位科技的发展遵照T字形计策,纵向上,深入产品周期,从芯片到板卡,再到下贱适配和终极出货。今年下半年电子芯片也会完成流片,团队将进行封装测试,完成2.5D和3D的光电合封,终极将形成光子打算板卡,并交付给客户适配,同时构建软件生态系统。
横向上,光本位科技将拓宽光打算领域的研发壁垒,进行更大矩阵规模的研发,包括但不限于256×256、512×512矩阵规模的光打算芯片研发,并利用波分复用等前辈技能。
“这T字形计策既有纵深,确保产品不是空中楼阁,能够深入到用户层面;同时,也确保我们能够一贯保持研发的领先地位。”熊胤江见告「甲子光年」。
光本位科技的光打算芯片运行事理图,图片来源:光本位科技
光本位科技将研发能力视为“锤子”,将市场需求视为“钉子”。既要技能的不断迭代,也要用户需求的持续反馈。
若要两者在中间相遇,左手市场、右手研发都须要投入。
在科研层面,光本位科技与复旦大学成立了未来打算硬件联合实验室,探索光打算在技能发散期间的所有可能性。
在工程化落地方面,团队集结了仿照、数字、硬件、系统架构和算法等领域资深的“行业老兵”,确保产品能够实现实际的工程化落地。
同时,公司已经与海内家当链中的互助伙伴建立了联系,包括与海内领先的硅光企业联合微电子进行计策互助,以及与海内顶尖的封装测试厂进行2.5D和3D光电封装的前沿研发。
技能打破只是一个拍门砖,接下来对光打算芯片和光本位科技来说,要面临的是家当生态的寻衅。
目前,市场客户普遍利用的是英伟达或其他熟习的GPU,要实现光打算板卡的广泛运用,须要与客户进行适配。“我们努力的方向是确保光打算板卡在硬件上完备兼容现有生态。”程唐盛说。
当然,光打算芯片和电芯片并不是替代关系,而是相互增强。
在初期发展阶段,光打算芯片可能会扮演张量打算核心的角色,赞助传统的电子芯片。鉴于目前电子芯片在市场上的主导地位,光打算芯片将首先承担起人工智能运用中的大量线性运算任务。
但随着客户需求的逐渐丰富,全体软件生态系统随之丰富,各个光打算公司的交付能力也将有所提升。
程唐盛把当下光打算芯片的发展类比于“AlphaGo问世前夕”。与人工智能或电子芯片平台比较,光打算还处于一个较前期的发展阶段。随着效率的提升和生态系统的完善,光打算将逐渐发挥更大的浸染,为智能时期的打算、存储、传输和感知供应强有力的技能支撑。
中科创星创始合资人米磊在2016年曾提出过一个“米70定律”,他认为,光学技能会是未来一项非常关键的根本技能,其本钱会占到未来所有科技产品本钱的70%。但不可否认的是,任何一种技能取得打破,都须要长期的积累和投入,以及更永劫光的转化和落地。
人类自出身以来就沾恩于光,而光也将为人工智能创造更多可能。
参考资料:
《27岁融资超亿元!
95后海归创业者进军光打算芯片》,甲子苏州
(封面图来源:「甲子光年」利用AI工具天生)