首页 » 科学 » 颠覆GPU、打倒英伟达!深扒12家AI芯片独角兽_芯片_公司

颠覆GPU、打倒英伟达!深扒12家AI芯片独角兽_芯片_公司

萌界大人物 2025-01-19 08:56:14 0

扫一扫用手机浏览

文章目录 [+]

没有哪家芯片公司不眼红英伟达的地位,随着AI家当的蛋糕越做越大,硬件赛道也肉眼可见得拥挤起来。
大量初创公司正试图流向英伟达GPU的预算里分一杯羹。

媒体汇总了目前处于竞争最前哨的12家公司。
这些初创企业均匀历史只有五年,融资额度最高的已有7.2亿美元,它们都是英伟达的有力寻衅者。

颠覆GPU、打倒英伟达!深扒12家AI芯片独角兽_芯片_公司 颠覆GPU、打倒英伟达!深扒12家AI芯片独角兽_芯片_公司 科学

Cerebras

成立韶光:2015

颠覆GPU、打倒英伟达!深扒12家AI芯片独角兽_芯片_公司 颠覆GPU、打倒英伟达!深扒12家AI芯片独角兽_芯片_公司 科学
(图片来自网络侵删)

运用领域:演习

Cerebras以制造巨型芯片有名。
由Gary Lauterbach和Andrew Feldman联合创立。
两人还曾经联合创办专注于超高密度打算机做事器业务的公司Seammicro,在2012年被AMD以高达3.57亿美元的价格收购。

Cerebras的紧张产品是可用于AI演习的超级打算机芯片和系统,专为超级打算任务而构建,此类芯片的大小约为普通GPU的56倍。

Cerebras的客户集中于国防、学术实验室等机构。
旗舰产品CS-2超算系统已经支配在美国能源部阿贡国家实验室、匹兹堡超算中央、爱丁堡大学超算中央等地。

不过,虽然已经得到高达7亿美元的融资,但受制于英伟达GPU和CUDA生态的主导地位,Cerebras在争取商业客户方面面临着艰巨的寻衅。

1月份,公司宣告将与美国顶尖医疗机构梅奥诊所互助,梅奥诊所将利用Cerebras的打算芯片和软件,以数十年的匿名医疗记录和数据为根本,开拓专有AI模型。

据宣布,一些模型将能够读写文本,比如为新病人总结病历中最主要的部分。
其他模型可以剖析繁芜的医学图片或剖析基因组数据。

Cerebras首席实行官Andrew Feldman称,这是一项为期数年、代价“数百万美元”的协议。

d-Matrix

成立韶光: 2019

运用领域:推理

创办于2019年的d-Matrix正在开拓一种专用芯片和软件,用于运行机器学习模型,公司的芯片可以处理和内存结合在一起,而处理和内存常日是芯片上独立和不同的组件。

d-Matrix的芯片产生的热量更少,因此须要的冷却也更少,因此比主流的GPU和CPU芯片更具本钱效益。
公司CEO表示,许多公司都希望利用大模型设计AI运用,本钱非常主要。

d-Matrix选择专注于推理,即运行AI模型,而非演习。
公司认为,随着韶光的推移,模型会越来越大,运行本钱也会越来越高。
公司已有客户在测试其芯片和软件,并操持在24年上半年将投入商用。

Etched

成立韶光:2023

运用领域:推理

Etched由两位哈佛辍学生Gavin Uberti和Chris Zhu于去年6月创立,公司操持生产一款名为Sohu的AI推理加速芯片,推理性能为H100的10倍。
公司成立不久后估值即达到3400万美元。

据宣布,在制作工艺上,Sohu采取将变压器架构直接刻芯片核心的革命性方法。
因此性能可以达到前所未有的高度,与传统GPU比较,Sohu在仿照中运行大模型的速率要快140倍。
Sohu还支持通过树搜索更好地编码,能够并行比较数百个相应,同时还能进行多重推测解码(Multicast speculative decoding),可以实时天生新的内容。

Etched的博客称,这种架构将许可以无与伦比的效率运行万亿参数模型。
该系统只有一个内核,可容纳完备开源的软件堆栈,可扩展至100T参数模型。

Extropic

成立韶光:2022

运用领域:推理&演习

Extropic是这几家初创公司里最神秘的那个。
公司创始人出身谷歌专注前沿技能探索的“登月工厂”部门“X”。
据先容,Extropic专注于量子打算,同时操持开拓一款专门用于运行大模型的芯片,但目前仍未有任何关于详细产品的细节曝出。

去年年底,公司刚刚完成1410万美元的种子轮融资。

根据公司的新闻稿,随着天生式人工智能的兴起,天下对可扩展、高本钱效益和高效打算的需求急剧增加,Extropic希望在未来,让打算机把熵作为一种资产加以利用,通过编程自我学习,并以前所未有的效率运行:

Extropic的打算范式建立在热力学事理之上,旨在将天生式人工智能与天下的基本物理学无缝领悟。
我们的目标是将天生式人工智能终极嵌入物理过程,打破物理定律在空间、韶光和能量方面规定的效率极限。

Groq

成立韶光:2016

运用领域:推理

Graphcore成立于2016年,总部位于英国布里斯托尔。
公司紧张产品的智能处理单元(LPU),且聚焦于大模型推理。

公司产品最大的特点便是极快的天生速率,可以确保流畅的终端体验。
在消费类AIGC运用中,用户对速率哀求很高,而Groq LPU搭配开源模型Meta Llama 2 70B可以实现每秒天生300个单词,在7分钟内就能天生与莎士比亚的《哈姆雷特》相同数量的单词,这比普通人的打字速率快75倍。

Groq联合创始人兼首席实行官Jonathan Ross认为,对付在产品中利用人工智能的公司来说,推理本钱正在成为一个问题,由于随着利用这些产品的客户数量增加,运行模型的本钱也在迅速增加。
与英伟达GPU比较,Groq LPU集群将为大模型推理供应更高的吞吐量、更低的延迟和更低的本钱。

此外,受制于HBM3和CoWoS封装的产能,英伟达GPU目前的产能无法完备知足客户需求,而Groq LPU的独特之处在于,它不依赖于三星或海力士的HBM,也不依赖于台积电的CoWoS封装技能,因此不会面临类似英伟达那样的产能瓶颈。

Lightmatter

成立韶光:2017

运用领域:演习&推理

Lightmatter利用激光器发出的光在芯片和做事器群之间传输数据,公司由麻省理工学院的学生利用该校的专利技能创立。

据公司联合创始人兼首席实行官Nicholas Harris先容,与英伟达、AMD和英特尔等通过线缆传输数据的芯片厂商比较,Lightmatter的产品可以让数据中央的能耗本钱降落约80%。

MatX

成立韶光:2022

运用领域:未公布

MatX由前谷歌员工创办,首席实行官Reiner Pope为谷歌Pathways大模型的开拓者之一,首席技能官Mike Gunter则是谷歌TPU的研发职员之一。

MatX正在开拓用于文本运用的LLM专用芯片。
公司表示,与英伟达GPU硬件比较,其自研芯片的运行速率更快,本钱更低,可支持包括图像天生在内的多种人工智能运用。

MatX称,公司已经得到几家风险投资公司的支持,但未表露详细的资金,还称已得到“著名大模型开拓商的大力支持”,但也未表露详细公司。

Modular

成立韶光:2022

运用领域::推理;今年开始涉足演习

Modular专注于打造用于演习和运行大模型的开拓平台和编码措辞,用户可在该平台上利用各种AI工具,包括谷歌开源软件TensorFlow和Meta的开源软件PyTorch。

公司认为,AI开拓如今面临受到过于繁芜和分散的技能根本举动步伐的阻碍,Modulal的义务是肃清大规模构建和掩护AI系统的繁芜性。

构建和运行人工智能运用程序须要大量的打算能力,为掌握本钱,一家公司可能会利用不同类型的AI芯片,但这些芯片的软件每每互不兼容。
尤其是,英伟达用于编写机器学习运用程序的Cuda软件只能在自家芯片上运行,这基本年夜将开拓者锁定在其GPU上。
Cuda的用户粘性极强,有宣布称,一家打算机视觉初创公司花了两年韶光才得以改用非英伟达芯片。

Modular希望通过开拓一种Cuda替代方案来改变这种状况,办理不同芯片的软件兼容性问题,让利用非英伟达芯片变得更随意马虎。

Rain AI

成立韶光:2017

运用领域:推理&微调

传统GPU的演习和推理过程须要花费产生高昂本钱,这部分本钱部分源于这些芯片在从内存和处理部件传输数据时产生的热量,因此,GPU须要持续冷却,从而增加了数据中央的电力本钱。

而Rain AI的NPU芯片可以仿照人类的生物大脑,将内存和处理功能结合在一起,不仅在打算速率和能效方面表现出色,还可以根据周围环境实时定制或微调人工智能模型。
不过公司目前还没有生产出成品。

据媒体宣布,一份2019年签订的意向书显示,OpenAI操持斥资5100万美元购买Rain AI NPU芯片,这些芯片将被用于GPT模型的演习和支配。

Sima.ai

成立韶光:2018

运用领域:推理

Sima.ai专注于为边缘打算设备开拓硬件和软件,运用于飞机、无人机、汽车和医疗设备等场景,而非数据中央。

公司创始人Krishna Rangasayee曾在芯片制造商赛灵思(Xilinx)事情近二十年。
此前,在接管媒体采访时,他表示,许多行业由于各类缘故原由无法利用基于云的AI做事,Sima.ai将专注于做事那些去中央化的边缘打算设备。

例如,自动驾驶汽车须要即时做出决策,只有内置的AI才能知足其对延迟的苛刻哀求。
而在医疗保健等行业,公司可能不肯望将敏感数据发送到云端,而希望将其保存在设备中。

2023年6月,Sima.ai表示已开始量产其第一代边缘人工智能芯片。
公司表示,正在与制造业、汽车和航空等领域的50多家客户互助。

Tenstorrent

成立韶光:2016

运用领域:演习&推理

Tenstorrent由三位前AMD员工创办,总部位于加拿大多伦多。

Tenstorrent以异构和Chiplet设计的形式来开拓RISC-V和AI芯片。
目前已经开拓出基于12nm工艺的Grayskull和Wormhole两款芯片,FP8算力高达328TFlops。
公司的目标是把价格压到类似性能GPU的1/5到1/10。

2021年,Tenstorrent还推出了DevCloud,可以让AI开拓职员无需购买硬件即可运行大模型。

不过,最近几年,大概是感想熏染到了英伟达等硬件厂商的压力,Tenstorrent将重心转移到了技能容许和做事领域。

Tiny Corp

成立韶光:2022

运用领域:演习&推理

Tiny Corp由自动驾驶初创公司Comma AI的创始人和前首席实行官George Hotz创办,其产品将以名为tinygrad的开源深度学习工具打造,据悉可帮助开拓职员加快演习和运行大措辞模型。

Hotz认为,tinygrad可以成为Pytorch(源自Meta的深度学习产品)的“有力竞争者”。
但目前他还没有透露关于产品的详细细节。

本文来自华尔街见闻,欢迎下载APP查看更多

标签:

相关文章