首页 » 科学 » 微软将数万颗芯片串联成一台价格不菲的超级计算机用于OpenAI_微软_人工智能

微软将数万颗芯片串联成一台价格不菲的超级计算机用于OpenAI_微软_人工智能

乖囧猫 2024-12-21 16:39:32 0

扫一扫用手机浏览

文章目录 [+]

OpenAI试图演习一套越来越大的被称为模型的人工智能程序,这些程序正在接管更多的数据,并学习越来越多的参数,即人工智能系统通过演习和再演习而创造的变量。
这意味着OpenAI须要长期利用强大的云打算做事。

为了应对这一寻衅,微软不得不费尽心机将恒河沙数的英伟达的A100图形芯片--演习人工智能模型的主力--串联起来,并改变其在机架上放置做事器的办法以防止断电。
卖力云打算和人工智能的微软实行副总裁Scott Guthrie不愿透露该项目的详细本钱,但他说\"大众可能会大于\公众几亿美元。

微软将数万颗芯片串联成一台价格不菲的超级计算机用于OpenAI_微软_人工智能 科学

这项技能让OpenAI发布了ChatGPT,这一具有强大措辞天赋的谈天机器人在11月上市后几天内就吸引了100多万用户,现在正被拉入其他公司的商业模式,从亿万财主对冲基金创始人Ken Griffin经营的公司到食品配送做事Instacart Inc. 随着ChatGPT等天生型人工智能工具得到企业和消费者的兴趣,微软、亚马逊公司和Alphabet公司旗下的Google等云做事供应商将面临更多压力,以确保其数据中央能够供应所需的巨大打算能力。

现在,微软利用它为OpenAI建立的同一套资源来演习和运行自己的大型人工智能模型,包括上个月推出的新的Bing搜索机器人。
它还将该系统出售给其他客户。
这家软件巨子已经开始动手开拓下一代人工智能超级打算机,这是微软与OpenAI扩大交易的一部分,微软在个中增加了100亿美元的投资。

演习一个大规模的人工智能模型须要像微软组装的人工智能超级打算机那样,在一个地方有一个大型的连接图形处理单元池。
一旦一个模型投入利用,回答用户提出的所有查询--称为推理--须要一个轻微不同的设置。
微软也支配了用于推理的图形芯片,但这些处理器--数十万个--在地理上分散在该公司60多个地区的数据中央中。
现在,该公司正在为人工智能事情负载添加最新的NVIDIA图形芯片--H100--和NVIDIA最新版本的Infiniband网络技能,以更快地分享数据,微软周一在一篇博文中说。

新的必应仍处于预览阶段,微软正在逐步从等待名单中增加更多的用户。
微软的AI团队每天与大约二十几名员工举行会议,他们被称为\公众维修职员\"大众,由于他们是在比赛中调度赛车的机器师。
该小组的事情是弄清楚如何快速上线更多的打算能力,以及办理涌现的问题。

云做事依赖于数以千计的不同部件和物品--做事器、管道、建筑物的混凝土、不同的金属和矿物等各个部分--任何一个部件的延迟或短缺,无论多么眇小,都会使统统都中断。
最近,维修职员不得不处理电缆托架的短缺问题--这种篮子一样的装置用来放置机器上的电缆。
以是他们设计了一种新的电缆盘,微软可以自己生产或找地方购买。
他们还在研究如何在世界各地现有的数据中央中尽可能多地压缩做事器,这样他们就不必等待新的建筑落成。

当OpenAI或微软正在演习一个大型的人工智能模型时,事情在一个韶光段内发生,它被分到所有的GPU上,在某些时候,这些单元之间须要相互交谈,以分享它们所做的事情。
对付人工智能超级打算机,微软必须确保处理所有芯片之间通信的网络设备能够处理这种负载,而且它必须开拓软件,使GPU和网络设备得到最佳利用。
该公司现在已经提出了一个软件,可以让它演习具有几十万亿个参数的模型。

由于所有的机器都是一次性启动的,以是微软必须考虑到它们的放置位置和电源的位置,否则你就会涌现像在厨房里同时打开微波炉、烤面包机和吸尘器一样的过载问题。

Azure环球根本举动步伐总监Alistair Speirs说,该公司还必须确保它能够冷却所有这些机器和芯片,在较风凉的景象下利用外部空气,在酷热的景象下利用更高技能的冷却装置。

微软将连续研究定制的做事器和芯片设计以及优化其供应链的方法,以得到任何速率上的提高、效率和本钱上的节省。

相关文章

快钱代码背后的秘密,科技金融的革新之路

在当今这个科技飞速发展的时代,金融行业也在经历着一场前所未有的变革。而在这场变革中,快钱代码成为了科技金融领域的一颗璀璨明珠,引领...

科学 2024-12-25 阅读0 评论0

快线,智能交通时代的创新力量

随着科技的飞速发展,智能交通系统逐渐成为人们关注的焦点。在众多智能交通技术中,快线系统以其独特的技术优势和应用场景,成为推动智能交...

科学 2024-12-25 阅读0 评论0