盘点GPU业界的大年夜佬—零根本入门GPU芯片设计_英伟_技巧

文章目录 [+]

姓名：黄仁勋

（Jensen Huang）

盘点GPU业界的大年夜佬—零根本入门GPU芯片设计_英伟_技巧智能

国别：美籍华人，祖籍浙江

紧张履历：

于1963年2月17在中国台湾省台北市出生，1972年与家人迁往美国，后来被送往美国肯塔基州一间基督传授教化校就读，完成课程后迁往俄勒冈州。
15岁时参加美国乒乓球公开赛，在青年组双打赛事中夺得季军。

1984年于俄勒冈州立大学取得电气工程学位，其后在斯坦福大学取得硕士学位。

黄仁勋曾在AMD（1983年-1985年）担当一名芯片设计师，这为他后来创办NVIDIA打下了最初的技能根本。

LSI Logic（1985年-1993年）事情，这也是一家芯片公司，但主打业务并不是CPU，而比较方向于芯片的图形处理。
他在设计部门待了两年后就哀求调到发卖部门，并终极成为集成芯片（类似于本日的SOC，即一块芯片上集成多重功能）部门的总经理。

1993年创立NVIDIA（环球最大显卡芯片厂商）。
黄仁勋是圈子里有名的事情狂，他曾经阐明自己为何如此狂热：为了我们的孩子们，让他们的将来更好一些。

当前事情机构和职务：

NVIDIA公司创始人兼首席实行官，硅谷最具影响力的华人企业家被业内称为“AI教父”。

代表性成果：

提出了和摩尔定律并称的显卡芯片领域的“黄氏定律”，即显卡芯片每6个月性能提升一倍。

1997年，推出了NV3（N1和N2都失落败了），即Riva 128，并大胆采取当时仍处于试验阶段的AGP观点。
这是环球第一款具有3D加速能力的AGP显卡，一经推出后，随即引发市场关注。
Riva 128上市四个月销量就达100万片。
紧接着，黄仁勋又推出大略升级版Riva 128zx，也便是我们熟知的小影霸。

1998年10月，推出了NVIDIA第四代产品——TNT，从此一举霸占了显卡芯片市场的主流位置，把所有的竞争对手都挤到边缘领域。
TNT是一种炸药的名字，而黄仁勋的TNT也果如其名，成为图形芯片行业的一枚重磅炸药，响彻云霄，被称为超级显卡，性能比3dfx同期推出的Voodoo2强很多。

半年后，还没等3dfx回过神来，黄仁勋又带领NVIDIA推出更强大的TNT2，性能再次秒杀Voodoo系列，彻底奠定了NVIDIA的高端地位。

推出全新架构的显示芯片——GeForce256，作为环球首款GPU，GeForce 256的涌现改变了传统图形芯片的格局，率先将显示芯片业带入GPU时期。

经由20+年景长，NVIDIA逐渐形成GeForce、Quadro、Tesla、Tegra等几大产品线；

个中GeForce用于传统PC；Tegra用于移动产品；

Quadro用于事情站；

Tesla用于大型打算。

（二）

王启尚（David Wang）

国别：台裔美国人

紧张履历：

王启尚1986年毕业于台湾交通大学，后留美在华盛顿大学取得了电子工程硕士学位，硕士论文是有关图形处理的硬件技能。

1990年毕业后来到了LSI Logic任职芯片设计工程师，卖力开拓SPARC(可扩充处理器架构)系统芯片，在此期间节制了丰富的芯片开拓履历。

2012年，他被评为台湾交通大学精彩校友。

两年后入职Axil WorkstATIons公司，担当高等芯片设计工程师，职务内容同样是开拓SPARC芯片，并且有了自己的团队。

出于对芯片发展趋势的独到把握，1993年，王启尚正式入职大名鼎鼎的SGI(Silicon Graphics)公司，从芯片设计职员转型为芯片设计经理，卖力Infinity Reality超级3D图形加速器的开拓事情。

王启尚1998年离开SGI，并参与建立ArtX公司，连续担当芯片设计经理的职务，负任务天国第四代家用机Game Cube的SOC的开拓事情。

2000年，ATI公司以代价4亿美元的股票选择权正式收购ArtX公司，王启尚也加入ATI公司，这一干便是12年，从芯片经理升职为高等经理（2006年AMD以54亿美元并购ATI后，王启尚也一同加入了AMD），末了成为AMD公司的环球副总裁。

在他的领导下，AMD/ATI成功地开拓了八代的产品，从0.15μm一贯到28nm的制程，其在全体研发过程中起到了不可或缺的浸染。

当前事情机构和职务：

AMD Radeon 技能奇迹部工程研发高等副总裁；

卖力 AMD Radeon 技能奇迹部的工程研发。

他的职责范围涵盖 AMD 显卡工程研发的方方面面，包括 AMD 显卡产品和技能的计策、架构、硬件和软件。

代表性成果：

帮助ATI发展为行业领头羊，ATI的R300架构正式问世，首发产品为环球首块支持DirectX 9.0的显卡——Radeon 9700 PRO。

王启尚在R300的架构设计事情中起到了至关主要的浸染。

从Radeon X1000到Radeon HD 7000系列的每一款AMD GPU的研发事情均凝聚着他的汗水，他用丰富的履历引领AMD的GPU走向GCN时期。

作为AMD公司图形卡产品部高等总监，其不仅参与设计了R600这样出色的架构，还是超微公司AMD“Fusion”观点的提出人之一，也便是说将CPU和GPU合二为一，让具备不同特性的两种芯片相互协作，而这正是AMD APU的观点雏形。

作为AMD环球绘图产品奇迹部硅体工程部副总裁时，主导研发了Radeon HD 5000系列。

除了桌面及条记本级的GPU产品，王启尚还参与了Wii U、PS4、XBOX ONE等次世代主机定制化GPU的开拓，还有前面提到的AMD“融聚未来”的APU的开拓事情。

成功推进了从0.15μm一贯到28nm八代芯片的工艺转换。

在AMD(ATI)浩瀚GPU产品的研发中起到了不可替代的领导浸染，尤其是RDNA系列GPU架构，以超高能效而有名。

Chiplet架构，一条精确的道路

从CPU到GPU，Chiplet技能让AMD窥到了些许未来芯片发展道路的曙光，显然AMD还准备一贯坚持走下去。
从RDNA 3架构产品目前表现出来的性能来看，Chiplet或许真的是一条精确的道路。

王启尚先容道：“Chiplet架构让我们能够选择用更精确的制程工艺去完成适当的事情，比如我们把比较昂贵的5nm用在打算核心引擎当中，这样就可以实现非常出色的每瓦性能，然后我们用比较成熟的6nm制程来打造I/O和我们的Infinity Cache高速缓存，我们可以说Chiplet设计可以为每种价位上的产品实现更强的性能。
”在我们看来，这也是从Chiplet架构上来看，这一设计最大的上风所在。

（三）

姓名：Joshua Friedrich

（约书亚·费德里奇）

国别：美国

紧张履历：

1995年—1999年，在美国德克萨斯大学奥斯汀分校得到电气与电子工程学士学位。

1999年—2019年12月，一贯在 IBM 的 Power 做事器处理器领域上事情了 20 多年，担当Power处理器技能总监。

2020年1月，入职AMD，在从 IBM 离职前，Joshua 仍在开拓未来的 POWER 设计。

在加盟 AMD 之后，他卖力 CPU / GPU 集成技能。

换言之，Joshua 可以将丰富的履历注入 APU 或其它独特的产品，在平台 / 办理方案上创造出更具差异化的产品。

当前事情事情机构和职务：

目前担当AMD公司副总裁，紧张卖力推动 AMD 集成 CPU 和 GPU 技能方法

代表性成果：

主导开拓了当前TOP500第一超算Summit利用的处理器Power9（POWER9 的观点 / 高等设计和非核心方面的开拓事情）

卖力过 POWER5 的时钟门控

POWER6 的频率引线

POWER7 的芯片电源引线

POWER8 芯片电路

（四）

姓名：Mark Papermaster

（马克·帕佩马斯特）

国别：美国

紧张履历：

Papermaster拥有奥斯汀德克萨斯州大学电机工程学士学位，以及佛蒙特大学电机工程硕士学位。
他目前是德克萨斯州大学科克雷尔工程学院咨询委员会成员以及青少年糖尿病研究基金会IT咨询委员会委员。

1982年9月—2008年10月（26年2个月），曾担当多个高等领导职务（包括副总裁），加入公司的技能领导团队并主管公司主要微处理器和刀片做事器技能的研发事情，领导了 IBM 企业级和 HPC 系统中利用的多代 System z 和 Power 处理器的开拓。

2008年11月—2010年8月（1年10个月），Papermaster 在苹果公司担当设备硬件工程部高等副总裁，卖力研发苹果的处理器和系统级芯片。

2010年11月—2011年10月（1年），就职于思科公司，担当硅工程副总裁，带领团队卖力公司交流与路由业务中的硅技能计策、体系构造和开拓等事务。

2011年10月—2019年1月（7年4个月），担当首席技能官兼技能与工程高等副总裁。

当前事情事情机构和职务：

2019年1月—至今，担当AMD公司的首席技能官和技能与工程实行副总裁。
卖力公司的技能方向和产品开拓，包括微处理器设计、I/O和内存、系统级芯片(SOC)方法论，以及高等技能研究。

代表性成果：

领导团队重新设计了 AMD 的工程研发流程；

将异构打算、chiplets设计、模块化设计方法 Infinity Fabric融入到新的处理器设计当中；

成功开拓出广受赞誉的 “Zen”架构高性能 x86 CPU 系列产品、高性能GPU。

Zen 3架构的主导者。

（五）

姓名：Chris Malachowsky（克里斯·马拉科夫斯基）

国别：美国

紧张履历：

出生于 1958 年，1983 年毕业于佛罗里达大学电气工程专业；1986 年得到圣克拉拉大学硕士学位。

两家高校均为 Malachowsky 颁发了精彩校友奖。
他是集成电路设计和方法学领域的公认威信，已得到 25项美国专利。

Chris 职业生涯早期，曾在惠普和 Sun Microsystems（太阳打算机系统，已于2009 年被甲骨文收购）事情，担当工程和技能领导职务。

1993 年参与创办了 NVIDIA（同为创办人的还有普雷艾姆，当时他是首席技能官，推出了N1和N2，但是效果都不理想，后来被CEO换下来了），拥有 30 余年的行业履历。
他是高管团队的成员之一，也是公司的技能高管。

当前事情机构和职务：

联合创始人兼高等副总裁兼NVIDIA院士

代表性成果：

发明了图形处理单元（GPU），通过创建面向消费者的 3D 图形市场改变了视觉打算行业。

作为集成电路设计和方法学方面公认的威信，Malachowsky 的事情推动了环球打算机图形行业的发展。

拥有35项美国专利。

2020年7 月 21 日，佛罗里达大学宣告，与英伟达建立公私互助伙伴关系，为学生、教职员工和研究职员供应最强大的 AI 演习和工具，打造环球高校最快 AI 超级打算机。

幕后金主，正是英伟达联合创始人、佛罗里达大学校友 Chris Malachowsky。

佛罗里达大学表示，此举将增强学校的研究实力，以应对天下上一些最严厉的寻衅，为弱势群体创造前所未有的人工智能培训和工具，并为改变劳动力的未来供应动力。

投 7000 万美金，力求高校最快 AI 超算

这次互助，佛罗里达大学共得到了 7000 万美元的投资。

个中，Chris Malachowsky捐赠的 2500 万美元；

以及英伟达捐赠的 2500 万美元的硬件、软件、培训和做事；

其余还有校方 2000 万美元的投资。

佛罗里达大学将用这些资金，创建一个以 AI 为中央的数据中央，力争成为环球高档教诲院校中，速率最快的 AI 超级打算机。

佛罗里达大学也自此成为美国第一所采取 DGX A100 的高档院校。

此外，校方还承诺，将雇用 100 名专注于人工智能的教职员工，他们将把 AI 融入传授教化和研究中。

这次三方联手斥巨资打造的第三代 HiPerGator，将利用英伟达最前辈的 AI 软件；并将 140 个英伟达 DGX A100 系统与 1120 个英伟达 A100 Tensor Core GPU 和高性能英伟达 Mellanox HDR 200Gb / s InfiniBand 网络集成在一起。

可供应 700 petaFLOPS 的 AI 性能。

如此高性能的 HiperGator，将为佛罗里达大学校内外的教职员工供应可用于各个领域的 AI 工具，这些领域包括但不限于海平面上升、人口老龄化、数据安全、个性化医疗、城市交通和粮食不屈安等。

这些年来，英伟达从一家初创公司发展为视觉和并行打算领域的环球领导者，Chris 功不可没。

他在管理、定义和推动公司核心技能方面，发挥了主要浸染。

作为英伟达高管，他领导了许多职能，包括 IT，运营和公司产品工程的各个方面。
最近，他卖力英伟达的一个研究机构，该组织卖力开拓计策技能，以帮助推动公司的未来发展和成功。

除了他的技能造诣外，他还很有艺术细胞。

2009 年，他凭借自己帮忙制作的影片《Inheritance》（《继续》）得到了艾美奖，该影片还得到 2009 年最佳记录片奖。

如今，65岁的 Chris 奇迹有成，但不忘母校昔日培养之恩，大方回报母校，不愧为精彩校友。

（六）

姓名： Bill Dally

国别：美国

紧张履历：

Bill Dally得到弗吉尼亚理工大学电气工程学士学位、斯坦福大学电气工程硕士学位和加州理工大学打算机科学博士学位。

他是Velio Communications和流处理器的联合创始人。

曾于1986年至1997年在麻省理工学院事情。

在那里他和他的团队建造了J-Machine和M-Machine，这是一个实验性并行打算机系统，首创了将机制与编程模型分离的先河，并展示了非常低的开销同步和通信机制。

1983年至1986年，他在加州理工学院（CalTech）事情，设计了MOSIM仿照引擎和Torus路由芯片，首创了“虫洞”路由和虚拟通道流量掌握的先河。

他是美国国家工程院院士、美国艺术与科学院院士、IEEE和ACM院士，并得到ACM Eckert Mauchly奖、IEEE Seymour Cray奖和ACM Maurice Wilkes奖。

他揭橥了200多篇论文，拥有75多项专利，著有2本教科书。

Dally于2009年加入英伟达，此前他担当斯坦福大学打算机科学系主任，致力于数据科学、人工智能和图形学的研究，拥有120多项专利。

当前事情机构和职务：

美国国家工程院院士、美国英伟达（NVIDIA）公司环球副总裁、首席科学家

代表性成果：

揭橥了200多篇论文，拥有75项专利，著有2本教科书。

Dally和他的斯坦福团队开拓了当本年夜多数大型并行打算机中的系统架构、网络架构、信令、路由和同步技能。

在麻省理工学院事情时，和他的团队建造了J-Machine和M-Machine。

设计了MOSIM仿照引擎和Torus路由芯片。

流处理器：Dally是流处理器的创始人之一，并在该领域的研究方面取得了巨大造诣。
流处理器是一种分外的打算机处理器，用于高效处理大量数据。

网络设计：Dally在网络设计方面也取得了巨大造诣，特殊是在打算机网络设计方面。

他设计了许多用于高效数据传输的网络架构，包括：数据中央、云打算和移动打算等运用。

超级打算机系统：Dally还在超级打算机系统方面取得了巨大造诣。
他设计了许多用于超级打算机的硬件和软件系统，并对其进行了优化。

英伟达首席科学家Bill Dally在一年一度的中国GPU技能大会召开前表示，GPU让人工智能（AI）的性能每年都能成倍提升，英伟达的研究职员正在定义如何在具有更高带宽、更易于编程的系统中制造更快AI芯片的方法。

利用GPU的加速处理技能，AI正在医疗、自动驾驶汽车和机器人等多个行业的特定领域平台发挥巨大浸染。

英伟达也在不断进行根本研究的投入，以寻求芯片物理极限的打破，让AI的性能得到进一步的提升。

“我们的平台正在以光速发展，（GPU）每10年的速率就能增加1000倍。
技能的提升离不开根本研究的投入。
”

Dally认为，要让芯片技能打破物理极限，就必须进行架构上的改进。

Dally于2009年加入英伟达，此前他担当斯坦福大学打算机科学系主任，致力于数据科学、人工智能和图形学的研究，拥有120多项专利。

他目前领导着英伟达一个200多人的科学研究团队。

在2020年的英伟达GTC大会中，Dally操持重点谈论英伟达如何在GPU上实现高效的推理加速器，硅光子学（silicon photonics）和Python编程等项目。

Dally所说的的硅光子学，是一种基于硅片的激光技能，能够更广泛地运用于打算机中，通过采取大规模硅基制造技能，能大幅度降落打算机和数据中央的本钱。
英特尔和加州大学圣芭芭拉分校正研究职员此前已经成功研发出了天下上首个采取标准硅工艺制造的电力稠浊硅激光器。

该技能离商品化仍有很长间隔，但研究职员相信，未来他们能够将数十个乃至数百个稠浊硅激光器，与其他硅光子学部件一起被集成到单一硅基芯片上。

目前由GPU支持的超级打算机已被广泛用于药物创造、基因组学以及生物学等领域。

环球速率最快的超级打算机Summit已经能够在12小时内筛选出10亿种潜在药物组合，这在正常的打算机上要花上几个月的韶光；基因测序公司牛津纳米孔（Nanopore）能在7小时内对病毒基因组进行测序；美国国立卫生研究院和德克萨斯大学奥斯汀分校利用GPU加速软件，通过低温电子显微镜重修了病毒蛋白的第一个3D构造。

英伟达还通过开拓基于GPU的量子仿照器来支持量子打算机的发展。

“我们认为，量子打算机步入实际的商业化运用可能还须要10年至15年韶光，英伟达正在密切关注干系领域技能的发展，并会在适当的机遇进行投资。
”Dally表示。

针对量子打算机的运用前景，Dally认为，最先干系的运用可能是量子化学领域。

“由于它能最直接地映射到架构上。
”他说道。
但他同时表示，量子打算机实质上来说是一种“大型打算和小型数据的技能”。
“它永久无法用来办理大数据的问题。
”

目前大规模的搜索和机器学习问题是通过大量的、并行的、专用的GPU来办理的。

根据波士顿咨询（BCG）参考英伟达的古迹预测，到2030年，量子打算取代基于GPU的算法运用规模将超过200亿美元，个中化学、材料科学等科技密集型家当的规模将达70亿美元。

量子打算目前的紧张参与者包括IBM、谷歌、DWave，以及英特尔、微软、麻省理工、耶鲁、牛津、加州圣芭芭拉大学等。

英伟达首席科学家 Bill Dally 所描述的“后摩尔定律时期打算机性能如何实现的构造性转变”紧张基于人类的聪明才智。

这一特色彷佛难以建立一条定律，但 Dally 认为，下面的图表标志着“黄氏定律”的开始。

“黄氏定律”并非英伟达自己的创始说法。
IEEE Spectrum 第一个提出以黄仁勋命名定律，“黄氏定律”后来因《华尔街日报》的一篇专栏而广为人知。

根据 Dally 最近在 Hot Chips 2023 会议上的演讲，上图显示过去十年 GPU AI 推理性能增长了 1000 倍。

Dally 表示，有趣的是，与摩尔定律不同，工艺缩小对黄氏定律的进展险些没有影响。

Dally 回顾起如何通过改变英伟达 GPU 底层数字处理来实现 16 倍的增长。
利用Transformer 引擎的 Nvidia Hopper 架构的到来带来了另一个巨大的推动。

据称，Hopper 利用 8 位和 16 位浮点与整数数学的动态组合，实现了 12.5 倍的性能飞跃，并且节省了能源。

（七）

姓名：Michael Kagan

国别：以色列

紧张履历：

拥有以色列理工学院电气工程理学学士学位

1983 年 8 月—1999 年 4 月，Kagan在英特尔公司担当过多个架构和设计职位。

在英特尔公司事情期间，Kagan 在 1993 年 3 月至 1996 年 6 月期间卖力管理奔驰 MMX 设计。

从 1996 年 7 月到 1999 年 4 月，他卖力管理 Basic PC 产品组的架构团队。

1999年，Kagan的奇迹开启了新篇章，他受Eyal Waldman的约请共同创立了Mellanox。

通过为超级打算机供应超快的通信技能一举将Mellanox打造成天下上最成功的以色列公司之一。

2019年，NVIDIA收购Mellanox（被称为以色列版“华为”，拥有RDMA技能），作为该公司CTO兼联合创始人的Kagan由此加入NVIDIA 并担当首席技能官。

当前事情机构和职务：

NVIDIA首席技能官，卖力跨技能架构

代表性成果：

他领导了多个处理器开拓团队并且设计了著名的i860XP处理器

奔驰 MMX 设计

Basic PC 产品

身为英伟达公司CTO，Kagan阐明了AI打算需求如何推动半导体技能打破摩尔定律的边界。

英伟达正积极拥抱一种新的打算范式，利用大规模并行打算机系统为新一代运用程序供应做事。

而这场变革的开端，紧张始于以色列。

NVIDIA CTO Michael Kagan指出：

“虽然打算元件随着发展而尺寸愈小，但21世纪的打算设备本体却向着大小两极延伸——小至智好手表、大至超大规模数据中央。
”

“数据中央本身就相称于一台打算机，而英伟达正在建立数据中央架构。
我们正在打造险些统统的必要元素，包括调度芯片、框架乃至运用程序，以便让这台21世纪机器上的统统都高效实行。
”

Kagan居住在以色列海法区，三年前经由Mellanox Technologies收购案正式加入英伟达，目前担当公司CTO。

英伟达创始人兼CEO黄仁勋对Kagan寄予厚望，任命他督导统统系统架构事宜。

超越摩尔定律

著名的摩尔定律，源自戈登·摩尔 (Gordon Moore) 1965 年撰写的一篇论文《在集成电路上塞入更多元件》。

这位后来担当英特尔CEO的技能先驱在文中预测，随着技能与经济的双重驱动，未来半导体行业每年都将在同样大小的空间内将晶体管的支配数量翻倍，而且这种情形将持续10年。

他的不雅观察和总结后来被称为摩尔定律，且10年后稍做修正就连续适用。

1975年，摩尔表示发展的速率将变成约每两年翻一番。

他还提到，在可预见的未来，这样的情形将一贯持续下去。

直到2005年旁边，芯片制造商都始终保持着这样的发展速率，但之后情形开始变革——无论是在经济还是在物理特性上，各晶体管元件间的间隔已经太小，每过两年将相同空间内的晶体管数量增加一倍将难以实现。

为此，芯片制造商想出了各种办法来提高算力水平。

其一便是增加核心数量，另一种则是用网络替代随意马虎引发性能瓶颈的共享总线，将不同组件间直接互连以改进多芯片/处理器和内存之间的通信能力。

半导系统编制造商还发明了其他提升打算能力的新方法，包括研究算法、加速器和新的数据处理办法。

加速器是一类专用组件（常日采纳芯片形式），能够以极快速率实行特界说务。
一旦系统碰着此类任务，就会将其交由加速器处理，从而实现整体性能提升。

厂商们还特殊关注人工智能（AI）。

与打算机行业惯用的冯·诺依曼架构比较，AI用例中的数据处理办法可谓截然不同。

Kagan阐明称，“AI基于神经网络，这是一种与冯·诺依曼架构大相径庭的数据处理办法。

冯·诺依曼架构的实质，是一种实行指令、查当作果、再决定下一步做什么的串行机器。
”

“而处理数据的神经网络模型则受到人脑研究的启示。
向神经网络供应数据，它就会从中学习。
其事情事理类似于向三岁的小孩展示狗和猫，终极让对方学会区分这两者。
在神经网络的帮助下，我们得以办理浩瀚以往在冯·诺依曼架构上不知该如何处理的问题。
”

AI与数字孪生等新型运用也加快了对付打算性能的需求，新需求自然须要搭配新的范式。

以往，软件开拓只须要很少算力，紧张算力需求都集中在程序的运行过程上。

比较之下，AI则须要大量算力来演习神经网络，但演习完成之后的运行本钱却要低得多。

单个GPU或CPU都不敷以演习大型AI模型。

例如，ChatGPT的演习就须要利用约1万个GPU。

所有GPU并行事情，彼此之间也自然须要相互通信。
除了大规模并行处理之外，新的打算范式还哀求利用新型专用芯片，名为数据处理单元（DPU）。

黄氏定律

Kagan谈到，“2003年时，天下上最快的打算机器是Earth-Simulator地球仿照器，性能为每秒万亿次浮点运算。
而当今最快的打算机是Frontier，运算速率已经达成百亿亿级别，是当初的100万倍。
是的，20年间从万亿级提升到了百亿亿级。
”

他补充道，“在1983年至2003年这20年间，打算性能则提高了数千倍。

从数千倍到数百万倍，这种打算性能的飞跃便是很多人说的「黄氏定律」。
即我们英伟达CEO黄仁勋不雅观察到的，GPU加速打算性能每隔一年就会翻一番。
”

“事实上，算力的增长速率还不止每年倍增。
现在我们谈论的是AI事情负载和数据处理的新方法。

如果把目光转向这一代英伟达Hopper GPU上运行的运用程序，就会创造与上代Ampere比较，速率的增幅超过了20倍。
”

Kagan表示，这种打算速率的提升紧张源自算法和加速器的双重加持：“每推出新一代GPU，都会添加更多、更强的加速器，以及更繁芜的数据处理办法。
”

“新设计完备取决于如何在不同部件之间划分功能。
现在我们面对三大打算要素——GPU、CPU和DPU，外加连通彼此的网络。
是的，网络本身也实行一部分打算。
在英伟达收购的Mellanox公司，我们引入了网络内打算技能，能够在数据流经网络时实行一部分打算。
”

从当初每两年让晶体管数量倍增、从而令打算性能翻一番的摩尔定律，到如今依赖GPU加速打算实现每年翻番的黄氏定律，半导体行业仍在不断打破新的极限。
但目前来看，纵然是黄氏定律恐怕也跟不上AI运用不断增长的需求。
毕竟AI运用已经给出了明确的性能需求：每年算力提升10倍！

（八）

姓名：Rohit Verma

国别：美国

紧张履历：

1997年7月—1999年3月，在美国国家半导体，作为设计工程师

1999—2013年期间曾在Intel事情了15年之久，曾担当AMD高等Fellow、独立GPU首席SoC架构师。

2013年投奔AMD，担当半定制业务奇迹部首席SoC架构师、AMD Fellow，干了4年11个月后担当独立GPU首席SoC架构师，并升为AMD高等Fellow。

当前事情机构和职务：

AMD首席产品架构师，ntel AXG团队。

代表性成果：

在 AMD 的八年+职业生涯中，Verma 参与的项目涵盖台式机和条记本电脑的独立显卡，以及涉及 CPU、GPU、构造、电源管理和安全性的更广泛的 SoC 架构学科。

（九）

姓名：Raja Koduri

国别：印度

紧张履历：

拥有印度安得拉大学的电子和通信学士学位以及印度理工学院Kharagpur的电子和通信硕士学位。
他担当屡获殊荣的视觉效果和动画公司Makuta VFX董事会的首席技能顾问。

1996年加盟S3 Graphics；

2001年加入ATI担当前辈技能开拓总监；

2006年随着ATI被收购进入AMD担当图形首席技能官；

2009 年至 2013 年，Koduri 在 Apple Inc. 担当图形架构总监。

Koduri担当苹果公司的图形架构总监。
在任职期间，他帮助为公司的Macintosh产品系列建立了领先的图形子系统，并领导了向Apple的Retina显示屏的过渡。

在他职业生涯的早期，Koduri 曾在 AMD 和 ATI Technologies Inc. 担当过各种图形领导职务，个中包括在硬件和软件方面率先推出 GPU 性能操持、创建 GPU 打算生态系统以及为图形产品功能做出贡献。
他最初于 2001 年加入 AMD。

2017 年加入英特尔之前，他是AMD的高等副总裁兼首席架构师，Koduri 领导该集团，全面卖力 AMD 加速处理单元（APU）、独立 GPU、半定制和 GPU 打算产品中利用的图形技能。

现任英特尔公司加速打算系统和图形 (AXG) 集团高等副总裁兼总经理。

2022年4月20日，英特尔加速打算系统和图形部门的卖力人 Raja Koduri 已被提升为实行副总裁。

当前事情机构和职务：

现任英特尔公司实行副总裁、加速打算系统和图形 (AXG) 集团高等副总裁兼总经理。

代表性成果：

一手创造了Vega图形卡

开拓了Polaris、Navi等架构

开启了Xe GPU时期

标签：伟达打算

盘点GPU业界的大年夜佬—零根本入门GPU芯片设计_英伟_技巧

相关文章

支持最高1.92亿像素拍摄深度剖析骁龙690芯片_像素_刷新率

IT销售对联,科技引领未来，销售铸就辉煌

IT集团,引领科技变革，赋能未来社会

图文结合分享24伏开关电源电路事理_电路_电压

IT面试要领,介绍职场大门的密钥

IT项目外包,企业发展的新趋势与步骤讨论

热门文章

最近发表

支持最高1.92亿像素拍摄深度剖析骁龙690芯片_像素_刷新率

足球体育比赛中的各类数据是若何被记录的你知道吗？_数据_火星

让收集像人一样具备免疫力？中国工程院院士沈昌祥谈收集安然_数据_可托

IT销售目标,数字化转型的驱动力与实现路径

IT销售对联,科技引领未来，销售铸就辉煌

芯片CP测试的流程是若何的_测试_芯片

IT销售访谈,介绍行业变革下的机遇与挑战

液晶电视电源板常见的故障判断与检修_电压_电路

实测52.4MB/s！全国产ARM+FPGA的CSI通信案例分享！_总线_案例

IT集团,引领科技变革，赋能未来社会

标签列表