若何选择AI芯片？_芯片_数据

文章目录 [+]

AI 运用有多种可能，紧张的寻衅是为精确的目的选择得当的办理方案，并认识到，仅由于 AI 可以运用于特定的流程或问题，并不虞味着该当这样做。
只管 AI 被认为是办理险些所有问题的空想办理方案，但成功运用有三个紧张哀求。

首先，须要有足足数目标优质数据。
仅仅由于有数据并不虞味着那些数据可以办理关注的问题。
实际上，纵然利用最好的工具，太多不干系的数据会增加数据处理的难度与本钱。
假设有可用数据，问题就变成了须要花费多少努力来清理数据，并运用它。

若何选择AI芯片？_芯片_数据若何选择AI芯片？_芯片_数据互联网

这比看起来要难得多，由于设计 AI 运用时，基本上是在处理移动中的目标。
在软件开拓，这是正常的，由于在多数情形下可以对软件进行更新和打补丁。
对付硬件工程师，这须要理解软硬分工的边界，由于在硬件涌现故障的地方，软件须要进行更正。
在软件和硬件相互依赖程度更高的设计中，它会影响所有方面，从性能和功耗、到整体可靠性。

（图片来自网络侵删）

第二个哀求是问题本身必须能够从 AI 中受益。
如果基于 AI 模型开拓算法或测试平台的韶光过长，则不一定会使设计受益。
更糟糕的是，如果 AI 模型存在毛病，则很难回溯并找出问题所在，由于 AI 在很大程度上是不透明的。
AI的思维是持续自适应和优化，会创造一个不可预测结果的变量。

与更传统的方法比较，利用 AI 必须有明显的好处。
但是理解 AI 可以带来什么好处，以及要实现这些好处将须要多少事情，并不纯挚。
它具有许多经济变量，可能随项目、公司以及工程团队的专业知识而变革。

第三个哀求是结果必须是可重复的、有结论的，这意味着它们须要以没有 AI 的结果为比较基准。
这可能是一个漫长的过程。
随着芯片变得越来越繁芜，从布局到验证和调试。
AI 对付查找和理解大量数据中的模式非常有用，尤其是在不同团队协作的环境。
但是要理解 AI 的真正代价须要花费韶光，在半定制的芯片中 -- 发卖量在数十万或数百万 -- 市场机会不一定许可这个选择。

构建一种芯片，将其集成到 10 亿部智好手机中，乃至跨平台的芯片，是一回事。
将 AI 集成到一个少量生产的特定运用芯片中是另一回事。
证明 AI 及其迭代的代价不成问题，关键在各种 AI 在特定设计中的运用。
面临的寻衅是：知道何时何地运用它，到目前为止，这更像是一门艺术。

有数百个（乃至数千个）AI 芯片初创公司，以及成熟半导体公司中的数十个项目，正在创建 AI 芯片或将 AI 技能嵌入产品线中。
这些芯片中大多数都在设计中，尚未批量生产，有些会失落败。
在过去的 12 到 18 个月中，演习算法持续发展变革，如何选择最佳的芯片架构以适用多个终端市场和用例，是一大寻衅。
这使任何单一芯片架构很难在很长一段韶光内霸占主导地位。

机器学习可以在不同处理器上运行，选择取决于关注的指标。
现存的 CPU 就可实行轻量的机器学习。
数据中央的演习芯片对速率哀求极高，技能与制程门槛高。
与多元化运用结合的推理芯片百花齐放，在边缘进行更多的推理，可降落延迟与提高数据安全，与数据中央做事器或大型 GPU 比较，边缘推理所需的功耗须要低几个数量级。
纵然评论辩论边缘，可能涵盖从底层物联网 (IoT) 到边缘数据中央，需求差异很大，工业 IoT 与消费市场的 IoT 也不同，后者例如 AR/VR 与可穿着装置，常日能耗越低越好。

不同 AI 运用的事情负载差异决定芯片架构的选择。
例如，许多以音频为重点的机器学习网络都用繁重的标量 (Scalar)，而矩阵 (Matrix) 相对较轻，而工具检测 (Object Detection) 算法多有繁重的矩阵，但在标量需求相称轻。
算法不同，同为线性代数矩阵仍有不同密度，利用密集矩阵的深度学习，例如医疗影像处理辨识，其最适处理器架构作为稀疏矩阵打算则非优化。
其余，运用的规模也是一个考虑成分。

架构没有一体适用。
设计考量包括功耗，性能，面积和数据带宽的特殊哀求，必需评估有形与无形的完全本钱，选择 AI 芯片要考虑的，除了芯片本身的本钱，还包括以下与总拥有本钱 (Total Cost of Ownership) 干系之成分。

效能表现：芯片的规格，这是基本;

微处理器的指令集架构：对付软件与软件的集成程度与特殊运算至关主要; 实际影响，例如，较低位分辨率的处理对付AI很有用，它可以提高效率，而不会显著降落准确性；其余，边缘打算的特殊需求，例如：增援网络连接与异构打算的负载平衡；

是否有基准 (Benchmark) 的 AI 效能数据：例如 MLPerf，如果没有则需自己实验比较;

AI 用例适配：如前述，根据运用需求而异，紧张分为演习、推理、与实时持续学习 (RealTime Learning) 的环境;

软件堆栈的成熟度：它必须供应对多种开拓措辞的支持。
传统上，芯片嵌入式运用程序支持 C / C ++，但 AI 运用程序须要支持的紧张是 Python，将来 Julia 的地位会提高; 需有系列开拓工具，供程序员编写代码，建模，仿照，测试，对目标芯片上运用程序作调试; 其余，该芯片与生态系统与工具集集成的程度 -- 对 AI 盛行框架/库的支持，例如：TensorFlow，MXNet 等 -- 这意味着运用开拓职员无需学习新知识; 能支持异构打算方法 -- 运用程序可以在多个微处理器运行，以利用不同上风，有开拓环境无缝支持这些不同类型的处理器;

功耗 (Power) 哀求：除了边缘 AI 的运用须要极低能耗，数据中央的演习芯片能耗也是主要本钱因子;

影象体效率：数据储存单元与打算单元之间的传输效率已成 AI 打算的瓶颈，许多新的架构提出，以求降落这个传输韶光，例如：Processor-in-Memory (PIM);

芯片连接：片上连接决定数据流动速率，称为片上网络（NoC）的新型Bus 受关注。
片外通信在系统级别发挥浸染，是 AI 芯片组的关键规格标准。
DDR5 或 HBM 是盛行的存储器接口。
与 CPU 沟通常常利用 PCI Express。
OpenCAPI 则是 CPU 和加速器芯片之间的沟通。

算法变更周期速率：硬连线的算法部分越多，做改变要花费的韶光就越长。
改版须要不仅来自纠错，也可能来自市场与环境变革，以是算法需更新。
以是这是一个主要因子。

芯片安全：安全已成为芯片利用中考虑成分中越来越主要的一部分。
芯片须要至少与安全链的其他部分一样强大。
这可能涉及将安全凭据嵌入硬件。

免责声明：本文由作者原创。
文章内容系作者个人不雅观点，半导体行业不雅观察转载仅为了传达一种不同的不雅观点，不代表半导体行业不雅观察对该不雅观点赞许或支持，如果有任何异议，欢迎联系半导体行业不雅观察。

本日是《半导体行业不雅观察》为您分享的第2354期内容，欢迎关注。

★被“嫌弃”的英特尔

★群雄并起的国产滤波器

★芯片厂商排名的殊途同归

Arm｜台积电｜CMOS｜晶圆｜AI｜FPGA｜Matlab｜封装｜射频

来源：内容来自公众年夜众号「非凡创芯力」，作者：Jessie Chen，感激。
AI 运用有多种可能，紧张的寻衅是为精确的目的选择得当的办理方案，并认识到，仅由于 AI 可以运用于特定的流程或问题，并不虞味着该当这样做。
只管 AI 被认为是办理险些所有问题的空想办理方案，但成功运用有三个紧张哀求。
首先，须要有足足数目标优质数据。
仅仅由于有数据并不虞味着那些数据可以办理关注的问题。
实际上，纵然利用最好的工具，太多不干系的数据会增加数据处理的难度与本钱。
假设有可用数据，问题就变成了须要花费多少努力来清理数据，并运用它。
这比看起来要难得多，由于设计 AI 运用时，基本上是在处理移动中的目标。
在软件开拓，这是正常的，由于在多数情形下可以对软件进行更新和打补丁。
对付硬件工程师，这须要理解软硬分工的边界，由于在硬件涌现故障的地方，软件须要进行更正。
在软件和硬件相互依赖程度更高的设计中，它会影响所有方面，从性能和功耗、到整体可靠性。
第二个哀求是问题本身必须能够从 AI 中受益。
如果基于 AI 模型开拓算法或测试平台的韶光过长，则不一定会使设计受益。
更糟糕的是，如果 AI 模型存在毛病，则很难回溯并找出问题所在，由于 AI 在很大程度上是不透明的。
AI的思维是持续自适应和优化，会创造一个不可预测结果的变量。
与更传统的方法比较，利用 AI 必须有明显的好处。
但是理解 AI 可以带来什么好处，以及要实现这些好处将须要多少事情，并不纯挚。
它具有许多经济变量，可能随项目、公司以及工程团队的专业知识而变革。
第三个哀求是结果必须是可重复的、有结论的，这意味着它们须要以没有 AI 的结果为比较基准。
这可能是一个漫长的过程。
随着芯片变得越来越繁芜，从布局到验证和调试。
AI 对付查找和理解大量数据中的模式非常有用，尤其是在不同团队协作的环境。
但是要理解 AI 的真正代价须要花费韶光，在半定制的芯片中 -- 发卖量在数十万或数百万 -- 市场机会不一定许可这个选择。
构建一种芯片，将其集成到 10 亿部智好手机中，乃至跨平台的芯片，是一回事。
将 AI 集成到一个少量生产的特定运用芯片中是另一回事。
证明 AI 及其迭代的代价不成问题，关键在各种 AI 在特定设计中的运用。
面临的寻衅是：知道何时何地运用它，到目前为止，这更像是一门艺术。
有数百个（乃至数千个）AI 芯片初创公司，以及成熟半导体公司中的数十个项目，正在创建 AI 芯片或将 AI 技能嵌入产品线中。
这些芯片中大多数都在设计中，尚未批量生产，有些会失落败。
在过去的 12 到 18 个月中，演习算法持续发展变革，如何选择最佳的芯片架构以适用多个终端市场和用例，是一大寻衅。
这使任何单一芯片架构很难在很长一段韶光内霸占主导地位。
机器学习可以在不同处理器上运行，选择取决于关注的指标。
现存的 CPU 就可实行轻量的机器学习。
数据中央的演习芯片对速率哀求极高，技能与制程门槛高。
与多元化运用结合的推理芯片百花齐放，在边缘进行更多的推理，可降落延迟与提高数据安全，与数据中央做事器或大型 GPU 比较，边缘推理所需的功耗须要低几个数量级。
纵然评论辩论边缘，可能涵盖从底层物联网 (IoT) 到边缘数据中央，需求差异很大，工业 IoT 与消费市场的 IoT 也不同，后者例如 AR/VR 与可穿着装置，常日能耗越低越好。
不同 AI 运用的事情负载差异决定芯片架构的选择。
例如，许多以音频为重点的机器学习网络都用繁重的标量 (Scalar)，而矩阵 (Matrix) 相对较轻，而工具检测 (Object Detection) 算法多有繁重的矩阵，但在标量需求相称轻。
算法不同，同为线性代数矩阵仍有不同密度，利用密集矩阵的深度学习，例如医疗影像处理辨识，其最适处理器架构作为稀疏矩阵打算则非优化。
其余，运用的规模也是一个考虑成分。
架构没有一体适用。
设计考量包括功耗，性能，面积和数据带宽的特殊哀求，必需评估有形与无形的完全本钱，选择 AI 芯片要考虑的，除了芯片本身的本钱，还包括以下与总拥有本钱 (Total Cost of Ownership) 干系之成分。
效能表现：芯片的规格，这是基本;
微处理器的指令集架构：对付软件与软件的集成程度与特殊运算至关主要; 实际影响，例如，较低位分辨率的处理对付AI很有用，它可以提高效率，而不会显著降落准确性；其余，边缘打算的特殊需求，例如：增援网络连接与异构打算的负载平衡；
是否有基准 (Benchmark) 的 AI 效能数据：例如 MLPerf，如果没有则需自己实验比较;
AI 用例适配：如前述，根据运用需求而异，紧张分为演习、推理、与实时持续学习 (RealTime Learning) 的环境;
软件堆栈的成熟度：它必须供应对多种开拓措辞的支持。
传统上，芯片嵌入式运用程序支持 C / C ++，但 AI 运用程序须要支持的紧张是 Python，将来 Julia 的地位会提高; 需有系列开拓工具，供程序员编写代码，建模，仿照，测试，对目标芯片上运用程序作调试; 其余，该芯片与生态系统与工具集集成的程度 -- 对 AI 盛行框架/库的支持，例如：TensorFlow，MXNet 等 -- 这意味着运用开拓职员无需学习新知识; 能支持异构打算方法 -- 运用程序可以在多个微处理器运行，以利用不同上风，有开拓环境无缝支持这些不同类型的处理器;
功耗 (Power) 哀求：除了边缘 AI 的运用须要极低能耗，数据中央的演习芯片能耗也是主要本钱因子;
影象体效率：数据储存单元与打算单元之间的传输效率已成 AI 打算的瓶颈，许多新的架构提出，以求降落这个传输韶光，例如：Processor-in-Memory (PIM);
芯片连接：片上连接决定数据流动速率，称为片上网络（NoC）的新型Bus 受关注。
片外通信在系统级别发挥浸染，是 AI 芯片组的关键规格标准。
DDR5 或 HBM 是盛行的存储器接口。
与 CPU 沟通常常利用 PCI Express。
OpenCAPI 则是 CPU 和加速器芯片之间的沟通。
算法变更周期速率：硬连线的算法部分越多，做改变要花费的韶光就越长。
改版须要不仅来自纠错，也可能来自市场与环境变革，以是算法需更新。
以是这是一个主要因子。
芯片安全：安全已成为芯片利用中考虑成分中越来越主要的一部分。
芯片须要至少与安全链的其他部分一样强大。
这可能涉及将安全凭据嵌入硬件。

免责声明：本文由作者原创。
文章内容系作者个人不雅观点，半导体行业不雅观察转载仅为了传达一种不同的不雅观点，不代表半导体行业不雅观察对该不雅观点赞许或支持，如果有任何异议，欢迎联系半导体行业不雅观察。
本日是《半导体行业不雅观察》为您分享的第2354期内容，欢迎关注。
推举阅读
★被“嫌弃”的英特尔
★群雄并起的国产滤波器
★芯片厂商排名的殊途同归
半导体行业不雅观察
『半导体第一垂直媒体』
实时专业原创深度
识别二维码，回答下方关键词，阅读更多
Arm｜台积电｜CMOS｜晶圆｜AI｜FPGA｜Matlab｜封装｜射频
回答投稿，看《如何成为“半导体行业不雅观察”的一员》
回答搜索，还能轻松找到其他你感兴趣的文章！

标签：芯片须要