AI 运用有多种可能,紧张的寻衅是为精确的目的选择得当的办理方案,并认识到,仅由于 AI 可以运用于特定的流程或问题,并不虞味着该当这样做。只管 AI 被认为是办理险些所有问题的空想办理方案,但成功运用有三个紧张哀求。
首先,须要有足足数目标优质数据。仅仅由于有数据并不虞味着那些数据可以办理关注的问题。实际上,纵然利用最好的工具,太多不干系的数据会增加数据处理的难度与本钱。假设有可用数据,问题就变成了须要花费多少努力来清理数据,并运用它。

这比看起来要难得多,由于设计 AI 运用时,基本上是在处理移动中的目标。在软件开拓,这是正常的,由于在多数情形下可以对软件进行更新和打补丁。对付硬件工程师,这须要理解软硬分工的边界,由于在硬件涌现故障的地方,软件须要进行更正。在软件和硬件相互依赖程度更高的设计中,它会影响所有方面,从性能和功耗、到整体可靠性。

第二个哀求是问题本身必须能够从 AI 中受益。如果基于 AI 模型开拓算法或测试平台的韶光过长,则不一定会使设计受益。更糟糕的是,如果 AI 模型存在毛病,则很难回溯并找出问题所在,由于 AI 在很大程度上是不透明的。AI的思维是持续自适应和优化,会创造一个不可预测结果的变量。
与更传统的方法比较,利用 AI 必须有明显的好处。但是理解 AI 可以带来什么好处,以及要实现这些好处将须要多少事情,并不纯挚。它具有许多经济变量,可能随项目、公司以及工程团队的专业知识而变革。
第三个哀求是结果必须是可重复的、有结论的,这意味着它们须要以没有 AI 的结果为比较基准。这可能是一个漫长的过程。随着芯片变得越来越繁芜,从布局到验证和调试。AI 对付查找和理解大量数据中的模式非常有用,尤其是在不同团队协作的环境。但是要理解 AI 的真正代价须要花费韶光,在半定制的芯片中 -- 发卖量在数十万或数百万 -- 市场机会不一定许可这个选择。
构建一种芯片,将其集成到 10 亿部智好手机中,乃至跨平台的芯片,是一回事。将 AI 集成到一个少量生产的特定运用芯片中是另一回事。证明 AI 及其迭代的代价不成问题,关键在各种 AI 在特定设计中的运用。面临的寻衅是:知道何时何地运用它,到目前为止,这更像是一门艺术。
有数百个(乃至数千个)AI 芯片初创公司,以及成熟半导体公司中的数十个项目,正在创建 AI 芯片或将 AI 技能嵌入产品线中。这些芯片中大多数都在设计中,尚未批量生产,有些会失落败。在过去的 12 到 18 个月中,演习算法持续发展变革,如何选择最佳的芯片架构以适用多个终端市场和用例,是一大寻衅。这使任何单一芯片架构很难在很长一段韶光内霸占主导地位。
机器学习可以在不同处理器上运行,选择取决于关注的指标。现存的 CPU 就可实行轻量的机器学习。数据中央的演习芯片对速率哀求极高,技能与制程门槛高。与多元化运用结合的推理芯片百花齐放,在边缘进行更多的推理,可降落延迟与提高数据安全,与数据中央做事器或大型 GPU 比较,边缘推理所需的功耗须要低几个数量级。纵然评论辩论边缘,可能涵盖从底层物联网 (IoT) 到边缘数据中央,需求差异很大,工业 IoT 与消费市场的 IoT 也不同,后者例如 AR/VR 与可穿着装置,常日能耗越低越好 。
不同 AI 运用的事情负载差异决定芯片架构的选择。例如,许多以音频为重点的机器学习网络都用繁重的标量 (Scalar),而矩阵 (Matrix) 相对较轻,而工具检测 (Object Detection) 算法多有繁重的矩阵,但在标量需求相称轻。算法不同,同为线性代数矩阵仍有不同密度,利用密集矩阵的深度学习,例如医疗影像处理辨识,其最适处理器架构作为稀疏矩阵打算则非优化。其余,运用的规模也是一个考虑成分。
架构没有一体适用。设计考量包括功耗,性能,面积和数据带宽的特殊哀求,必需评估有形与无形的完全本钱,选择 AI 芯片要考虑的,除了芯片本身的本钱,还包括以下与总拥有本钱 (Total Cost of Ownership) 干系之成分。
效能表现:芯片的规格,这是基本;
微处理器的指令集架构:对付软件与软件的集成程度与特殊运算至关主要; 实际影响,例如,较低位分辨率的处理对付AI很有用,它可以提高效率,而不会显著降落准确性;其余,边缘打算的特殊需求,例如:增援网络连接与异构打算的负载平衡;
是否有基准 (Benchmark) 的 AI 效能数据:例如 MLPerf,如果没有则需自己实验比较;
AI 用例适配:如前述,根据运用需求而异,紧张分为演习、推理、与实时持续学习 (RealTime Learning) 的环境;
软件堆栈的成熟度:它必须供应对多种开拓措辞的支持。传统上,芯片嵌入式运用程序支持 C / C ++,但 AI 运用程序须要支持的紧张是 Python,将来 Julia 的地位会提高; 需有系列开拓工具,供程序员编写代码,建模,仿照,测试,对目标芯片上运用程序作调试; 其余,该芯片与生态系统与工具集集成的程度 -- 对 AI 盛行框架/库的支持,例如:TensorFlow,MXNet 等 -- 这意味着运用开拓职员无需学习新知识; 能支持异构打算方法 -- 运用程序可以在多个微处理器运行,以利用不同上风,有开拓环境无缝支持这些不同类型的处理器;
功耗 (Power) 哀求:除了边缘 AI 的运用须要极低能耗,数据中央的演习芯片能耗也是主要本钱因子;
影象体效率:数据储存单元与打算单元之间的传输效率已成 AI 打算的瓶颈,许多新的架构提出,以求降落这个传输韶光,例如:Processor-in-Memory (PIM);
芯片连接:片上连接决定数据流动速率,称为片上网络(NoC)的新型Bus 受关注。片外通信在系统级别发挥浸染,是 AI 芯片组的关键规格标准。DDR5 或 HBM 是盛行的存储器接口。与 CPU 沟通常常利用 PCI Express。OpenCAPI 则是 CPU 和加速器芯片之间的沟通。
算法变更周期速率:硬连线的算法部分越多,做改变要花费的韶光就越长。改版须要不仅来自纠错,也可能来自市场与环境变革,以是算法需更新。以是这是一个主要因子。
芯片安全:安全已成为芯片利用中考虑成分中越来越主要的一部分。芯片须要至少与安全链的其他部分一样强大。这可能涉及将安全凭据嵌入硬件。
免责声明:本文由作者原创。文章内容系作者个人不雅观点,半导体行业不雅观察转载仅为了传达一种不同的不雅观点,不代表半导体行业不雅观察对该不雅观点赞许或支持,如果有任何异议,欢迎联系半导体行业不雅观察。
本日是《半导体行业不雅观察》为您分享的第2354期内容,欢迎关注。
★被“嫌弃”的英特尔
★群雄并起的国产滤波器
★芯片厂商排名的殊途同归
Arm|台积电|CMOS|晶圆|AI|FPGA|Matlab|封装|射频来源:内容来自公众年夜众号「非凡创芯力」,作者:Jessie Chen,感激。 AI 运用有多种可能,紧张的寻衅是为精确的目的选择得当的办理方案,并认识到,仅由于 AI 可以运用于特定的流程或问题,并不虞味着该当这样做。只管 AI 被认为是办理险些所有问题的空想办理方案,但成功运用有三个紧张哀求。 首先,须要有足足数目标优质数据。仅仅由于有数据并不虞味着那些数据可以办理关注的问题。实际上,纵然利用最好的工具,太多不干系的数据会增加数据处理的难度与本钱。假设有可用数据,问题就变成了须要花费多少努力来清理数据,并运用它。 这比看起来要难得多,由于设计 AI 运用时,基本上是在处理移动中的目标。在软件开拓,这是正常的,由于在多数情形下可以对软件进行更新和打补丁。对付硬件工程师,这须要理解软硬分工的边界,由于在硬件涌现故障的地方,软件须要进行更正。在软件和硬件相互依赖程度更高的设计中,它会影响所有方面,从性能和功耗、到整体可靠性。 第二个哀求是问题本身必须能够从 AI 中受益。如果基于 AI 模型开拓算法或测试平台的韶光过长,则不一定会使设计受益。更糟糕的是,如果 AI 模型存在毛病,则很难回溯并找出问题所在,由于 AI 在很大程度上是不透明的。AI的思维是持续自适应和优化,会创造一个不可预测结果的变量。 与更传统的方法比较,利用 AI 必须有明显的好处。但是理解 AI 可以带来什么好处,以及要实现这些好处将须要多少事情,并不纯挚。它具有许多经济变量,可能随项目、公司以及工程团队的专业知识而变革。 第三个哀求是结果必须是可重复的、有结论的,这意味着它们须要以没有 AI 的结果为比较基准。这可能是一个漫长的过程。随着芯片变得越来越繁芜,从布局到验证和调试。AI 对付查找和理解大量数据中的模式非常有用,尤其是在不同团队协作的环境。但是要理解 AI 的真正代价须要花费韶光,在半定制的芯片中 -- 发卖量在数十万或数百万 -- 市场机会不一定许可这个选择。 构建一种芯片,将其集成到 10 亿部智好手机中,乃至跨平台的芯片,是一回事。将 AI 集成到一个少量生产的特定运用芯片中是另一回事。证明 AI 及其迭代的代价不成问题,关键在各种 AI 在特定设计中的运用。面临的寻衅是:知道何时何地运用它,到目前为止,这更像是一门艺术。 有数百个(乃至数千个)AI 芯片初创公司,以及成熟半导体公司中的数十个项目,正在创建 AI 芯片或将 AI 技能嵌入产品线中。这些芯片中大多数都在设计中,尚未批量生产,有些会失落败。在过去的 12 到 18 个月中,演习算法持续发展变革,如何选择最佳的芯片架构以适用多个终端市场和用例,是一大寻衅。这使任何单一芯片架构很难在很长一段韶光内霸占主导地位。 机器学习可以在不同处理器上运行,选择取决于关注的指标。现存的 CPU 就可实行轻量的机器学习。数据中央的演习芯片对速率哀求极高,技能与制程门槛高。与多元化运用结合的推理芯片百花齐放,在边缘进行更多的推理,可降落延迟与提高数据安全,与数据中央做事器或大型 GPU 比较,边缘推理所需的功耗须要低几个数量级。纵然评论辩论边缘,可能涵盖从底层物联网 (IoT) 到边缘数据中央,需求差异很大,工业 IoT 与消费市场的 IoT 也不同,后者例如 AR/VR 与可穿着装置,常日能耗越低越好 。 不同 AI 运用的事情负载差异决定芯片架构的选择。例如,许多以音频为重点的机器学习网络都用繁重的标量 (Scalar),而矩阵 (Matrix) 相对较轻,而工具检测 (Object Detection) 算法多有繁重的矩阵,但在标量需求相称轻。算法不同,同为线性代数矩阵仍有不同密度,利用密集矩阵的深度学习,例如医疗影像处理辨识,其最适处理器架构作为稀疏矩阵打算则非优化。其余,运用的规模也是一个考虑成分。 架构没有一体适用。设计考量包括功耗,性能,面积和数据带宽的特殊哀求,必需评估有形与无形的完全本钱,选择 AI 芯片要考虑的,除了芯片本身的本钱,还包括以下与总拥有本钱 (Total Cost of Ownership) 干系之成分。 效能表现:芯片的规格,这是基本;
微处理器的指令集架构:对付软件与软件的集成程度与特殊运算至关主要; 实际影响,例如,较低位分辨率的处理对付AI很有用,它可以提高效率,而不会显著降落准确性;其余,边缘打算的特殊需求,例如:增援网络连接与异构打算的负载平衡;
是否有基准 (Benchmark) 的 AI 效能数据:例如 MLPerf,如果没有则需自己实验比较;
AI 用例适配:如前述,根据运用需求而异,紧张分为演习、推理、与实时持续学习 (RealTime Learning) 的环境;
软件堆栈的成熟度:它必须供应对多种开拓措辞的支持。传统上,芯片嵌入式运用程序支持 C / C ++,但 AI 运用程序须要支持的紧张是 Python,将来 Julia 的地位会提高; 需有系列开拓工具,供程序员编写代码,建模,仿照,测试,对目标芯片上运用程序作调试; 其余,该芯片与生态系统与工具集集成的程度 -- 对 AI 盛行框架/库的支持,例如:TensorFlow,MXNet 等 -- 这意味着运用开拓职员无需学习新知识; 能支持异构打算方法 -- 运用程序可以在多个微处理器运行,以利用不同上风,有开拓环境无缝支持这些不同类型的处理器;
功耗 (Power) 哀求:除了边缘 AI 的运用须要极低能耗,数据中央的演习芯片能耗也是主要本钱因子;
影象体效率:数据储存单元与打算单元之间的传输效率已成 AI 打算的瓶颈,许多新的架构提出,以求降落这个传输韶光,例如:Processor-in-Memory (PIM);
芯片连接:片上连接决定数据流动速率,称为片上网络(NoC)的新型Bus 受关注。片外通信在系统级别发挥浸染,是 AI 芯片组的关键规格标准。DDR5 或 HBM 是盛行的存储器接口。与 CPU 沟通常常利用 PCI Express。OpenCAPI 则是 CPU 和加速器芯片之间的沟通。
算法变更周期速率:硬连线的算法部分越多,做改变要花费的韶光就越长。改版须要不仅来自纠错,也可能来自市场与环境变革,以是算法需更新。以是这是一个主要因子。
芯片安全:安全已成为芯片利用中考虑成分中越来越主要的一部分。芯片须要至少与安全链的其他部分一样强大。这可能涉及将安全凭据嵌入硬件。
免责声明:本文由作者原创。文章内容系作者个人不雅观点,半导体行业不雅观察转载仅为了传达一种不同的不雅观点,不代表半导体行业不雅观察对该不雅观点赞许或支持,如果有任何异议,欢迎联系半导体行业不雅观察。
本日是《半导体行业不雅观察》为您分享的第2354期内容,欢迎关注。
推举阅读
★被“嫌弃”的英特尔
★群雄并起的国产滤波器
★芯片厂商排名的殊途同归
半导体行业不雅观察
『半导体第一垂直媒体』
实时 专业 原创 深度
识别二维码,回答下方关键词,阅读更多
Arm|台积电|CMOS|晶圆|AI|FPGA|Matlab|封装|射频
回答 投稿,看《如何成为“半导体行业不雅观察”的一员 》
回答 搜索,还能轻松找到其他你感兴趣的文章!










