首页 » 互联网 » 国产云端AI芯片新打破_半导体_芯片

国产云端AI芯片新打破_半导体_芯片

萌界大人物 2024-12-10 19:52:47 0

扫一扫用手机浏览

文章目录 [+]
小编

专注不雅观察环球半导体最新资讯、技能前沿、发展趋势。
《摩尔精英》《中国集成电路》共同出品,欢迎订阅摩尔旗下"大众年夜众号:摩尔精英MooreElite、摩尔芯闻、摩尔芯球\"大众 data-from=\公众0\"大众>

国产云端AI芯片新打破_半导体_芯片 互联网

如今,人工智能正处于深刻影响天下的大浪潮之下,AI芯片作为人工智能的根本硬件,需求加速开释。
据VerifiedMarket数据显示,2020年AI芯片市值为73.7亿美元,估量到2028年将达到1098.3 亿美元。
从行业格局看,国际半导体巨子仍是通用市场的主宰者,国内外云打算巨子积极跨界打造专用型芯片,一批海内AI芯片企业也相继秀出创新成果,意欲颠覆市场格局。
个中,云端AI芯片是本土玩家入局的火热沙场,且正在迎来转机。
2021年7月7日,2021天下人工智能大会(WAIC)期间,瀚博半导体(上海)有限公司(下文简称“瀚博半导体”)召开新品发布会,携SV100系列云端通用AI推理芯片和VA1通用AI推理加速卡首次亮相。
瀚博半导体创始人兼CEO钱军展示SV102芯片

SV100系列芯片:为云端推理而生

钱军先容道,瀚博SV100系列是一款超高性能人工智能与视频处理芯片,具备超高算力、超低延迟,SV102单芯片INT8峰值算力高达200 TOPS,深度学习推理性能指标数倍于现有主流数据中央GPU。
SV100基于瀚博自研的针对各种深度学习推理负载而优化的通用DSA(Domain Specific Architecture,领域专用架构)架构,支持打算机视觉、视频处理、自然措辞处理和搜索推举等推理运用处景,同时集成高密度视频解码,广泛适用于云端与边缘办理方案,节省设备投资、降落运营本钱。
2021年6月,SV100系列芯片测试成功,现与国内外多家头部互联网公司互助,估量将于今年第四季度量产上市。
从瀚博半导体两位创始人行业进程来看,CEO钱军和CTO张磊都拥有超过20年的芯片设计履历,钱军曾供职于思科和AMD公司,在AMD全面卖力GPU的芯片设计和生产;张磊曾任AMD Fellow,深耕视频解编码、视频处理、深度学习、芯片架构设计等领域。
两位创始人都深度理解行业客户对吞吐量、延迟、通用性和本钱的需求。
然而,自带GPU基因的瀚博半导体却并没有沿着GPU的赛道连续深耕,转而研发针对各种深度学习推理负载进行优化的DSA架构。
对此,钱军表示:“一方面缘故原由在于,在GPU领域,英伟达和AMD在软硬件方面均已迭代了很多代,已经足够高效,后来者很难在此赛道上实现超越;另一方面,云端推理芯片市场开始逐渐起量,估量到2021年,中国云端推理芯片市场规模将达到189亿元,将超过云端演习市场规模。
同时,在推理侧,GPU用于AI推理并没有上风,性能不及DSA架构,DSA的上风在于可为特定的一类运用做出架构优化从而实现更好的能效比。
基于上述缘故原由,瀚博半导体选择首先研发基于DSA架构的推理芯片。
从近年来国内外厂商在AI芯片上的布局也可以看到,微软和谷歌等国际大厂,地平线、寒武纪、比特大陆等本土AI芯片公司,只管各家采取了不同的技能路径和芯片架构,但可以看到的因此DSA架构为代表的芯片设计,彷佛正在成为AI芯片发展的一大趋势。
随着人工智能和深度学习技能的深入发展和广泛运用,中国市场AI做事器的推理负载有望超过演习负载,AI推理芯片正在迎来机遇,但同时也在“视频需求、LTE(延时-latency、吞吐量-Throughput、能效-Energy Efficiency)、算法演进与方向打破”等创新领域存在寻衅。
对此,瀚博半导体通过高并发解码能力与AI算力匹配知足视频需求;在LTE方面,SV100系列芯片具备极低延时、极高吞吐量性能,并保持低功耗;同时还能供应负载剖析、硬件通用可扩展以及相应的软件栈。

VA1通用AI推理卡,数据中央高密度算力办理之道

瀚博半导体本次还同步推出了基于SV100系列芯片的VA1 PCIe推理加速卡,供应高效率深度学习AI推理加速,在同等能耗下能实现2-10倍于GPU的最高AI吞吐率,适宜实时运用,同时兼备良好的通用性和可扩展性,支持FP16, BF16和INT8数据类型的浩瀚主流神经网络快速支配——包括检测,分类,识别,分割,视频处理,LSTM/RNN,NLP/BERT,搜索推举等。
张磊强调,VA1支持64路以上H264,H265或AVS2 1080p解码,分辨率支持高达8K,实现强大的智能视频处理性能。
作为标准半高半长75瓦PCIe 4.0卡,VA1适用于绝大多数做事器,无需额外供电,即可实现高密度支配。
瀚博半导体联合创始人、CTO张磊
VA1在吞吐率、同等性能下整机TCO、还是高密度视频处理场景,瀚博半导体的方案均出类拔萃,保有领先上风。
75W功耗处理两种AI模型时,VA1吞吐率超过英伟达A10和T4云端推理GPU
同等推理性能下,VA1比英伟达T4节省60%做事器本钱,比A10节省50%的TCO
VA1是单宽半高半长PCIe卡,支持64路以上视频解码
在高密度视频处理场景中,目前海内大多数云端AI芯片友商没有内置解码功能,而是用多个GPU来做视频解码,因此从适配处理到AI加速要用到多颗芯片。
而VA1只用一颗SV102就能兼顾两类功能,支持64路以上H264、H265或AVS2 1080p解码,分辨率支持高达8K
且功耗更低、处理能力更强。
张磊表示,瀚博半导体目前正将VA1加速卡与遐想、浪潮、新华三、超微做事器以及CentOS、Ubuntu、红帽、中标麒麟、银河麒麟等操作系统做适配。
后续还会推出15W、150W的产品。

芯片之外,软件同样主要

除了芯片本身,配套的软件、驱动、生态等同样是值得关注的部分。
对此,张磊表示:“瀚博半导体的软件栈具有极高灵巧性与可扩展性,能够支持未来新兴算法模型和用户自定义算子扩展等。
同时供应了符合行业开拓者利用习气的工具,方便利用者以相对较低的本钱向公司硬件平台迁移、支配现有算法运用。
目前瀚博半导体的VastStream软件平台已支持TensorFlow、PyTorch、Caffe2等主流深度学习框架模型与ONNX格式的模型,通过高度定制的AI编译器充分优化模型在瀚博硬件上的实行效率。

结语

对付公司的发展方案,钱军强调:“企业应先以自身的技能上风来打造竞争上风,按照研发实力、根据市场的需求来看未来的发展趋势,制订公司的技能、产品和市场等路线图。
在这样的战术路线下,瀚博半导体迈出了主要一步。

与30万半导体精英一起,订阅您的私家芯闻秘书!
欢迎订阅摩尔精英旗下更多"大众号:摩尔精英、半导体行业不雅观察、摩尔App\公众 data-from=\"大众0\公众>

免责声明:本文由作者原创。
文章内容系作者个人不雅观点,半导体行业不雅观察转载仅为了传达一种不同的不雅观点,不代表半导体行业不雅观察对该不雅观点赞许或支持,如果有任何异议,欢迎联系半导体行业不雅观察。

本日是《半导体行业不雅观察》为您分享的第2730内容,欢迎关注。

晶圆|集成电路|设备|汽车芯片|存储|MLCC|英伟达|仿照芯片

标签:

相关文章

IT信息移动,引领未来生活变革的关键力量

随着科技的飞速发展,IT信息移动已经渗透到我们生活的方方面面,成为了推动社会进步的关键力量。从智能手机、平板电脑到智能穿戴设备,I...

互联网 2024-12-31 阅读0 评论0

IT健康管理,构建数字化时代的基石

随着信息技术的飞速发展,数字化时代已经深入到我们生活的方方面面。在这个时代背景下,IT健康管理的重要性日益凸显。它不仅关乎企业信息...

互联网 2024-12-31 阅读0 评论0

IT公司行贿现象的剖析与反思

随着我国经济的快速发展,信息技术行业逐渐成为国民经济的重要支柱。近年来,一些IT公司为了在市场竞争中占据优势,不惜行贿,这种行为严...

互联网 2024-12-31 阅读0 评论0