智能芯片是前沿科技和社会关注的热点,也是人工智能技能发展过程中不可超出的关键环节。可以说,不论有若何领先的算法,要想终极运用,都必须通过芯片实现。
5月3日,环球新一代人工智能芯片发布会在上海召开,中科院旗下的寒武纪科技公司发布了我国自主研发的Cambricon MLU100云端智能芯片和板卡产品、寒武纪1M终端智能处理器IP产品。这款海内首个云端人工智能芯片,理论峰值速率达每秒128万亿次定点运算,达到天下前辈水平。

智能芯片实现新打破

作为这次发布会焦点,首次正式亮相的Cambricon MLU100云端智能芯片,是我国首款云端AI芯片。
据中科院打算所研究员、寒武纪公司创始人兼CEO陈天石先容,云端智能芯片是面向人工智能领域大规模数据中央和做事器供应的核心芯片。云真个智能芯片规模更大,构造更加繁芜,它和终端芯片的最大差异就在于其运算能力更强。
MLU100云端智能芯片采取寒武纪最新的MLUv01架构和TSMC 16nm的前辈工艺,可事情在平衡模式(1GHz主频)和高性能模式(1.3GHz主频)下,平衡模式下的等效理论峰值速率达每秒128万亿次定点运算,高性能模式下的等效理论峰值速率更可达每秒166.4万亿次定点运算,但范例板级功耗仅为80瓦,峰值功耗不超过110瓦。
“3年来,我们从研发两颗测试芯片,一贯到现在云端智能芯片的终极亮相,我们时候准备着‘由端入云’。”陈天石说,MLU100基于软硬件协同提升内存带宽利用率,不管是从性能比,还是功耗最近说,寒武纪都将树立智能芯片领域的新标杆。
与寒武纪系列终端处理器一样,MLU100云端芯片仍旧延续了寒武纪产品一向出色的通用性,可支持千万量级用户的大规模商用考验,搭载各种深度学习和经典机器学习算法,充分知足视觉、语音、自然措辞处理、经典数据挖掘等领域繁芜场景下(如大数据量、多任务、多模态、低延时、高通量)的云端智能处理需求。
此外,这次最新发布的寒武纪1M处理器是公司的第三代IP产品,它延续了前两代产品(寒武纪1H/1A)卓越的完备性,单个处理器核即可支持多样化深度学习模型,并更进一步支持经典机器学习算法和本地演习,为视觉、语音、自然措辞处理以及各种经典的机器学习任务供应了灵巧高效的打算平台,将广泛运用于智好手机、智能音箱、智能摄像头、智能驾驶平分歧领域。
“由端入云”协同发展
寒武纪科技公司脱胎于中科院打算所,于2016年发布了环球首款商用深度学习专用途理器——寒武纪1A处理器。它的横空出世冲破了多项记录,并入选了第三届天下互联网大会评比的十五项“天下互联网领先科技成果”。目前,寒武纪处理器也已运用于某有名国产手机新近发布的旗舰机型,实现了集成运用。
近年来,人工智能家当迅猛发展,推动了芯片市场规模的快速增长,也推动了人工智能打算从终端向云真个延伸。陈天石表示,寒武纪在技能上贯彻“端云协作”的理念,这次发布的MLU100云端芯片,不仅可独立完成各种繁芜的云端智能任务,更可以与寒武纪1A/1H/1M系列终端处理器完美适配,让终端和云端在统一的智能生态根本上协同完成繁芜的智能处理任务。
陈天石指出,端侧智能处理可以最快速响运用户需求,以非常低小的功耗、本钱和延迟,帮助用户理解图像、视频、语音和文本。同时,云侧的智能处理则可以把多个真个信息汇聚在一起。由于终真个数据量有限,只能根据单个用户的数据对机器学习模型进行微调。因此,端云协同的智能处理模式将在数据方面发挥巨大上风,利用海量数据,演习出强大的人工智能模型。
“过去大部分芯片厂商都主攻端,例如芯片巨子ARM公司,或是主攻云,例如英特尔公司。两者兼顾的却很少,由于端云的任务生态差异较大。但是智能时期这个局势会被全面冲破。由于端和云的任务是一体的,编程和利用的生态也是同等的。作为一个通用机器学习芯片厂商,寒武纪便是要端云结合,共同推动智能芯片生态的发展。”陈天石说。
中科院上海分院副院长、中科院院士张旭表示,从过去在手机等终端上运用的智能芯片,到本日更高一层的云端人工智能芯片,它可以使人们在手机等终真个运用上升为未来在云端等领域更加广阔的运用,以是这是一个开拓性的打破。
当前,浩瀚科技公司纷纭加大对人工智能芯片的研发,包括智好手机、无人驾驶、云打算等各领域巨子。根据干系机构预测,到2021年,人工智能芯片市场规模将超过110亿美元,而2016年这一数字仅为36亿美元。
“寒武纪创立的初衷便是要让全天下都能用上智能处理器。”陈天石见告,寒武纪将秉承学术界开放、协作的精神,以处理器IP授权的形式与全天下同行共享寒武纪最新的技能成果,使环球客户能够快速设计和生产具备人工智能处理能力的芯片产品。
共建人工智能生态链
发布会上,寒武纪部分家当伙伴公开展示了基于寒武纪芯片的运用方案。遐想集团高等副总裁童夫尧在发布会上推出了基于寒武纪MLU100智能处理卡的ThinkSystem SR650,冲破了37项做事器基准测试的天下记录。
“在新产品上,我们搭载了寒武纪的芯片,有助于各行各业在人工智能、VR、高性能打算等方面的研发和行业办理方案的落地。”童夫尧说。
不仅如此,芯片成果还将利用于智能语音领域。“一小时的语音数据在一个传统处理器上进行智能运用场置,须要一万小时才能完成,科大讯飞一贯在跟踪人工智能专用芯片的前沿进展。”上海讯飞总裁程甦先容,寒武纪的智能处理器在语音智能处理上交出了精良的答卷,能耗效率领先竞争对手的云端GPU方案达5倍以上。它的强大处理能力使得手机本地端可以处理更加繁芜的机器学习算法,使得语音本地识别准确率相对付传统处理器领先了9.8%,显著提高了用户体验。
中科曙光高等副总裁任京旸在发布会上同步推出了基于Cambricon MLU100智能处理卡的做事器产品系列“PHANERON”,它的性能更为强劲,可以支持2—10块寒武纪MLU处理卡,灵巧应对不同的智能运用负载。以升级版的PHANERON-10为例,单台做事器可集成10片寒武纪人工智能处理单元,为人工智能演习运用供应832T半精度浮点运算能力,为推理运用供应1.66P整数运算能力,范例场景下的能效提升30倍以上。
“下一步,曙光与寒武纪之间的互助将不仅仅局限于整机领域,会从顶端科研一贯延伸到低端运用,协力打造下贱运用家当,共建人工智能生态链。”任京旸透露,中科曙光还将发布人工智能管理平台SothisAI,与寒武纪的芯片及开拓环境实现无缝对接和深度领悟。
来源:经济日报能↓↓↓










