从指令集、微架构到工具链具有完备自主知识产权?呵呵。
2016年初,在北京亦庄召开的“高性能异构打算及网络安全研讨会”上,中原芯(北京)通用途理器技能有限公司即将推出环球首款完备支持异构系统架构(HSA)的处理器。
先来看看媒体是怎么说的(由于篇幅冗长,为方便阅读,笔者就摘录重点以供参考)
据《中国电子报》宣布说,“处理器IP核与生态系统两方面问题的办理,将使中国自主处理器家当有望不才一代异构打算时期,取得更快速的发展,遇上国际前辈水平。”摘录如下:

1、中原芯的打破表明我国在新一代异构打算上取得重大进展,有望在原来相对空缺的处理器IP(知识产权)核授权领域冲破国外垄断,彻底改变中国处理器家当的核心知识产权基本依赖于国外容许的被动局势。
2、从软件角度看,运用开拓将变得轻松,任何程序都不必费心考虑不同处理器内核之间的存储差异。这将给打算性能以革命性的提高。
3、是环球首次推出完备支持HSA标准的CPU+GPU+DSP的处理器IP核平台,它从指令集、微架构到工具链具有完备自主知识产权。同时,中原芯还可进行SoC定制设计做事。这将有效改进国产IP核设计及容许上的短板。
那么,什么是异构系统架构?《中国电子报》的宣布有多少真材实料,又有多少水分呢?
| 什么是异构打算?
异构打算紧张是指利用不同类型指令集(X86、ARM、MIPS、POWER......)和体系架构的打算单元(CPU、GPU、DSP、ASIC、FPGA......)组成系统的打算办法。
举例来说,AMD的APU实在就属于异构打算。
【编者注:AMD,即超微半导体公司。AMD公司专门为打算机、通信和消费电子行业设计和制造各种创新的微处理器(CPU、GPU、APU、主板芯片组、电视卡芯片等)、闪存和低功率处理器办理方案,是目前业内唯一一个可以供应CPU、GPU、主板芯片组三大组件的半导体公司。】
异构打算紧张的优点有:
一是可以让各个打算单元实行自己最善于的任务。术业有专攻,CPU、GPU、DSP、FPGA等打算单元各有千秋,在引入特定打算单元,让打算系统变成稠浊构造,就能让CPU、GPU、DSP、FPGA实行自己最善于的任务,并相对付同构打算可能有一定性能上风,或性能功耗比上风。
二是可以避免显式拷贝。最新的异构打算理论上哀求实现CPU、GPU、DSP等打算单元实现内存统一寻址,使CPU、GPU等打算单元可以共享内存,不必将数据复制一份到对方的内存区域中。
异构打算并非新观点,AMD、ARM等公司早已成创新构系统架构基金会 (HSA Foundation)。其余,异构打算在超算领域已经有一定的运用,而且已经有取代同构打算的发展趋势。
举例来说,美国泰坦(每个打算节点由1个AMD Opteron 6274处理器和1个NVIDIA Tesla K20加速器组成),中国天河2号(每个打算节点由2个E5和3个Xeon Phi组成)。中国正在升级或培植的3台100P超算也都采取异构打算。
相对付上述提到泰坦和天河2号,由于CPU和加速器无法共享内存,会由于须要显式拷贝而导致性能丢失,最新的异构系统架构的上风在于可以发展成统一的内存体例——在理论上,可以实现CPU、GPU、DSP等打算单元实现内存统一寻址,使各个打算单元交互数据时,不再须要将自身内存区域中现有的数据复制一份到对方的内存区域中,而是可以直接通过相同的地址访问到,在内存和显存的设计科学合理的条件下,实现性能提升。
其余,在编程方面,可以避免显式拷贝,使程序员们不用参与不同打算单元的内存管理,能有效降落编程的繁琐程度。
当然,空想很丰满,现实很骨感——不同核心直接cache级别的互通始终是HSA架构无法占领的难关——虽然AMD的APU通过将CPU和GPU集成到一个芯片上实现了共享内存。但CPU和GPU的Cache却还没有做到统一,不同核心直接cache级别的互通,而这也是HSA架构最大的技能难点(CPU,GPU,DSP的缓存模型不同)。即便AMD等厂商给HSA画了非常美好的蓝图,但就现阶段而言,HSA的上风并不大。
| 中原芯的技能究竟如何?
中原芯未必能实现Cache级别的互通。
在HSA方面,AMD显然是最有发言权的厂商之一,但其APU也只实现了CPU+GPU,而且实现了内存共享,但CPU和GPU的Cache却还没有做到统一,而中原芯言之凿凿,“该产品在架构层面成功整合了CPU、GPU、DSP,实现了异构多核的内存统一寻址,使不同内核真正无缝地紧密联系在一起,”一家初出茅庐公司的技能水平已经超越AMD这样的老牌IC设计公司了,这实在令人难以置信,不知道AMD看到这段笔墨做何感想。
中原芯所谓“自主知识产权”存在水分
根据《中国电子报》的宣布,“中原芯正在开拓并即将推出的‘统一处理器平台’是环球首次推出完备支持HSA标准的CPU+GPU+DSP的处理器IP核平台,它从指令集、微架构到工具链具有完备自主知识产权。”这段笔墨所蕴藏的实在让人难以置信。
虽然海内IC设计厂商推出了不少产品,但大多都是购买购买国外 IP核授权,或者便是国外芯片的马甲,能做自主设计CPU或GPU或DSP的单位如百里挑一,更遑论同时具备三者的设计能力。
因此,笔者是不太相信一家在此之前从未听闻,也没有什么技能积累的厂商,能横空出世,并溘然间同时具备CPU、GPU、DSP的设计能力。
而自主指令集虽然实现难度并不大,比如深圳中微电就采取了自主指令集,但是由于不可能兼容现有的软件生态,在商业化方面基本不具备市场前景。在党政军市场早已被龙芯、申威、飞腾等自主芯片瓜分完毕,武器装备、人造卫星、航天设备等分外领域的嵌入式芯片也已“名花有主”的情形下,采取自主指令集既不具备商业市场前景,也无法在党政军市场赢得一席之地。
加上领导非常喜好“自主知识产权”的成分,所谓“从指令集、微架构到工具链具有完备自主知识产权”很有可能有相称大的水分。
宣扬言过实在
就现阶段而言,HSA的上风并不明显,还远远达不到“给打算性能以革命性的提高”的地步。
而且就软件而言,虽然APU统一寻址能方便编程,能使程序员们不用参与繁琐的CPU-GPU内存管理,但《中国电子报》对中原芯的宣布中称“任何程序都不必费心考虑不同处理器内核之间的存储差异”——肃清CPU、GPU、DSP、ASIC、FPGA等打算单元之间的存储差异,即便是AMD也只能表示:“臣妾做不到啊!
”
| 海内涵异构打算方面做得如何?
虽然异构打算是老观点了,但由于现阶段并不具备多少比较上风,因而只在超算等为数不多的领域取得了明显的成绩,有取同构打算而代之的趋势。
相对付中原芯这样的处于纸面上的产品,上海高性能集成电路设计中央设计的国产众核芯片则是比较成功的例子,该芯片有数个主核心和两百余个从核心,主核心紧张卖力逻辑运算,两百余个从核心可以使芯片拥有非常高的理论双精浮点性能和良好的性能功耗比(小道称10-15G/W),其峰值双精度浮点运算速率超过每秒3万亿次(3TFlops),完备追平了Intel第二代Xeon Phi(也是Intel最好的众核芯片)。
结合《我国首个研究完备自主知识产权的异构打算处理器实验室破茧》的新闻看,中原芯通用途理器技能有限公司目前还处于草创阶段,其官方网站也非常简陋,除“成为海内嵌入式处理器领域拥有自主知识产权的一流设计企业”表示中原芯主攻嵌入式处理器外,基本没有任何有代价的信息,中原芯现在有可能依旧处于草台班子阶段。加上“从指令集、微架构到工具链具有完备自主知识产权”须要非常深厚的技能积累,并非朝夕之间可以铸就。
笔者斗胆推测,所谓“是环球首次推出完备支持HSA标准的CPU+GPU+DSP的处理器IP核平台,它从指令集、微架构到工具链具有完备自主知识产权”有很大的水分,即将推出的产品很有可能便是一款集成了CPU+GPU+DSP的SOC,以目前中原芯的公开资料和媒体的干系宣布,中原芯颇有套取政策之利的嫌疑。
智能硬件第一媒体 长按二维码关注