这一神奇的技能到底是什么?它为何能显著提高芯片性能?科技日报就此采访了干系专家。
高度集成,把打算与存储功能合二为一

对付我们常用的打算机来说,存储器可分为内部存储器和外部存储器。内部存储器,即“内存”,是电脑的主存储器。它的存取速率快,但只能储存临时或少量的数据和程序。
外部存储器,常日被称为“外存”,它包括硬盘、软盘、光盘、U盘等,常日可永久存储大量数据,如操作系统、运用程序等。当运行某一程序时,处理器(CPU)会先从内存中读取数据,而后将一部分结果写入内存,并选择性地将另一部分结果写入外存进行永久保存。
也便是说,常日情形下,内存只能存储少量数据,打算机中大部分数据都“住”在外存。当CPU运行程序时就须要调取数据,若调取“住”在内存的数据,则用时较少;若调取“住”在外存的数据,则可能要费些周折。
因此科学家就想,能否把数据都存在内存里呢?于是,内存打算技能涌现了。
“内存打算技能是伴随着大数据处理技能的兴起而兴盛起来的。在处理大数据过程中,由于数据量极大,处理数据时频繁访问硬盘这些外存会降落运算速率。随着大容量内存技能的兴起,专家开始提出在初始阶段就把数据全部加载到内存中,而后可直接把数据从内存中调取出来,再由处理器进行打算。这样可以省去外存与内存之间的数据调入/调出过程,从而大大提升打算速率。”北京航空航天算夜学打算机学院教授、中德联合软件研究所所长刘轶见告科技日报。
“但普林斯顿大学研发团队采取的‘内存打算’技能与上述观点中所指的内存打算并不完备相同。”刘轶说,普林斯顿大学所采取的技能实在是PIM(Process in-memory),常日被翻译为“存内打算”“存算一体”或“打算存储一体化”。
“PIM技能是指直接在内存中处理数据,而不是把数据从内存读取到处理器中进行处理。”刘轶指出,PIM的技能观点在1990年就已被提出,虽然干系研究论文早已揭橥出来,但干系技能始终难以落地。
刘轶认为“难落地”的紧张缘故原由在于,PIM技能尚难以达到传统打算机冯·诺依曼构造的灵巧性和通用性水平。“目前,学界所提出的PIM技能,只能做某些类别的运用,难以实现灵巧编程。”他说。
可办理“存储墙”问题,大幅提升性能
在刘轶看来,PIM技能的主要代价在于,其能办理传统打算机构造存在的“存储墙”问题。传统打算机采取的冯·诺依曼构造,须要CPU从内存中取出指令并且实行,某些指令又须要从内存读取数据进行处理,再将结果写回内存。由于处理器所实行的程序和待处理的数据都被存在内存中,这样处理器在运行过程中须要频繁访问内存。随着微电子技能的发展,处理器性能的进步速率逐渐快于内存性能。
近30年来,处理器性能每年提升55%,而内存访问速率每年仅提升7%。这使得处理器的处理速率远远快于内存的读取速率,直接导致了“存储墙”的涌现,严重拖慢了程序实行速率。
“这好比一个人消化能力很强,饭桌上也有很多食品,但这个人的嗓子眼儿很细,咽不下去。这就使得强大的消化能力‘无用武之地’,也限定了这个人吃东西的速率。”刘轶说。
“近年来深度学习等新型算法的兴起,对推倒‘存储墙’提出了更急迫的需求。”刘轶指出,新型算法访问内存的模式跟传统模式不太相同,刷脸、图片识别、机器翻译等新型算法每每以类似于人脑的办法实现对繁芜数据的处理。由于这类算法涉及的神经元数量多、演习样本量大,这导致在通用打算机上进行深度学习打算的效率比较低。
为了提高效率,科研职员开拓了各种加速部件和专用的深度学习处理器,前者的范例代表是图形处理器(GPU),后者的范例代表有谷歌公司的张量处理器(TPU)、海内的寒武纪处理器等。
“CPU、GPU等处理器通过总线与内存相连,总线的传输速率决定了打算的效率。”中国自动化学会稠浊智能专业委员会副主任、复旦大学打算机学院教授张军平见告科技日报,人们正在考试测验通过改进,减少数据在总线上的传输次数,提高打算效率。例如,科研职员让CPU具备部分的GPU功能,或使GPU具备一些CPU的功能等。
刘轶表示,上述改进方法仍旧属于冯·诺依曼构造,不能从根本上办理“存储墙”问题。比较之下,PIM技能在办理“存储墙”问题上更具上风。首先,它的打算模式更适宜深度学习等新型打算模式;其次,PIM技能避免了冯·诺依曼构造处理器频繁访问内存这一问题,减少了数据传输次数,降落了功耗。
具有发展潜力,但尚难取代通用途理器
通过查阅资料创造,PIM技能运用最大的难点在于制造工艺。
PIM技能须要利用前辈的半导体工艺将处理器和存储器集成在同一芯片内,使之通过片上网络相互连接。但由于目前处理器与存储器的制造工艺不同,若要在处理器上实现存储器的功能,则可能会降落存储器的存储密度;若要在存储器上实现处理器的功能,则可能会影响处理器的运行速率。
张军平指出,现阶段内存本身不具备打算功能,因此若想实现内存打算或PIM技能都须要对内存进行重新设计。
“普林斯顿大学不是专业的芯片公司,其推出的新型芯片可能只是一种技能上的探索,离真正的家当化运用还有相称长的间隔。”张军平认为,随着固态硬盘等技能的发展,如果硬盘读写速率足以媲美内存,内存与外存可能被集成为新型大容量高速存储器。未来最空想的情形是,CPU、GPU等多种处理器与大容量高速存储器实现一体化高度集成。
刘轶强调,普林斯顿大学设计的这种处理器是一种专用途理器,它只针对深度学习运用,无法取代传统的通用途理器。
“正如华为、苹果等公司推出的高端手机上大多配置了深度学习处理器,但只作为附属部件,核心的打算和处理仍旧由通用途理器来完成,只是把特定的任务和打算模块交由深度学习处理器来进行打算,而且是在通用途理器的掌握之下完成的。”刘轶说。
“短期来看,PIM技能只能被用于特定类别的运用处景,难以取代通用途理器。”刘轶认为,从长远来看,如果半导体材料和器件技能无法取得打破,集成电路的摩尔定律将在不久的未来失落效,即集成电路芯片内的晶体管数量将停滞增长。这会对传统的打算机系统构造乃至打算机硬件和软件家当造成巨大的影响,由此也很可能引发重大的技能变革。当新的打算构造涌现时,高度集成化的系统可能会对PIM技能有更多需求,但该技能能否成为主流仍有待不雅观察。










