常常有人问:NV GPU 和你家架构上有什么差异?为什么他家做的这么好,你们不是做GPU的吗。
先明一点哈,AI 芯片有分ASIC, FPGA,GPU 乃至CPU等,不要讲通用性专用性,不要讲可否编程,不要讲指令集,等做牛逼了,什么都能一卡实现。

大家都说人家做的是GPGPU, 你们做的ASIC, 怎么能比吗?

扯蛋,都是AI芯片,起个名字叫GPGPU,或是GPU就高人一等了吗。人家做得好,不是由于这名字,是人家皮囊下面的东西不一样。以是大家不要以名字论英雄了,根本不是名字的差异。
回到正题,从两方面说一下,1. 没有什么不同。2. 什么都不同
为什么说没有什么不同:
这玩意里面都是有存储(HBM/DDR/Cache),打算单元(Core),网络组成,当然还有比如调度,接口等其他方面组成,紧张的架构都是一样的。在运用领域,都能用于传统模型,大模型,都具有灵巧性和可编程性,都能兼顾专用领域和通用领域,都能进行推理和演习,都能互联,能上云虚拟化以是说这玩意不是名字能决定的。从架构上确实一样。
那为什么说什么都不同呢:
人家有针对专门算法的的Transformer 引擎,再加上前辈制造加持,处理效率成倍提升;编程可以实现任意core的利用和调度,你能搞出打算核心,但你搞不出这么牛逼核心,人家是坐的火箭,你是坐得汽车。HBM/Cache 不仅大,而且快准合理,你可能连什么模型须要多大的Cache才是完美的都不知道。人家总线事情起来有条不紊,虚拟化中可分可合,可灵巧调度所有卡内资源,休眠时就和断电差不多,这东西可不是说做就能做的。比如HBM 这个,并不是你贴上颗粒,加个Controller 和Phy就完事了的。做出来的芯片,通过难以匹敌的软件栈调度,加速,指挥,不仅仅可以加速传统模型,和大模型也是完美契合,发挥其搞算力上风。通过软件栈,可以在须要时调度所有硬件去完成一个看似串行才能完成的任务。虚拟化,MIG,就像一个军队,既能分工互助,各个击破,也能整洁划一,一击而中。云边端都适用,以是所向披靡。网络互联这块,不管是Die to Die 还是芯片和往后设备处理器上的互联,比如NVlink之类。新功能的考试测验,比如加密打算,DPX指令等,你们可能还没有太多涉及此领域,人家已经开始了新的研究方向。鬼知道来日诰日的新技能是什么,但是他们可以已经在研究了。GPU 是一个整体,包括其功耗,散热,安全性,稳定性等等,都是导致差异的成分。其余还有些因数促进了其发展。
不遗余力的生态培植,通过去全天下孵化新兴企业,让他们不断在前面探索,实践,试错,利用别人的考试测验考验自己的产品,摸索自己的计策方向,虽说达到互惠互利,但更多的是实现自己的超越。同样通过在各大院校,研究机构互助,扩大自己的影响力;通过各种会议,活动宣扬自己(当然现在不须要卖力吆喝了)。OpenAI, Google, 乃至Microsoft, Amaze ,BAT等各大企业也都在争抢NVIDIA的产品,不经产品大卖,同时也促进了技能的快速发展,运用的完善。未来还有很多不愿定性,未来可能不属于NVIDIA, 但是当下真的是如日中天!!
还是之前的话,0到1我们是有了,但是想到100我们还迢遥。当然这些个差异都须要永劫光的深厚积累,不是一朝一夕可以追遇上的。以是我们的机构和他们并没有差异,我们只是还须要韶光。








