根据百度方面的信息,他们从2011年开始就在研究基于FPGA的AI加速器,在数据中央中则开始利用GPU,如今推出的昆仑AI芯片则是凑集了多年来在CPU、GPU及FPGA领域研究的所长,迭代了20多次才研发出来的。
昆仑AI芯片除了能打算深度学习算法之外,还可以适配自然措辞处理、大规模语音识别、自动驾驶、大规模推举等终端场景打算哀求。百度CEO李彦宏表示昆仑是目前业内设打算力最高的AI芯片。

详细来说,昆仑AI芯片利用三星14nm工艺代生产,内部有成千上万个小核心,30倍性能于FPGA加速器,带宽512GB/s,100W功耗下能带来260TFOPS的AI性能。
260TFLOPS的性能确实不低,此前AI独角兽寒武纪发布的MLU100加速器在80W、100W功耗下分别能供应128TFLOPS、166TFLOPS的性能,NVIDIA的Telsa V100 NVLink版的深度学习性能是125TFLOPS,TDP功耗300W,不过V100是GPU加速AI运算,其本身也是高性能GPU,跟专用的AI芯片还不一样,这里只是比较下AI性能。










