(本文作者为比特大陆前技能总监谢丹。文章不雅观点为作者个人见地,不代表EETOP态度)
序言:随着大算力矿机集体入场,一代机皇蚂蚁矿机S9将要退出历史舞台。回顾历史,作者认为,成都团队通过动态触发器,实现了对竞争对手的跨代上风,也是S9成功的紧张缘故原由。S9的设计是比特币矿机的奇迹,成为了比特币矿机中生产最多的矿机,生命周期三年多,被称为机皇。
2014年8月,我在成都开了一家后端设计做事公司,我想做有增值代价的后端设计做事。在找客户的时候,我上网搜索了一下,以为做比特币矿机的公司该当有着这方面的需求,于是给当时比特大陆的网站上的邮箱写了封电邮:

当时,我给很多家集成电路设计公司都写过邮件,而比特大陆是最快回答的一家。后来谈天的时候理解到,这个邮箱当时是吴忌寒吴总在利用,比特大陆那时恰好也在探求提高芯片竞争力的方案。于是吴忌寒把这个邮件转给詹克团詹总,詹总玄月途经成都和我见面了。詹总和我面谈了两次,大家聊得不错。詹总以为这个项目韶光很长,风险较大,且存在知识产权的顾虑,建议我终结公司,带领团队加入比特大陆。
2014年10月,我带着两个人的小团队正式加入比特大陆,成为比特大陆的全定制部门。最初的方向便是邮件中讲的多米诺逻辑。
多米诺逻辑是一种比较成熟的动态逻辑构造,其紧张形态是这样的:
多米诺逻辑电路相对付对应的静态电路,有着以下优点和缺陷:
由于旗子暗记只须要驱动N管,以是电容较小,速率较快。
由于A点是动态点,以是末了的反向器M3/M4是必须的。
A点存在charge-sharing的问题。
M1,M2,M3,M4为新增器件,PMOS为减少器件
由于M1、M2为时钟旗子暗记驱动,以是它的功耗至少是其它普通旗子暗记的2倍以上。
以是,从功耗上考虑,M1与M2由于是时钟旗子暗记,它的功耗至少按照两倍旗子暗记的功耗算,则 M1+M2+M3+M4的功耗是增加了 6个MOS管的功耗,对付一样平常逻辑来说,超过12个MOS管的标准单元库并不多。从面积上讲,M2+M4增加了2个NMOS管的面积,而PMOS虽然少了,但在版图上很难把这节省的面积表示出来。也便是说:多米诺逻辑虽然会加快芯片速率,但是面积与功耗都稍有增加。
当我们2015年1月把结论提交的时候,基本确认了多米诺逻辑是不适应矿机芯片的。比特币矿机芯片由于纯并走运算,速率并不那么主要。矿机最大的本钱在于电费,以是,功耗是最主要的。我们在进行面积与功耗的大拇指规则 (rule of thumb) 评估时,功耗的权重是面积和速率的3倍以上。
我们多米诺逻辑考试测验的失落败,并没有打击我们的探索,由于我们创造了一种适宜动态逻辑其历年夜管子多的标准单元,而这种标准单元有一个很明显的例子,便是触发器Flip-flop。于是我们重回开始,以动态的触发器做为攻坚目标。
在集成电路的开始,上个世纪的七十年代,由于每个晶体管的本钱高,以是,那个时候的触发器都是动态的,无论是domino flip-flop,C2MOS edge-triggered flip-flop,还是TSPC positive-edge Flip-flop 等,都是当时的产物。我们从中创造了宝库。
比如一个TSPC positive-edge Flip-flop ,它的逻辑如下:
仍旧按照我们clock gate算作两个gate的话,这个flip-flop统共便是 42+7=15 个gate 等价。
而我们之前最常用的静态触发器的构造是这样的:
再加上clk的反向器,这个我们加一起便是 82+12 +4 =32个 gate等价。静态逻辑的触发器等价管子数功耗比动态逻辑多1倍以上。
同样的,从面积上看,动态逻辑是11个器件,而静态逻辑是22个器件,恰好是一倍的面积。
我们在确认了采取动态逻辑的触发器之后,接下来便是如果融入我们的设计流程。我们末了在静态逻辑的触发器的功能描述上,增加了部分韶光的约束,以防止动态逻辑中泄电流导致动态电容点泄电。并且在时序和功耗提库时,用静态触发器的一些参数进行套用。大略说,我们在动态逻辑上加了一个外框,让它在前端设计职员看来,便是一个正常的静态触发器,对付前端设计与综合,没有任何的不同。
完成了对动态触发器的提库,我们相称于有一个面积为原来一半,且功耗为原来一半,时序险些类似的新的触发器了。由于比特币须要一直地皮算,以是静态触发器须要保存较永劫光的数据就没有必要。当我们在完成动态触发器之后,比特币这种分布运算以及完备流水线的逻辑就特殊适宜动态触发器了。对付pipeline流水线来说,它的构造是这样的:
我们可以直接改为:
考虑到现在新的动态触发器的面积和功耗只有原来的一半,新的流水线在相同面积和相同功耗下,增加了一倍的速率。在我们比特币的矿机芯片,便是自己从32级流水线改为了64级流水线,增加一倍算力。
我们在2015年中完成对28nm的BM1385芯片设计(蚂蚁矿机S7),并且在2015年年底完成对16nm的BM1387芯片设计(蚂蚁矿机S9)。在性能表示上,我们的28nm险些和对手的16nm相同的性能,而我们的16nm芯片则是对手的一半本钱。通过动态触发器,我们实现了对竞争对手的跨代上风。特殊是S9的设计,是比特币矿机的奇迹,成为了比特币矿机中生产最多的矿机,生命周期三年多,被称为机皇。
在险些不须要软件环境的数字货币挖矿行业,一件产品只有竞争对手一半的本钱,这是非常大的竞争上风,这意味你可以进行为所欲为的价格战上风。由于你卖到对手不挣钱了,而比特大陆还有50%以上的毛利率。正是凭借着动态逻辑这个秘密武器,依赖S7与S9的销量成功,让比特大陆从不到20%市场份额的群雄纷争局势一举变成一家独大(70%以上份额)。
比特大陆崛起的一个直接征象,便是国外比特币芯片公司的退出市场,2014年和2015年高调的KNC、bitfury、Spondoolies-Tech、21 Inc.都很快宣告破产或者退出矿机芯片市场。
随着比特大陆一些员工的离开,动态触发器这个技能逐渐地传播到海内其它的芯片开拓商那里,但是这个技能基本还是约束在海内了。2017年日本GMO还在12nm以及7nm试图进入这个领域,从这家公司的宣扬上看,他们还是采取的静态触发器的构造,再加上遇上了2018年的熊市周期,一年后就亏损退出这个市场,是可以预期的。
在16nm之前,新一代工艺mask在数百万美元以内,而重新设计动态逻辑的技能、人力与风险显然是高于数百万美元的,以是动态逻辑的上风无法表示。然而16nm之后,新的10/7nm,以及将来的5nm的本钱都数千万美元了。动态逻辑能够超越一个制程节点的性能就会让它显得更加上风,抖擞出新的生命力。我期待着更多的运用动态逻辑的公司涌现,让这个古老的设计艺术重现在我们时期。