广告

一代机皇蚂蚁矿机S9成功的主要原因分析

比特大陆前技术总监发文 揭秘 S9 如何成为一代机皇

前言:随着大算力矿机集体入场,一代机皇蚂蚁矿机S9将要退出历史舞台。回顾历史,作者认为,成都团队通过动态触发器,实现了对竞争对手的跨代优势,也是S9成功的主要原因。S9的设计是比特币矿机的奇迹,成为了比特币矿机中生产最多的矿机,生命周期三年多,被称为机皇。

本文作者为比特大陆前技术总监谢丹吴说区块链授权发布。文章观点为作者个人意见,不代表吴说区块链立场


2014年8月,我在成都开了一家后端设计服务公司,我想做有增值价值的后端设计服务。在找客户的时候,我上网搜索了一下,觉得做比特币矿机的公司应该有着这方面的需求,于是给当时比特大陆的网站上的邮箱写了封电邮:

当时,我给很多家集成电路设计公司都写过邮件,而比特大陆是最快回复的一家。后来聊天的时候了解到,这个邮箱当时是吴忌寒吴总在使用,比特大陆那时正好也在寻找提高芯片竞争力的方案。于是吴忌寒把这个邮件转给詹克团詹总,詹总九月路过成都和我见面了。詹总和我面谈了两次,大家聊得不错。詹总觉得这个项目时间很长,风险较大,且存在知识产权的顾虑,建议我解散公司,带领团队加入比特大陆。

2014年10月,我带着两个人的小团队正式加入比特大陆,成为比特大陆的全定制部门。最初的方向就是邮件中讲的多米诺逻辑。

多米诺逻辑是一种比较成熟的动态逻辑结构,其主要形态是这样的:

多米诺逻辑电路相对于对应的静态电路,有着以下优点和缺点:

  1. 因为信号只需要驱动N管,所以电容较小,速度较快。

  2. 因为A点是动态点,所以最后的反向器M3/M4是必须的。

  3. A点存在charge-sharing的问题。

  4. M1,M2,M3,M4为新增器件,PMOS为减少器件

  5. 因为M1、M2为时钟信号驱动,所以它的功耗至少是其它普通信号的2倍以上。

所以,从功耗上考虑,M1与M2因为是时钟信号,它的功耗至少按照两倍信号的功耗算,则 M1+M2+M3+M4的功耗是增加了 6个MOS管的功耗,对于一般逻辑来说,超过12个MOS管的标准单元库并不多。从面积上讲,M2+M4增加了2个NMOS管的面积,而PMOS虽然少了,但在版图上很难把这节省的面积体现出来。也就是说:多米诺逻辑虽然会加快芯片速度,但是面积与功耗都稍有增加。

当我们2015年1月把结论提交的时候,基本确认了多米诺逻辑是不适应矿机芯片的。比特币矿机芯片因为纯并行运算,速度并不那么重要。矿机最大的成本在于电费,所以,功耗是最重要的。我们在进行面积与功耗的大拇指规则 (rule of thumb) 评估时,功耗的权重是面积和速度的3倍以上。

我们多米诺逻辑尝试的失败,并没有打击我们的探索,因为我们发现了一种适合动态逻辑其积大管子多的标准单元,而这种标准单元有一个很明显的例子,就是触发器Flip-flop。于是我们重回开始,以动态的触发器做为攻坚目标。

在集成电路的开始,上个世纪的七十年代,因为每个晶体管的成本高,所以,那个时候的触发器都是动态的,无论是domino flip-flop,C2MOS edge-triggered flip-flop,还是TSPC positive-edge Flip-flop 等,都是当时的产物。我们从中发现了宝库。

比如一个TSPC positive-edge Flip-flop ,它的逻辑如下:

仍然按照我们clock gate算作两个gate的话,这个flip-flop总共就是 4*2+7=15 个gate 等价。

而我们之前最常用的静态触发器的结构是这样的:

再加上clk的反向器,这个我们加一起就是  8*2+12 +4 =32个 gate等价。静态逻辑的触发器等价管子数功耗比动态逻辑多1倍以上。

同样的,从面积上看,动态逻辑是11个器件,而静态逻辑是22个器件,正好是一倍的面积。

我们在确认了采用动态逻辑的触发器之后,接下来就是如果融入我们的设计流程。我们最后在静态逻辑的触发器的功能描述上,增加了部分时间的约束,以防止动态逻辑中漏电流导致动态电容点漏电。并且在时序和功耗提库时,用静态触发器的一些参数进行套用。简单说,我们在动态逻辑上加了一个外框,让它在前端设计人员看来,就是一个正常的静态触发器,对于前端设计与综合,没有任何的不同。

完成了对动态触发器的提库,我们相当于有一个面积为原来一半,且功耗为原来一半,时序几乎类似的新的触发器了。因为比特币需要不停地计算,所以静态触发器需要保存较长时间的数据就没有必要。当我们在完成动态触发器之后,比特币这种分布运算以及完全流水线的逻辑就特别适合动态触发器了。对于pipeline流水线来说,它的结构是这样的:

我们可以直接改为:

考虑到现在新的动态触发器的面积和功耗只有原来的一半,新的流水线在相同面积和相同功耗下,增加了一倍的速度。在我们比特币的矿机芯片,就是自己从32级流水线改为了64级流水线,增加一倍算力。

我们在2015年中完成对28nm的BM1385芯片设计(蚂蚁矿机S7),并且在2015年年底完成对16nm的BM1387芯片设计(蚂蚁矿机S9)。在性能体现上,我们的28nm几乎和对手的16nm相同的性能,而我们的16nm芯片则是对手的一半成本。通过动态触发器,我们实现了对竞争对手的跨代优势。特别是S9的设计,是比特币矿机的奇迹,成为了比特币矿机中生产最多的矿机,生命周期三年多,被称为机皇。

在几乎不需要软件环境的数字货币挖矿行业,一件产品只有竞争对手一半的成本,这是非常大的竞争优势,这意味你可以进行随心所欲的价格战优势。因为你卖到对手不挣钱了,而比特大陆还有50%以上的毛利率。正是凭借着动态逻辑这个秘密武器,依靠S7与S9的销量成功,让比特大陆从不到20%市场份额的群雄纷争局面一举变成一家独大(70%以上份额)。

比特大陆崛起的一个直接现象,就是国外比特币芯片公司的退出市场,2014年和2015年高调的KNC、bitfury、Spondoolies-Tech、21 Inc.都很快宣布破产或者退出矿机芯片市场。

随着比特大陆一些员工的离开,动态触发器这个技术逐渐地传播到国内其它的芯片开发商那里,但是这个技术基本还是约束在国内了。2017年日本GMO还在12nm以及7nm试图进入这个领域,从这家公司的宣传上看,他们还是采用的静态触发器的结构,再加上遇上了2018年的熊市周期,一年后就亏损退出这个市场,是可以预期的。

在16nm之前,新一代工艺mask在数百万美元以内,而重新设计动态逻辑的技术、人力与风险显然是高于数百万美元的,所以动态逻辑的优势无法体现。然而16nm之后,新的10/7nm,以及将来的5nm的成本都数千万美元了。动态逻辑能够超越一个制程节点的性能就会让它显得更加优势,焕发出新的生命力。我期待着更多的应用动态逻辑的公司出现,让这个古老的设计艺术重现在我们时代。

24小时热点

打击诈骗:我做区块链被骗了

近年来,随着互联网的不断发展,诈骗事件也层出不穷。而区块链作 ...

8371

区块链网快讯

“波卡生态”概念是什么?

波卡生态是一种将技术、商业模式和新型思想相结合的生态系统,旨 ...

7392

国家信息中心数据保全平台

“星火·链网”正式启动

中国信息通信研究院工业互联网与物联网研究所所长金键首次介绍了 ...

470688

HitBTC交易所

英国央行2020年3月数字法币报告

这份题为"中央银行数字货币2020年3月:机遇、挑战和设计" ...

29432

CryptoPunk密码朋克

消息称央行数字货币在农行内测

受消息影响,数字货币开盘走强,截至发稿,汇金股份、高伟达涨停 ...

11203

道一数藏

MAS当局强调,豁免权将在指定期限内有效

火币、OK、币安三家头部数字资产交易平台在新加坡的主体获得了 ...

36096

Sushiswap

DAO将元宇宙房地产转化为投资

随着元宇宙不断成熟,去中心化自治组织(DAO)正在围绕利用和 ...

26897

BitMart

ECC董事会成员 James Wo 离职

3 月 18 日,Ethereum Classic Coll ...

44972

IOST

PFP是什么意思

PFP 的意思是“Profile Picture”,主要是指 ...

68597

ZT GLOBAL 交易所

对付传销人员最狠一招

这里想说的是,对付传销人员最狠的一招就是防范加上举报,而不是 ...

73403

Luart
广告

热点专题

专门忽悠企业家的中国十大骗子大师

区块链网创立于2015年初,为国内第一批有资质的区块链媒体, ...

2737144

希壤

2023年打假总结:Pi Network项目的传销性质Pi币

曾经,号称“走路就能赚钱”拥有大量用户和广泛影响的国内APP ...

2416605

文昌链

国内460种传销币套路和骗子币名单大曝光

打着区块链旗号,以聚集性传销、网络传销为手段,以每枚3元的价 ...

2081377

Coin Metrics

原力元宇宙佛萨奇骗局

原力元宇宙佛萨奇骗局是一种不可思议的幻想计划,它由一群英勇可 ...

1785976

聚币网

诈骗披露:成功学周文强

又一个“成功学”大师周文强翻车 你想一夜暴富吗?你想年薪百 ...

1428270

Lazy Lions

中国十大骗局之pi network(π币、pi币、派币、兀币)

中国十大骗局之pi network(π币、pi币、派币、兀币 ...

1308477

Gemini 交易所

柴犬币SHIB来了

因其可爱形象和马斯克代言,近段时间最耀眼的加密货币非狗狗币莫 ...

1264421

Luart

非常硬核的LP流动性挖矿的核算

MDX不同挖矿方法的真实收益率 如何挖取高APY?2021年 ...

1152358

RMRK

链圈打诈:3000名解放军去缅甸真的假的?

3000名解放军去缅甸这个是假新闻,出兵这是个大问题,如果我 ...

1150394

a16z

什么是去中心化交易所(DEX)?

去中心化交易所是一个基于区块链的交易所,它不将用户资金和个人 ...

1140251

bitFlyer交易所