广告

重构完全同步模式(Full Sync)

以太坊阶段式同步:重构完全同步模式(Full Sync)

阶段式同步(staged sync)重构自 Go-Ethereum 的完全同步模式(full sync),以实现更好的性能。

阶段式同步需要进行大量读写操作。虽然我们的目标是能够在机械硬盘上同步节点,但是我们仍建议使用固态硬盘。

顾名思义,阶段式同步需要依次执行 10 个阶段。


阶段式同步是如何运作的

Turbo-Geth 客户端会向每个对等节点了解该节点的 HEAD 区块(即最新区块),然后依次执行每个阶段、寻找本地 HEAD 区块和对等节点的 HEAD 区块之间缺失的区块。

第一个阶段(下载区块头)会设置本地 HEAD 区块。

各阶段会按顺序执行。在每个阶段执行期间,只有节点本地的状态达到目标状态,该阶段才会结束。

也就是说,在理想情况下(没有出现网络中断、应用没有重启等问题),每个阶段只需执行一次,即可完成初始同步。

最后一阶段结束后,整个同步流程会重新开始,寻找新的区块头下载。

如果你在两个阶段之间重启应用,应用会从第一阶段开始重启。

如果你在某个阶段执行期间重启应用,应用会从当前阶段开始重启,以完成该阶段。

每个阶段需要耗时多久?

通过下方的饼状图,我们可以看出每个阶段的耗时占比(这些都是从完全同步中得出的数据)。虽然这些数据并不精确,但是足以作为参考。

重组/回退

如果区块链发生重组,我们需要“回退”部分同步数据。

回退指的是从最后一个阶段倒退回第一个阶段。但是,需要注意的一点是,我们执行完回退之后才会更新交易池,因此我们知道新的 nonce 。

回退的阶段顺序如下例所示(从右往左依次发生)。

  1. state.unwindOrder = []*Stage{

  2. // Unwinding of tx pool (reinjecting transactions into the pool needs to happen after unwinding execution)

  3. stages[0], stages[1], stages[2], stages[9], stages[3], stages[4], stages[5], stages[6], stages[7], stages[8],

  4. }

通过 ETL 进行预处理

在将数据插入数据库之前,一些阶段会使用我们的 ETL 框架根据键值对数据进行排序。

这样就可以极大减少数据库写入放大(write amplification)的情况。

因此,当我们生成索引或者说哈希值化状态(Hashed State)时,我们会执行一个多步骤流程。

  1. 将处理过的数据写入位于数据目录的几个临时文件中;

  2. 然后使用一个堆栈(heap)把临时文件中的数据插入到数据库中,并且使按照能够最小化数据库写入放大现象的顺序插入数据。

这种优化有时会将写入速度提高几个数量级。

各阶段(如需查看最新列表,请访问stagedsync.go)

每个阶段都包含两个函数,分别是向前推进阶段的ExecFunc 和向后回退阶段的 UnwindFunc。

从理论上来说,部分阶段可以离线工作,但是当前版本并未实现这一功能。

阶段 1 :下载区块头

在这一阶段,我们会下载本地 HEAD 区块和对等节点的 HEAD 区块之间的所有区块头。

这一阶段是 CPU 密集型的,适合使用多核处理器,因为要验证区块头的工作量证明。

由于区块链重组,大多数回退都是在这一阶段开始的。

这一阶段会推动本地 HEAD 的指针(指向更新的区块)。

阶段 2 :区块哈希值

从区块头中抽取出一个从区块哈希值映射成区块号(blockHash -> blockNumber)的索引表,以支持更快速的查找功能,并让同步过程对机械硬盘更为友好。

阶段 3 :下载区块体

在这一阶段,我们会将上一阶段已下载区块头的区块体也下载下来。

这一阶段需要保持良好的联网连接。绝大多数数据都在这一阶段下载。

阶段 4 :复原发送者

这一阶段会复原出并存储每个已下载区块中的每笔交易的发送者。

这一阶段同样是 CPU 密集型的,适合使用多核处理器。

这一阶段不需要联网。

阶段 5 :执行区块

在这一阶段,我们会执行之前下载的所有区块中的每一笔交易。

需要注意的一点是,在执行区块的过程中,我们不会验证根哈希,甚至不会创建默克尔树。

这一阶段是单线程的,无需联网,需占用大量磁盘空间。如果区块执行失败,可以回退该阶段。

阶段 6 :计算状态根

这一阶段会构建默克尔树,并验证当前状态的根哈希。

这一阶段也会构建中间哈希值(Intermediate Hashes),并将它们存储到数据库中。

如果之前没有存储任何中间哈希值(这种情况可能在第一个初始同步期间发生),这一阶段会构建出完整的默克尔树及其根哈希。

如果数据库中没有中间哈希值,这一阶段就会利用区块的历史记录来弄清楚哪些哈希值已经过时,哪些哈希值是最新的,然后使用最新的哈希值来构建部分默克尔树,只重构过时的哈希值。

如果根哈希无法匹配,就会向后回退一个区块。

这一阶段不需要联网。

阶段 7 :生成哈希值化状态

在执行期间,Turbo-Geth 使用无格式状态存储(Plain state storage)。

无格式状态(Plain State):在标准状态(我们称之为 “哈希值化状态”)中,账户和存储项的地址是 keccak256(address) ,但是在一般状态中,二者的地址就是 address 。

尽管如此,为了确保一些 API 能够正常运作并与其它客户端保持兼容,我们也会生成哈希值化状态。

如果哈希值化状态不是空值,我们会查看历史记录变更集(History ChangeSet),并且只更新已更改的项。

这个阶段不需要联网。

阶段 8、9、10 :生成索引

同步期间会生成 3 个索引。

这 3 个索引可能会被禁用,因为所有 API 都不使用它们。

这一阶段不需要联网。

交易查询索引

该索引表由从交易哈希值到区块号的映射构成。

账户历史索引

该索引存储了从账户地址到区块列表(在这些区块中,该账户的状态有了更改)的映射。

存储历史索引

该索引存储了从存储项地址到区块列表(其中,该存储项在一定程度上有了更改)的映射。

阶段 11 :交易池

在这一阶段,我们会启动交易池或更新其状态。例如,如果我们已下载的区块中包含了某些交易,就把这些交易从交易池中移除。

在回退时,我们会将被回退的区块中的交易重新添加到交易池中。

这个阶段不需要联网。

原文链接:

https://github.com/ledgerwatch/turbo-geth/tree/master/eth/stagedsync

作者: Alex Sharov

翻译&校对: 闵敏 & 阿剑

24小时热点

在元宇宙概念推动下虚拟数字人市场迅速升温

区块链网专职打假记者郭一凡报道:近段时间以来,在元宇宙概念推 ...

14121

CoinMarketCap

KSM质押流动性方案:rKSM

在StaFi rKSM产品上线之前,这张图片可以帮助你更好地 ...

44293

bitFlyer交易所

Chaince交易平台涉嫌非法传销?

Chaince交易平台涉嫌非法传销现象的问题是一个很棘手的问 ...

8411

聚币网

元宇宙可能会推动个人逐渐数字化

2021年是元数据元年,这是一个具有全球影响和深入讨论的概念 ...

20058

币王

AME币(AMEPAY)挖矿软件?

AMEPAY 发布了一款基于AME币(AME)网络的挖矿软件 ...

6605

热币Hotcoin

“Artpro”数字藏品(NFT)简介

ArtPro作为一种数字藏品(NFT),是一种将元数据与图片 ...

33553

CollinStar

在 Polkadot 中如何进行 Staking?

Polkadot 使用 NPoS(提名权益证明机制)作为选择 ...

56096

区块链弊端

向25个项目捐赠100万美元的以太坊基金会是谁?

2月10日,以太坊基金会宣布已向与以太坊 2.0 质押相关的 ...

24106

以太坊币今日价格

“元链”数字藏品(NFT)简介

左右 元链数字藏品(NFT)是基于区块链技术的数字资产。它 ...

37654

BscScan

美联储最大的股东是什么人

美联储的最大股东是美国政府。美联储是一家独立美联储央行,受美 ...

79358

文昌链
广告

热点专题

NFT艺术品到底是什么?

Beeple,“EVERYDAYS: THE FIRST 5 ...

2298983

Opera House

最全的NFT发展史

当我们理解一个新生事物,必须要首先了解其起源,通过对其源头以 ...

1740177

iBox

“华英会”诈骗圈钱5000亿!崩盘后将会凄惨无比

“华英会”崩盘的预警已多次发出,尽管尚未正式宣布崩盘,但大家 ...

1262592

Magic Eden

什么是IDO?这种模式会带来怎样的影响?

要理解IDO(Initial DeFi Offering)初 ...

1138727

Bitstamp交易所

有黑客采取新型 USDT 假充值手法

根据慢雾区情报,有黑客采取新型 USDT 假充值手法,黑客采 ...

992710

区块链博客

4种利用永续合约资金费率套利的策略

下文将介绍在保持市场中立的条件下,如何从永续掉期资金费率中套 ...

895907

DCG区块链孵化器

国内NFT平台是怎么赚钱的?

2021年被称为NFT的“元年”,互联网巨头、各大企业、艺术 ...

794741

CoinBene满币网

链圈百科:韩国政府机构组织图

一、行政院 韩国行政院是一个由政府的行政机构组成的中央政府 ...

792024

BitKeep钱包

元宇宙平台合法吗

现在,元宇宙平台备受热捧,但有人质疑其合法性。在此,我们将对 ...

731622

T网

宝二爷郭宏才的乘风破浪之旅

10年后的比特币会涨到10万美元吗?宝二爷说过:“先吹吹牛B ...

701712

QuillAudits