深入了解以太坊虚拟机
本文由幣乎社區(qū)(bihu.com)內(nèi)容支持計(jì)劃贊助。
譯者說(shuō),深入了解以太坊虛擬機(jī)是一個(gè)系列的文章,一共5篇! 本文是第1篇,主要介紹的是以太坊虛擬機(jī)匯編代碼基礎(chǔ)。后續(xù)的4篇譯文鏈接在本文的結(jié)尾處。
Solidity提供了很多高級(jí)語(yǔ)言的抽象概念,但是這些特性讓人很難明白在運(yùn)行程序的時(shí)候到底發(fā)生了什么。我閱讀了Solidity的文檔,但依舊存在著幾個(gè)基本的問(wèn)題沒(méi)有弄明白。
string, bytes32, byte[], bytes之間的區(qū)別是什么?
- 該在什么地方使用哪個(gè)類型?
- 將 string 轉(zhuǎn)換成bytes時(shí)會(huì)怎么樣?可以轉(zhuǎn)換成byte[]嗎?
- 它們的存儲(chǔ)成本是多少?
EVM是如何存儲(chǔ)映射( mappings)的?
- 為什么不能刪除一個(gè)映射?
- 可以有映射的映射嗎?(可以,但是怎樣映射?)
- 為什么存在存儲(chǔ)映射,但是卻沒(méi)有內(nèi)存映射?
編譯的合約在EVM看來(lái)是什么樣子的?
- 合約是如何創(chuàng)建的?
- 到底什么是構(gòu)造器?
- 什么是 fallback 函數(shù)?
我覺(jué)得學(xué)習(xí)在以太坊虛擬機(jī)(EVM)上運(yùn)行的類似Solidity 高級(jí)語(yǔ)言是一種很好的投資,有幾個(gè)原因:
在這個(gè)系列的文章中,我會(huì)拆開(kāi)一個(gè)簡(jiǎn)單的Solidity合約,來(lái)讓大家明白它是如何以EVM字節(jié)碼(bytecode)來(lái)運(yùn)行的。
我希望能夠?qū)W習(xí)以及會(huì)書(shū)寫的文章大綱:
- EVM字節(jié)碼的基礎(chǔ)認(rèn)識(shí)
- 不同類型(映射,數(shù)組)是如何表示的
- 當(dāng)一個(gè)新合約創(chuàng)建之后會(huì)發(fā)生什么
- 當(dāng)一個(gè)方法被調(diào)用時(shí)會(huì)發(fā)生什么
- ABI如何橋接不同的EVM語(yǔ)言
我的最終目標(biāo)是整體的理解一個(gè)編譯的Solidity合約。讓我們從閱讀一些基本的EVM字節(jié)碼開(kāi)始。
EVM指令集將是一個(gè)比較有幫助的參考。
一個(gè)簡(jiǎn)單的合約
我們的第一個(gè)合約有一個(gè)構(gòu)造器和一個(gè)狀態(tài)變量:
// c1.sol pragma solidity ^0.4.11; contract C {uint256 a;function C() {a = 1;} }用solc來(lái)編譯此合約:
$ solc --bin --asm c1.sol ======= c1.sol:C ======= EVM assembly:/* "c1.sol":26:94 contract C {... */mstore(0x40, 0x60)/* "c1.sol":59:92 function C() {... */jumpi(tag_1, iszero(callvalue))0x0dup1revert tag_1: tag_2:/* "c1.sol":84:85 1 */0x1/* "c1.sol":80:81 a */0x0/* "c1.sol":80:85 a = 1 */dup2swap1sstorepop/* "c1.sol":59:92 function C() {... */ tag_3:/* "c1.sol":26:94 contract C {... */ tag_4:dataSize(sub_0)dup1dataOffset(sub_0)0x0codecopy0x0return stop sub_0: assembly {/* "c1.sol":26:94 contract C {... */mstore(0x40, 0x60)tag_1:0x0dup1revert auxdata: 0xa165627a7a72305820af3193f6fd31031a0e0d2de1ad2c27352b1ce081b4f3c92b5650ca4dd542bb770029 } Binary: 60606040523415600e57600080fd5b5b60016000819055505b5b60368060266000396000f30060606040525b600080fd00a165627a7a72305820af3193f6fd31031a0e0d2de1ad2c27352b1ce081b4f3c92b5650ca4dd542bb7700296060604052...這串?dāng)?shù)字就是EVM實(shí)際運(yùn)行的字節(jié)碼。
一小步一小步的來(lái)
上面一半的編譯匯編是大多數(shù)Solidity程序中都會(huì)存在的樣板語(yǔ)句。我們稍后再來(lái)看這些。現(xiàn)在,我們來(lái)看看合約中獨(dú)特的部分,簡(jiǎn)單的存儲(chǔ)變量賦值:
a = 1代表這個(gè)賦值的字節(jié)碼是6001600081905550。我們把它拆成一行一條指令:
60 01 60 00 81 90 55 50EVM本質(zhì)上就是一個(gè)循環(huán),從上到下的執(zhí)行每一條命令。讓我們用相應(yīng)的字節(jié)碼來(lái)注釋匯編代碼(縮進(jìn)到標(biāo)簽tag_2下),來(lái)更好的看看他們之間的關(guān)聯(lián):
tag_2:// 60 010x1// 60 000x0// 81dup2// 90swap1// 55sstore// 50pop注意0x1在匯編代碼中實(shí)際上是push(0x1)的速記。這條指令將數(shù)值1壓入棧中。
只是盯著它依然很難明白到底發(fā)生了什么,不過(guò)不用擔(dān)心,一行一行的模擬EVM是比較簡(jiǎn)單的。
模擬EVM
EVM是個(gè)堆棧機(jī)器。指令可能會(huì)使用棧上的數(shù)值作為參數(shù),也會(huì)將值作為結(jié)果壓入棧中。讓我們來(lái)思考一下add操作。
假設(shè)棧上有兩個(gè)值:
[1 2]當(dāng)EVM看見(jiàn)了add,它會(huì)將棧頂?shù)?項(xiàng)相加,然后將答案壓入棧中,結(jié)果是:
[3]接下來(lái),我們用[]符號(hào)來(lái)標(biāo)識(shí)棧:
// 空棧 stack: [] // 有3個(gè)數(shù)據(jù)的棧,棧頂項(xiàng)為3,棧底項(xiàng)為1 stack: [3 2 1]用{}符號(hào)來(lái)標(biāo)識(shí)合約存儲(chǔ)器:
// 空存儲(chǔ) store: {} // 數(shù)值0x1被保存在0x0的位置上 store: { 0x0 => 0x1 }現(xiàn)在讓我們來(lái)看看真正的字節(jié)碼。我們將會(huì)像EVM那樣來(lái)模擬6001600081905550字節(jié)序列,并打印出每條指令的機(jī)器狀態(tài):
// 60 01:將1壓入棧中 0x1stack: [0x1] // 60 00: 將0壓入棧中 0x0stack: [0x0 0x1] // 81: 復(fù)制棧中的第二項(xiàng) dup2stack: [0x1 0x0 0x1] // 90: 交換棧頂?shù)膬身?xiàng)數(shù)據(jù) swap1stack: [0x0 0x1 0x1] // 55: 將數(shù)值0x01存儲(chǔ)在0x0的位置上 // 這個(gè)操作會(huì)消耗棧頂兩項(xiàng)數(shù)據(jù) sstorestack: [0x1]store: { 0x0 => 0x1 } // 50: pop (丟棄棧頂數(shù)據(jù)) popstack: []store: { 0x0 => 0x1 }最后,棧就為空棧,而存儲(chǔ)器里面有一項(xiàng)數(shù)據(jù)。
值得注意的是Solidity已經(jīng)決定將狀態(tài)變量uint256 a保存在0x0的位置上。其他語(yǔ)言完全可以選擇將狀態(tài)變量存儲(chǔ)在其他的任何位置上。
6001600081905550字節(jié)序列在本質(zhì)上用EVM的操作偽代碼來(lái)表示就是:
// a = 1 sstore(0x0, 0x1)仔細(xì)觀察,你就會(huì)發(fā)現(xiàn)dup2,swap1,pop都是多余的,匯編代碼可以更簡(jiǎn)單一些:
0x1 0x0 sstore你可以模擬上面的3條指令,然后會(huì)發(fā)現(xiàn)他們的機(jī)器狀態(tài)結(jié)果都是一樣的:
stack: [] store: { 0x0 => 0x1 }兩個(gè)存儲(chǔ)變量
讓我們?cè)兕~外的增加一個(gè)相同類型的存儲(chǔ)變量:
// c2.sol pragma solidity ^0.4.11; contract C {uint256 a;uint256 b;function C() {a = 1;b = 2;} }編譯之后,主要來(lái)看tag_2:
$ solc --bin --asm c2.sol //前面的代碼忽略了 tag_2:/* "c2.sol":99:100 1 */0x1/* "c2.sol":95:96 a */0x0/* "c2.sol":95:100 a = 1 */dup2swap1sstorepop/* "c2.sol":112:113 2 */0x2/* "c2.sol":108:109 b */0x1/* "c2.sol":108:113 b = 2 */dup2swap1sstorepop匯編的偽代碼:
// a = 1 sstore(0x0, 0x1) // b = 2 sstore(0x1, 0x2)我們可以看到兩個(gè)存儲(chǔ)變量的存儲(chǔ)位置是依次排列的,a在0x0的位置而b在0x1的位置。
存儲(chǔ)打包
每個(gè)存儲(chǔ)槽都可以存儲(chǔ)32個(gè)字節(jié)。如果一個(gè)變量只需要16個(gè)字節(jié)但是使用全部的32個(gè)字節(jié)會(huì)很浪費(fèi)。Solidity為了高效存儲(chǔ),提供了一個(gè)優(yōu)化方案:如果可以的話,就將兩個(gè)小一點(diǎn)的數(shù)據(jù)類型進(jìn)行打包然后存儲(chǔ)在一個(gè)存儲(chǔ)槽中。
我們將a和b修改成16字節(jié)的變量:
pragma solidity ^0.4.11; contract C {uint128 a;uint128 b;function C() {a = 1;b = 2;} }編譯此合約:
$ solc --bin --asm c3.sol產(chǎn)生的匯編代碼現(xiàn)在更加的復(fù)雜一些:
tag_2:// a = 10x10x0dup10x100expdup2sloaddup20xffffffffffffffffffffffffffffffffmulnotandswap1dup40xffffffffffffffffffffffffffffffffandmulorswap1sstorepop// b = 20x20x00x100x100expdup2sloaddup20xffffffffffffffffffffffffffffffffmulnotandswap1dup40xffffffffffffffffffffffffffffffffandmulorswap1sstorepop上面的匯編代碼將這兩個(gè)變量打包放在一個(gè)存儲(chǔ)位置(0x0)上,就像這樣:
[ b ][ a ] [16 bytes / 128 bits][16 bytes / 128 bits]進(jìn)行打包的原因是因?yàn)槟壳白畎嘿F的操作就是存儲(chǔ)的使用:
- sstore指令第一次寫入一個(gè)新位置需要花費(fèi)20000 gas
- sstore指令后續(xù)寫入一個(gè)已存在的位置需要花費(fèi)5000 gas
- sload指令的成本是500 gas
- 大多數(shù)的指令成本是3~10 gas
通過(guò)使用相同的存儲(chǔ)位置,Solidity為存儲(chǔ)第二個(gè)變量支付5000 gas,而不是20000 gas,節(jié)約了15000 gas。
更多優(yōu)化
應(yīng)該可以將兩個(gè)128位的數(shù)打包成一個(gè)數(shù)放入內(nèi)存中,然后使用一個(gè)'sstore'指令進(jìn)行存儲(chǔ)操作,而不是使用兩個(gè)單獨(dú)的sstore命令來(lái)存儲(chǔ)變量a和b,這樣就額外的又省了5000 gas。
你可以通過(guò)添加optimize選項(xiàng)來(lái)讓Solidity實(shí)現(xiàn)上面的優(yōu)化:
$ solc --bin --asm --optimize c3.sol這樣產(chǎn)生的匯編代碼只有一個(gè)sload指令和一個(gè)sstore指令:
tag_2:/* "c3.sol":95:96 a */0x0/* "c3.sol":95:100 a = 1 */dup1sload/* "c3.sol":108:113 b = 2 */0x200000000000000000000000000000000not(sub(exp(0x2, 0x80), 0x1))/* "c3.sol":95:100 a = 1 */swap1swap2and/* "c3.sol":99:100 1 */0x1/* "c3.sol":95:100 a = 1 */orsub(exp(0x2, 0x80), 0x1)/* "c3.sol":108:113 b = 2 */andorswap1sstore字節(jié)碼是:
600080547002000000000000000000000000000000006001608060020a03199091166001176001608060020a0316179055將字節(jié)碼解析成一行一指令:
// push 0x0 60 00 // dup1 80 // sload 54 // push17 將下面17個(gè)字節(jié)作為一個(gè)32個(gè)字的數(shù)值壓入棧中 70 02 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 /* not(sub(exp(0x2, 0x80), 0x1)) */ // push 0x1 60 01 // push 0x80 (32) 60 80 // push 0x80 (2) 60 02 // exp 0a // sub 03 // not 19 // swap1 90 // swap2 91 // and 16 // push 0x1 60 01 // or 17 /* sub(exp(0x2, 0x80), 0x1) */ // push 0x1 60 01 // push 0x80 60 80 // push 0x02 60 02 // exp 0a // sub 03 // and 16 // or 17 // swap1 90 // sstore 55上面的匯編代碼中使用了4個(gè)神奇的數(shù)值:
- 0x1(16字節(jié)),使用低16字節(jié)
- 0x2(16字節(jié)),使用高16字節(jié)
- not(sub(exp(0x2, 0x80), 0x1))
- sub(exp(0x2, 0x80), 0x1)
代碼將這些數(shù)值進(jìn)行了一些位的轉(zhuǎn)換來(lái)達(dá)到想要的結(jié)果:
16:32 0x00000000000000000000000000000002 00:16 0x00000000000000000000000000000001最后,該32字節(jié)的數(shù)值被保存在了0x0的位置上。
Gas 的使用
600080547002000000000000000000000000000000006001608060020a03199091166001176001608060020a0316179055
注意0x200000000000000000000000000000000被嵌入到了字節(jié)碼中。但是編譯器也可能選擇使用exp(0x2, 0x81)指令來(lái)計(jì)算數(shù)值,這會(huì)導(dǎo)致更短的字節(jié)碼序列。
但結(jié)果是0x200000000000000000000000000000000比exp(0x2, 0x81)更便宜。讓我們看看與gas費(fèi)用相關(guān)的信息:
- 一筆交易的每個(gè)零字節(jié)的數(shù)據(jù)或代碼費(fèi)用為 4 gas
- 一筆交易的每個(gè)非零字節(jié)的數(shù)據(jù)或代碼的費(fèi)用為 68 gas
來(lái)計(jì)算下兩個(gè)表示方式所花費(fèi)的gas成本:
0x200000000000000000000000000000000字節(jié)碼包含了很多的0,更加的便宜。
(1 * 68) + (32 * 4) = 196608160020a字節(jié)碼更短,但是沒(méi)有0。
5 * 68 = 340
更長(zhǎng)的字節(jié)碼序列有很多的0,所以實(shí)際上更加的便宜!
總結(jié)
EVM的編譯器實(shí)際上不會(huì)為字節(jié)碼的大小、速度或內(nèi)存高效性進(jìn)行優(yōu)化。相反,它會(huì)為gas的使用進(jìn)行優(yōu)化,這間接鼓勵(lì)了計(jì)算的排序,讓以太坊區(qū)塊鏈可以更高效一點(diǎn)。
我們也看到了EVM一些奇特的地方:
- EVM是一個(gè)256位的機(jī)器。以32字節(jié)來(lái)處理數(shù)據(jù)是最自然的
- 持久存儲(chǔ)是相當(dāng)昂貴的
- Solidity編譯器會(huì)為了減少gas的使用而做出相應(yīng)的優(yōu)化選擇
Gas成本的設(shè)置有一點(diǎn)武斷,也許未來(lái)會(huì)改變。當(dāng)成本改變的時(shí)候,編譯器也會(huì)做出不同的優(yōu)化選擇。
本系列文章其他部分譯文鏈接:
- 固定長(zhǎng)度數(shù)據(jù)類型的表示方法(第2部分)
- 動(dòng)態(tài)數(shù)據(jù)類型的表示方法(第3部分)
- ABI編碼外部方法調(diào)用的方式(第4部分)
- 一個(gè)新合約被創(chuàng)建后會(huì)發(fā)生什么(第5部分)
翻譯作者: 許莉
原文地址:Diving Into The Ethereum VM Part One
作者:Lilymoana
鏈接:https://www.jianshu.com/p/1969f3761208
來(lái)源:簡(jiǎn)書(shū)
著作權(quán)歸作者所有。商業(yè)轉(zhuǎn)載請(qǐng)聯(lián)系作者獲得授權(quán),非商業(yè)轉(zhuǎn)載請(qǐng)注明出處。
總結(jié)
以上是生活随笔為你收集整理的深入了解以太坊虚拟机的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: android app通过Geth RP
- 下一篇: 连接不同区块链的跨链技术介绍