Lightweight and Reliable Decentralized Reward System using Blockchain
摘要
近年來,通過利用無處不在的物聯網(IoT)和移動設備的感知能力,眾感知變得越來越流行。實現有效眾感知的一個關鍵組成部分——是一個可靠的獎勵系統以激勵眾籌的參與。在傳統的眾感知應用中,數據質量評估和每個參與者的獎勵評估由中央服務器執行。因此,它們的公平性和可靠性基于服務器將正確運行的假設,一旦服務器出現軟件或硬件故障,甚至故意作弊,參與者的利潤就無法保證。
在本文中,我們通過利用區塊鏈技術,提出了一個可靠的分散式眾感知獎勵系統。與現有的基于區塊鏈的眾感知解決方案不同,這些解決方案在計算或財務成本方面利用了昂貴的共識機制,我們探索了大多數眾感知應用程序中存在的信譽的力量,并將其安全地集成到區塊鏈中,以設計信譽證明共識機制。此外,還進一步設計了一個使用區塊鏈的高效可靠的獎勵系統,我們使用數值分析和模擬評估了我們提出的獎勵系統的性能。
引言
本文研究了如何安全地利用聲譽作為賭注來構建聲譽證明(PoR)共識機制,在此基礎上,進一步設計了一個使用區塊鏈的高效可靠的獎勵系統,用于眾感知。在我們的系統中,所有實體都可以使用區塊鏈,有效地為其應得的獎勵建立共識,并在必要時驗證其貢獻。要將聲譽作為建立共識機制的關鍵,需要解決的關鍵挑戰是如何平衡安全與公平。
一方面,我們將限制信譽低的實體參與區塊鏈的執行,即區塊創建和投票,這確保了獎勵系統的可靠性。另一方面,聲譽相對較低的實體,尤其是新加入的實體,也應有公平的機會參與并提高其聲譽。
為了解決這一挑戰,我們探索了一種基于彩票的策略,該策略可以提供靈活的實體選擇,以包括低信譽的實體,同時保證參與投票過程的大多數實體(>51%)將誠實地執行。聲譽獎勵制度的另一個重要因素是聲譽管理,除了使用預定義的度量來評估聲譽外,本文還采用了基于周期的聲譽評估,這不僅為新實體提供了更多的機會來建立其聲譽,而且還防止了現有的聲譽實體濫用其聲譽,同時提供了深入的數值分析和廣泛的模擬結果,以證明我們的設計性能。
本文的其余部分組織如下:
在第二節中,我們闡述了本文的問題;第三節介紹了詳細結構;在第四節中,我們評估了我們提議的獎勵制度;我們在第五節中回顧和討論了相關工作,并在第六節中總結了本文。
問題描述
如圖1所示,我們的眾感知系統中有四個主要實體:任務分發者、參與者、區塊鏈和任務驗證者。
任務分發者發布眾感知任務及其獎勵,這些任務將通過智能合約提交給區塊鏈。來自任務分發者的相應獎勵金額在預定義任務期間鎖定在任務的區塊鏈上,接受任務的參與者將提交數據以完成任務。每個參與者都會根據其任務完成歷史的準時性和質量獲得聲譽。我們系統中的驗證者的任務是執行和驗證在區塊鏈上創建的智能合約,通過該合約評估參與者提交的數據的質量。由于區塊鏈的鏈上存儲能力有限,我們的系統將區塊鏈和數據存儲分開。提交的所有數據都存儲在存儲服務器中,只有鏈接到數據的相應簽名和指針才會提交到區塊鏈。
我們的獎勵系統旨在基于現實世界中的財務激勵,同時實現公平性和可靠性,即,激勵所涉及的每個實體正確完成任務,如果偏離了定義的協議,則不會獲得任何獎勵甚至懲罰。只要任務分發者為參與者和驗證者支付費用,他/她應按照預期收到正確的數據或結果。同時,只要參與者和驗證者誠實地完成其聲稱的任務,他們將獲得獎勵。該系統應能夠識別和抵制所有實體的不當行為,并反映其聲譽和獎勵的相應調整。
詳細結構
我們的眾感獎勵系統有四個階段,如圖1所示:發布、選擇、提交和驗證。
第一階段:發布。為了發布一個眾感知任務,任務分發者首先起草智能合約,定義任務規則,包括數據要求、所需參與者和驗證者的數量、獎勵信息、參與任務所需的信譽和押金以及支付規則。特別是,將創建三個智能合同,即,用于雇用和選擇驗證員的SC-VE、用于雇用和挑選參與者的SC-PE和用于參與者提交數據質量評估的SC-DQE。然后,智能合約被提交并發布在區塊鏈上。在我們的設計中中,任務分銷商需要提前支付合同中描述的報酬,并將付款存入區塊鏈。我們還要求每個參與者和驗證者在查看合同后,如果他們聲稱自己有興趣接受任務,則需要支付押金,這旨在確保任務的質量。如果未在第2階段中選擇,將退還其押金。
第2階段:選擇。我們系統中參與者的選擇遵循第V-2節中討論的現有眾感知解決方案,其中與任務要求相關的聲譽和能力是需要考慮的主要因素。驗證者的選擇取決于他們在第III-A節中討論的PoR機制中的聲譽。第III-B節討論了驗證員聲譽的評估。選定的參與者和驗證者通過使用其密鑰簽署合同,分別加入合同SC-PE和SC-VE。為此,達成了第一個共識,即選定的驗證者將執行智能合約作為交易SC-DQE,并在第4階段為區塊鏈上的參與者創建區塊。
第3階段:提交。在此階段,參與者收集、預處理數據并將其提交到數據服務器;同時,參與者需要使用數字簽名對數據進行簽名,并將簽名提交給區塊鏈。對于任何未在截止日期前提交數據或未提交數據而未提交簽名的參與者,他們將被視為未完成任務,并將根據智能合約中的聲明對其存款和聲譽進行處罰。第III-B節討論了懲罰機制的細節。
第4階段:驗證。在我們的設計中,將有兩種類型的驗證者,即領先驗證者和常規驗證者。主要驗證者首先根據所有參與者提交的數據生成數據質量評估公式。如果復雜性是可接受的(例如,使用平均值或標準偏差作為度量),則該過程將嵌入智能合約SC-DQE中執行,以確保正確性。當這一過程過于復雜而無法完全集成時,我們建議在SC-DQE中包括幾個關鍵步驟,這些步驟可以在稍后需要驗證主要驗證者的操作時用作檢查點(例如,參與者提出投訴)。然后,領先的驗證者通過執行SC-DQE來評估每個參與者的數據,其中評估操作被視為交易,并在區塊鏈上為其創建新的區塊。這些新的區塊將由常規核查人員投票。這一概念與第III-A節中討論的PoR共識機制一致。一旦區塊被確認,SC-PE和SC-VE也將被執行,以公布參與者和驗證者的獎勵(或懲罰)。第二項共識現已確立。此外,還將根據所有三個智能合約的執行結果更新參與方和驗證方的聲譽。第III-B節討論了詳細的更新過程。
為此,通過集成基于區塊鏈的獎勵系統,可以以分散的方式執行眾感知任務的整個過程。我們現在關注我們系統設計中兩個關鍵問題的細節:
1)如何在我們的系統中達成區塊鏈共識?
2)如何管理和評估聲譽?
A 聲譽證明共識機制
在我們的PoR共識機制中,我們需要確保所有實體都有一個商定的聲譽分類賬,并記錄每個實體的聲譽。為了記錄每個實體的聲譽,我們的設計在生成新塊后將其存儲到存儲服務器中。這是因為新塊的生成通常會導致這些相關實體的信譽更新。同時,我們將信譽Merkle哈希樹嵌入到塊結構中,該結構是基于生成塊時所有實體的當前信譽構建的。通過這種方式,所有實體的聲譽都可以在區塊鏈上安全記錄和追蹤。
關于區塊的生成,我們的PoR機制建議讓信譽較高的實體發布區塊。特別是,選擇一個主要實體作為區塊創建者,并選擇一組實體根據其信譽投票區塊。在現有的PoR機制[11]中,總是選擇信譽最高的實體作為創建區塊的領導者,排名前20%的實體(就信譽而言)將投票支持該區塊。我們認為,這樣一種機制會引發一些擔憂。首先,外部對手只需要專注于損害一小群實體來攻擊區塊鏈。第二,對于大量實體具有類似聲譽的情況,這種確定性機制不夠公平。例如,當前20%和前50%之間的聲譽差異非常小(<5%)時,這些實體應有類似的機會被選中。
在我們的設計中,我們提出了一種基于信譽的彩票分組策略,用于選擇實體來創建和投票區塊。具體來說,我們的設計將所有實體根據其聲譽分為不同的組。例如,如果信譽系統的最大信譽分數為100,那么我們可以創建10組Gi,1≤ i≤ 10,其中G1=[1? 10] ,G2=[11? 20] ,···,G10=[91-00]。對于Gi中的任何實體,它們被分配了一個概率pi,以表示它們誠實的概率。對于特定的應用場景,可以根據分配的實體數量調整組的規模,以避免每個組的擁塞。調整是基于周期的,在創建一定數量的區塊后,將重新平衡組規模。因此,同一組中的實體被認為有相同的機會被選中。在選擇區塊創建者和投票實體時,我們機制的關鍵思想是根據實體的聲譽選擇一個子集的彩票,這可以保證所選實體的大多數(>51%)是誠實的。
對于創建區塊的領先實體的選擇,我們的PoR機制將從聲譽最高的組中隨機選擇一個實體。投票實體可以使用來自不同群體的實體組合,并優先選擇聲譽較高的實體。我們使用n表示投票所需的實體總數,pj,1≤ j≤ n是實體j是誠實的概率。那么(n/2+1)個實體在投票期間誠實的概率Phonest為
其中Phonest,k表示n個所選實體中的k個是誠實的概率。Phonest,k的計算復雜性取決于選擇實體所涉及的組數。方程1可以遞歸的方式實現,其中遞歸的深度由所涉及的組的數量決定。因此,我們的設計建議,大多數投票實體應從聲譽較高的同一群體中選出。例如,75%從聲譽最高的組中選擇,20%從聲譽第二高的組中,5%從聲譽第三高的組選擇。同時,選擇還應保證Phonest具有極高的概率,例如,Phonest>99.999%。
B 聲譽管理和評估
在我們的設計中,我們專注于驗證者的聲譽評估和管理,因為如第V-2節所述,基于聲譽的眾感知參與者選擇已被廣泛調查。
在我們的信譽管理中,Rj是驗證者j的信譽,Rinit是驗證器注冊并加入系統時的初始信譽,RMax和RMin表示驗證者可以獲得的最大和最小信譽,Rb是完成任務(例如創建區塊和投票)所獲得的基本信譽。一旦驗證者的信譽低于RMin,它將從我們的系統中刪除。當驗證者參與區塊鏈的眾感知任務時,其信譽將根據其當前信譽狀態、當前任務周期的表現以及過去周期的表現進行調整(增加/減少)。我們的系統的任務周期(例如,1000個任務)可以根據任務頻率來設置。在每個周期之后,所有參與的驗證者的聲譽都將被重置,因此最近加入的驗證者有公平的機會在聲譽方面與舊驗證者競爭。具體而言,Rj的調整按以下方式計算:
其中w1、w2、w3、w4是權重,Sc(j)是驗證者j在當前任務周期中的成功率,Sh(j)是驗證者j在過去兩個周期中的歷史成功率。Sc(j)被計算為Sc(j)=N umcorrect/N umtotal,其中N umtotal是所涉及的任務驗證器j的數量,N umcorrect是其正確驗證的任務的數量。術語1? Rj RMax用于增加高信譽驗證者獲得額外信譽的難度,因為他們已經有更多機會被選中執行任務。同時,在當前和歷史周期中表現更好的驗證者將獲得更高的聲譽。與歷史績效相比,應更加強調驗證者在當前周期的績效。這可以通過設置w1>w3和w2>w4來實現。
如果驗證者發現了不當行為,將受到處罰。我們懲罰設計的總體思路是,信譽較高的驗證者將因其不當行為受到更高的懲罰。同時,驗證者的不當行為將累積用于其處罰計算。具體來說,我們將驗證者聲譽的懲罰計算為
其中,β1、β2、β3是用于優化的參數,應針對不同的場景進行調整,NumErr,c(j)和NumEr,h(j)分別是當前周期和最后一個周期中驗證者j的不當行為數量。在我們的設計中,懲罰量以指數形式增加到N umErr,c(j)的值,并線性增加到實體的當前信譽Rj和N umEr,h(j)。
關于每個周期后的信譽重置,我們的設計允許每個驗證者在過去兩個周期中繼承其信譽,如:
其中Rj(x)表示在周期x開始時驗證者j的信譽。對于沒有Rj(x)的任何驗證者? 1) 或Rj(x? 1) ,這些值將替換為Rinit。
評估提出的獎勵制度
為了評估我們提出的獎勵系統的有效性和效率,我們現在對我們的PoR共識機制和聲譽管理進行數值分析和模擬。所有模擬和實驗都在配備2.3GHz四核I5處理器和8GB內存的Macbook Pro筆記本電腦上進行。
A PoR共識機制
在我們的PoR共識機制中,基于信譽的彩票用于選擇區塊創建者和選民。選擇n個實體的效率取決于所涉及的信譽組的數量,其中至少一半實體將以保證的概率(>99.999%)誠實地執行。為了從m個信譽組中選擇n個實體,相應的計算復雜度為O(nmn^mnm)。為了評估實際績效,我們通過設置n=50并將m從1更改為11來進行實驗評估,即最多涉及11個聲譽組。對于每個涉及的組,將至少選擇一個實體。我們認為,11個聲譽小組有足夠的粒度來支持我們的聲譽管理。例如,從[50,100]開始的聲譽等級可以為11個組劃分為5。
如圖2所示,選擇50個實體的計算成本從0.043秒呈指數增長到37.78秒。在實際選擇中,大多數實體應從聲譽較高的群體中選擇,以確保大多數實體誠實地履行職責。因此,我們建議在5到6組,可包含3到4個高信譽的組和1到2個聲譽相對較低的組。
B 信譽管理
如第III-B節所述,在我們的設計中,實體的聲譽增長和懲罰是根據其當前聲譽和不同階段的歷史表現計算的。在我們的評估中,我們專注于探索等式2和等式3的權重(w1,w2,w3,w4和β1,β2,β3)的適當選擇。
我們使用[40,100]信譽等級,并將加入時的初始信譽設置為60,即RMin=40,RMax=100,Rinit=60。獎勵的基本信譽設置為Rb=1.5。信譽周期設置為1000個任務。選擇w1、w2、w3、w4的目標是使實體的信譽在低時增長更快,并隨著信譽的增加而減慢。同時,RMax只能通過在信譽周期內完成所有任務的很大百分比(例如50%)來實現。在評估每個權重的不同值后,我們將它們設置為w1=0.5、w2=20、w3=0.2和w4=10。
如圖3所示,實體的聲譽增長速度隨著其聲譽的增加而逐漸降低。例如,一個實體可以通過完成sc=1和sh=1的47項任務,將其聲譽從50提高到70。然而,要達到90的聲譽,再增加20項需要完成97項任務。此外,我們將sc和sh的值分別從1變為0.8,當sc和sh減少時,信譽增量會減慢。我們建議,當前周期中成功率較低(例如,<0.85)的實體不應被選擇完成任務,必須等待下一個周期。它還清楚地表明,與歷史周期的成功率相比,當前周期的成功對聲譽的影響更大。
關于等式3中定義的聲譽懲罰,我們根據評估結果將權重設置為β1=1.5、β2=1.5和β3=2。如圖4所示,懲罰量與當前周期中的錯誤數量成指數關系,與歷史周期中的誤差數量成線性關系。這與設計目的一致,即當前周期內累積的不當行為將受到更多處罰。同時,我們將錯誤發生時的聲譽從50變為90,以評估當前聲譽對懲罰的影響。如圖4所示,聲譽越高,懲罰越高。
值得注意的是,我們評估中選擇的這些權重不是最優的,可以根據實際應用場景進一步調整。
討論和回顧
1) 基于區塊鏈的眾感知:在將區塊鏈技術集成到眾感知或眾包應用程序中,以消除“可信”集中服務平臺帶來的安全威脅方面,已經進行了幾次嘗試[4]–[8]。[4]中,在區塊鏈之上提出了一種眾享服務,但它與激勵機制不兼容,這是眾感應用的基本組件。在[5]中,作者利用區塊鏈作為眾感知中的支付渠道,但它對惡意工作者和不誠實的請求者并不安全。在[6]中,CrowdBC是通過概念化基于區塊鏈的去中心化眾包框架而提出的。然而,CrowdBC中的評估機制并未呈現,這是參與積極性和機制公平性的決定性因素。此外,礦工驗證的實施細節尚不清楚,這可能會導致冒充攻擊。[7]通過利用多階段智能合約,提出了一種基于區塊鏈的數據質量評估模型用于眾感知。[7]中驗證者的選擇基于他們的聲譽,這取決于任務的歷史質量和驗證的成功率。然而,根據[7]中的聲譽定義,當驗證者已經具有較高聲譽時,由于單個不當行為對整體聲譽的影響有限,因此這種設計很容易受到惡意驗證者的攻擊。[8]中提出了使用區塊鏈和智能合約進行眾感知的類似概念。不幸的是,由于其信譽評估策略,這項工作還存在惡意驗證者的漏洞。更重要的是,這些現有的研究采用PoW或基于加密貨幣的PoS作為其區塊鏈的共識機制,這在執行區塊鏈時引入了高計算成本或區塊鏈中涉及的高財務成本。
2) 眾感知中參與者的選擇:在眾感知應用中,預測是選擇參與者的主要方法。在基于預測的方法中,基于參與者的屬性(如聲譽、位置和與眾感知任務的相關性),偏好被給予更有可能提供高質量數據的參與者。[12]中提出了使用聲譽來評估參與者績效的概念,其中參與者的聲譽被計算為歷史服務質量的平均值。然而,該模型未考慮時間因素。在大多數情況下,應更重視參與者的近期表現。在[13]中,提出了一種計算效率高的信譽算法來識別和過濾這些敵對參與者。該算法結合基于標簽不一致的懲罰,使用了最優半匹配的概念。在[14]中,評估了聲譽管理的多個質量指標,包括完成任務的價值、數量和時間。在[15]中,提出了一種概率模型,以使用參與者歷史評估的大數據來預測參與者的行為。該模型進一步結合了邊際有效性的概念,提出了一種貪婪的參與者選擇算法。在[16]中,作者利用貝葉斯模型預測參與者的行為,并通過將其與數據庫中的標準進行比較來評估其數據質量。在[17]中,構建了一個半馬爾可夫模型來評估參與者到達時間的概率分布,然后將其用于構建基于預測的參與者招募策略,以平衡感知數據的交付比率和招募人員數量。
總結
在本文中,我們提出了一個基于區塊鏈的獎勵系統,以實現公平和可靠的眾感知分散管理。通過探索眾感知中聲譽系統的內置性質,我們使用基于彩票的想法設計了聲譽證明共識機制。這樣的共識機制通過信譽系統將眾感知和區塊鏈連接起來,從而同時實現效率和可靠性。我們還提出了一個考慮當前聲譽狀況、當前周期績效和歷史績效的聲譽管理系統。我們的聲譽管理系統不僅提供了加入眾感知的強大激勵,還通過累積懲罰策略防止他們做出不當行為。我們使用數值分析和仿真評估了系統的效率和有效性。
總結
以上是生活随笔為你收集整理的Lightweight and Reliable Decentralized Reward System using Blockchain的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: linux , Shell 文件合并的命
- 下一篇: JDBC查询数据库时出现 sql语句正确