當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

【引文74 引文114】基于区块链的联邦学习的激励机制设计

發布時間：2023/12/16 编程问答 37 豆豆

生活随笔收集整理的這篇文章主要介紹了【引文74 引文114】基于区块链的联邦学习的激励机制设计小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

【引文114】

摘要

介紹了一個side-payment方案，讓大家可信任的分享reputation信息

同時利用密碼學計數保護reputation的完整性

解決開放環境分布所有權的安全問題

reputation由過往的行為決定

一個agent公布reputation到底好不好？

真實的rating不一定有利，作惡的rating可能有利

核心問題：如何讓理性的agent去發布真實的reputation信息

模型

考慮邊際收益

report了必須要有好處才可以

個人cheating最優，兩人均合作最優

沒有強行執行合約的中央機構

先驗概率

每個agent可以購買并出售別人或自己的reputation然后做分析

只有最近的評分可以影響他們的選擇

如果他們想賣別人的信息，那么它們只能先買這個人的信息

R-agent作為中介如何選舉？

reputation的錢和游戲中獲得的錢是分開的，如果虧光了reputation的錢就不能再買了

一些問題

R-agent變成blockchain

game 的money 和reputation的money有什么好處？

【引文74】

FL 當前問題

1.沒有激勵共享意愿不高

2.共享的參數效果不一定好

3.惡意的投毒如何避免

一些方法

通過reputation來評估實體的可信度，保證可信worker選舉

direct reputation 和 indiect reputation

task publishers位于區塊鏈上整合reputation信息

基于consortium blockchain聯盟鏈

task publisher利用契約理論設計一個根據數據、計算量、通信資源的相關獎勵

worker可以選擇合約item來最大化利益

文章結構

1.相關工作

2.基于reputation的worker選舉

3.利用multi-weight 的 subjective logic 模型來量化reputation

4.可信worker的獎勵

preliminary

1.每個終端n的損失函數ln，是多個本地數據分片的損失加權和

2.中心節點發布模型，然后每個設備n根據中心模型算出梯度，更新本地模型并發送給中心節點，中心節點再加權得到下一次的模型

攻擊檢測方案

1.RONI[4]:有無本地模型時的差距

2.Fools-Gold scheme[19]不可靠的節點上傳相似的梯度

激勵方案

task publisher很多東西都不知道

為了提高效率，采用contract theory

cpu消耗

通信消耗

數據質量

按照數據質量給worker打標簽

最大容忍時間

worker質量越高，task publisher分發的費用越大

worker可用性函數

實驗

用EMD來評估模型的偏移

一些問題

reward min？max？sum？

pre-set reward 放到 smart contract

合約里面包括digital signature

每個等級的合同的錢怎么設計？

總結

以上是生活随笔為你收集整理的【引文74 引文114】基于区块链的联邦学习的激励机制设计的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Day13：What did I do
下一篇：如何使用gitee（码云）提交，拉取管理