【引文74 引文114】基于区块链的联邦学习的激励机制设计
【引文114】
摘要
介紹了一個side-payment方案,讓大家可信任的分享reputation信息
同時利用密碼學計數保護reputation的完整性
解決開放環境分布所有權的安全問題
reputation由過往的行為決定
一個agent公布reputation到底好不好?
真實的rating不一定有利,作惡的rating可能有利
核心問題:如何讓理性的agent去發布真實的reputation信息
模型
考慮邊際收益
report了必須要有好處才可以
個人cheating最優,兩人均合作最優
沒有強行執行合約的中央機構
先驗概率
每個agent可以購買并出售別人或自己的reputation然后做分析
只有最近的評分可以影響他們的選擇
如果他們想賣別人的信息,那么它們只能先買這個人的信息
R-agent作為中介如何選舉?
reputation的錢和游戲中獲得的錢是分開的,如果虧光了reputation的錢就不能再買了
一些問題
R-agent變成blockchain
game 的money 和reputation的money有什么好處?
【引文74】
FL 當前問題
1.沒有激勵共享意愿不高
2.共享的參數效果不一定好
3.惡意的投毒如何避免
一些方法
通過reputation來評估實體的可信度,保證可信worker選舉
direct reputation 和 indiect reputation
task publishers位于區塊鏈上整合reputation信息
基于consortium blockchain聯盟鏈
task publisher利用契約理論設計一個根據數據、計算量、通信資源的相關獎勵
worker可以選擇合約item來最大化利益
文章結構
1.相關工作
2.基于reputation的worker選舉
3.利用multi-weight 的 subjective logic 模型來量化reputation
4.可信worker的獎勵
相關工作
1.大多數都是假設端節點會貢獻數據,沒有考慮worker的可靠性
2.本文考慮耦合的選舉 + 激勵問題
preliminary
1.每個終端n的損失函數ln,是多個本地數據分片的損失加權和
2.中心節點發布模型,然后每個設備n根據中心模型算出梯度,更新本地模型并發送給中心節點,中心節點再加權得到下一次的模型
攻擊檢測方案
1.RONI[4]:有無本地模型時的差距
2.Fools-Gold scheme[19]不可靠的節點上傳相似的梯度
激勵方案
task publisher很多東西都不知道
為了提高效率,采用contract theory
cpu消耗
通信消耗
數據質量
按照數據質量給worker打標簽
最大容忍時間
worker質量越高,task publisher分發的費用越大
worker可用性函數
實驗
用EMD來評估模型的偏移
一些問題
reward min?max?sum?
pre-set reward 放到 smart contract
合約里面包括digital signature
每個等級的合同的錢怎么設計?
總結
以上是生活随笔為你收集整理的【引文74 引文114】基于区块链的联邦学习的激励机制设计的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Day13:What did I do
- 下一篇: 如何使用gitee(码云)提交,拉取管理