【译】Blockchain-based Machine Learning Marketplaces
通過(guò)基于區(qū)塊鏈?zhǔn)袌?chǎng)的數(shù)據(jù)訓(xùn)練的機(jī)器學(xué)習(xí)模型有可能創(chuàng)造出世界上最強(qiáng)大的人工智能。?它們結(jié)合了兩個(gè)強(qiáng)大的原始設(shè)備:私人機(jī)器學(xué)習(xí),允許在不透露敏感私人數(shù)據(jù)的情況下進(jìn)行培訓(xùn),以及基于區(qū)塊鏈的激勵(lì)機(jī)制,這些激勵(lì)機(jī)制允許這些系統(tǒng)吸引最佳數(shù)據(jù)和模型,使其變得更加智能。?其結(jié)果是任何人都可以出售其數(shù)據(jù)和開(kāi)放市場(chǎng)的開(kāi)放市場(chǎng)?保持?jǐn)?shù)據(jù)私密性,而開(kāi)發(fā)人員則可以使用激勵(lì)措施為其算法吸引最佳數(shù)據(jù)。
構(gòu)建這些系統(tǒng)具有挑戰(zhàn)性,必要的構(gòu)建塊仍在創(chuàng)建中,但簡(jiǎn)單的初始版本看起來(lái)已經(jīng)開(kāi)始變得可能。?我相信這些市場(chǎng)將使我們擺脫當(dāng)前Web 2.0數(shù)據(jù)壟斷時(shí)代,進(jìn)入數(shù)據(jù)和算法公開(kāi)競(jìng)爭(zhēng)的Web 3.0時(shí)代,兩者都是直接貨幣化的。
起源
這個(gè)想法的基礎(chǔ)是在2015年與理查德·?努梅萊的談話?。?Numerai是一家對(duì)沖基金,它將加密的市場(chǎng)數(shù)據(jù)發(fā)送給任何想要競(jìng)爭(zhēng)模擬股市的數(shù)據(jù)科學(xué)家。?Numerai將最好的模型提交結(jié)合到一個(gè)“?元模型?”中,交易了元模型,并支付模型表現(xiàn)良好的數(shù)據(jù)科學(xué)家。
讓數(shù)據(jù)科學(xué)家參與競(jìng)爭(zhēng)似乎是一個(gè)強(qiáng)大的想法?所以這讓我想到:你能創(chuàng)建一個(gè)完全分散的版本的這個(gè)系統(tǒng),可以推廣到任何問(wèn)題嗎??我相信答案是肯定的。
施工
作為一個(gè)例子,讓我們嘗試創(chuàng)建一個(gè)完全分散的系統(tǒng),用于在分散交易所交易加密貨幣。?這是許多潛在的建筑之一:
數(shù)據(jù)數(shù)據(jù)提供者可以獲取數(shù)據(jù)并將其提供給建模人員。
模型構(gòu)建建模者選擇要使用的數(shù)據(jù)并創(chuàng)建模型。?培訓(xùn)是使用安全的計(jì)算方法完成的,該方法允許模型在不暴露底層數(shù)據(jù)的情況下進(jìn)行培訓(xùn)。?模型也被放樣。
元模型構(gòu)建元模型是基于考慮每個(gè)模型的放樣的算法創(chuàng)建的。
創(chuàng)建元模型是可選的 - 您可以想象在未被組合到元模型中時(shí)使用的模型。
使用元模型智能合約通過(guò)分散交換機(jī)制在鏈上以編程方式進(jìn)行元模型和交易。
分配收益/損失經(jīng)過(guò)一段時(shí)間后,交易產(chǎn)生利潤(rùn)或虧損。?這種利潤(rùn)或損失是根據(jù)元模型的貢獻(xiàn)者分成多少,這取決于他們制作多少智能元素。?負(fù)面貢獻(xiàn)的模型擁有部分或全部資金。?然后,模型轉(zhuǎn)向并對(duì)其數(shù)據(jù)提供者執(zhí)行類似的分發(fā)/股權(quán)削減。
可驗(yàn)證的計(jì)算每個(gè)步驟的計(jì)算或者是集中式的,但可以使用像Truebit這樣的驗(yàn)證游戲進(jìn)行驗(yàn)證和挑戰(zhàn),或者使用安全的多方計(jì)算進(jìn)行分散。
托管數(shù)據(jù)和模型要么托管在IPFS上,要么托管在安全的多方計(jì)算網(wǎng)絡(luò)中,因?yàn)殒溕洗鎯?chǔ)將會(huì)過(guò)于昂貴。
是什么讓這個(gè)系統(tǒng)強(qiáng)大?
吸引全球最佳數(shù)據(jù)的激勵(lì)措施吸引數(shù)據(jù)的激勵(lì)措施是系統(tǒng)中最有效的部分,因?yàn)閿?shù)據(jù)往往成為大多數(shù)機(jī)器學(xué)習(xí)的限制因素?。?以同樣的方式,比特幣通過(guò)開(kāi)放式激勵(lì)機(jī)制創(chuàng)建了一個(gè)全球計(jì)算能力最強(qiáng)的緊急系統(tǒng),適當(dāng)設(shè)計(jì)的數(shù)據(jù)激勵(lì)結(jié)構(gòu)將為您的應(yīng)用程序帶來(lái)世界上最好的數(shù)據(jù)。?關(guān)閉數(shù)據(jù)來(lái)自數(shù)千或數(shù)百萬(wàn)個(gè)來(lái)源的系統(tǒng)幾乎是不可能的。
算法之間的競(jìng)爭(zhēng)在以前不存在的地方創(chuàng)建模型/算法之間的公開(kāi)競(jìng)爭(zhēng)。?使用數(shù)千種競(jìng)爭(zhēng)新聞源算法來(lái)分散Facebook。
獎(jiǎng)勵(lì)的透明度數(shù)據(jù)和模型提供商可以看到他們獲得了他們提交的公平價(jià)值,因?yàn)樗杏?jì)算都是可驗(yàn)證的,使他們更有可能參與。
自動(dòng)化在鏈上直接生成值并在令牌中直接生成值創(chuàng)建了一個(gè)自動(dòng)化的,不受信任的閉環(huán)。
網(wǎng)絡(luò)效應(yīng)來(lái)自用戶,數(shù)據(jù)提供者和數(shù)據(jù)科學(xué)家的多邊網(wǎng)絡(luò)效應(yīng)使系統(tǒng)自我強(qiáng)化。?它的表現(xiàn)越好,吸引的資金就越多,這意味著更多的潛在支出,這吸引了更多的數(shù)據(jù)提供者和數(shù)據(jù)科學(xué)家,他們使系統(tǒng)變得更加智能,反過(guò)來(lái)吸引更多的資本,并且又回到了原來(lái)的位置。
隱私
除了以上幾點(diǎn),一個(gè)主要特點(diǎn)是隱私。?它允許1)人們提交數(shù)據(jù),否則這些數(shù)據(jù)太私密而無(wú)法共享,2)阻止數(shù)據(jù)和模型的經(jīng)濟(jì)價(jià)值泄漏。?如果在未公開(kāi)的情況下保持未加密,則數(shù)據(jù)和模型將被免費(fèi)復(fù)制,并由尚未貢獻(xiàn)任何工作的其他人使用(?“免費(fèi)搭車(chē)者”問(wèn)題?)。
對(duì)搭便車(chē)問(wèn)題的部分解決方案是私下出售數(shù)據(jù)。?即使買(mǎi)家選擇轉(zhuǎn)售或發(fā)布數(shù)據(jù),其價(jià)值隨著時(shí)間而衰減。?但是,這種方法限制了我們的短期使用情況,并且仍然會(huì)產(chǎn)生典型的隱私問(wèn)題。?因此,更復(fù)雜但功能更強(qiáng)大的方法是使用安全計(jì)算形式。
安全計(jì)算
安全的計(jì)算方法允許模型在數(shù)據(jù)上進(jìn)行訓(xùn)練而不會(huì)泄露數(shù)據(jù)本身。?目前使用和研究的安全計(jì)算有三種主要形式:?同態(tài)加密?(HE),?安全?多方計(jì)算(MPC)和零知識(shí)證明?(ZKPs)。?多方計(jì)算目前最常用于私人機(jī)器學(xué)習(xí),因?yàn)橥瑧B(tài)加密過(guò)于緩慢,如何將ZKP應(yīng)用于機(jī)器學(xué)習(xí)并不明顯。?安全計(jì)算方法正處于計(jì)算機(jī)科學(xué)研究的前沿。?它們通常比常規(guī)計(jì)算慢幾個(gè)數(shù)量級(jí),是系統(tǒng)的主要瓶頸,但近年來(lái)一直在改進(jìn)。
終極推薦系統(tǒng)
為了說(shuō)明私人機(jī)器學(xué)習(xí)的潛力,想象一下名為“終極推薦系統(tǒng)”的應(yīng)用程序。它會(huì)監(jiān)視您在設(shè)備上執(zhí)行的所有操作:您的瀏覽記錄,您在應(yīng)用中執(zhí)行的所有操作,手機(jī)上的圖片,位置數(shù)據(jù),消費(fèi)記錄,可穿戴傳感器,短信,家中的相機(jī),未來(lái)的相機(jī)。?然后給你推薦:你應(yīng)該訪問(wèn)的下一個(gè)網(wǎng)站,閱讀文章,聽(tīng)歌或購(gòu)買(mǎi)產(chǎn)品。
這個(gè)推薦系統(tǒng)會(huì)非常有效。?比谷歌,Facebook或其他任何現(xiàn)有的數(shù)據(jù)孤島都要多,因?yàn)樗哂?/span>?一個(gè)最大縱向的觀點(diǎn),你可以從數(shù)據(jù)中學(xué)習(xí),否則將是太私人的考慮分享?。?與以前的加密貨幣交易系統(tǒng)的例子類似,它可以通過(guò)允許一個(gè)專注于不同領(lǐng)域的模型市場(chǎng)(例如:網(wǎng)站推薦,音樂(lè))競(jìng)爭(zhēng)訪問(wèn)您的加密數(shù)據(jù)并向您推薦某些東西,甚至可能支付給您為您提供數(shù)據(jù)或您關(guān)注所產(chǎn)生的建議。
谷歌的聯(lián)邦學(xué)習(xí)和蘋(píng)果的差異隱私是這種私人機(jī)器學(xué)習(xí)方向邁出的一步,但仍需要信任?,不允許用戶直接檢查其安全性,并保持?jǐn)?shù)據(jù)存儲(chǔ)。
目前的方法
這很早。?很少有組織有任何工作,大多數(shù)人都試圖一口咬下一塊。
來(lái)自Algorithmia Research的一個(gè)簡(jiǎn)單結(jié)構(gòu)將模型的精確度設(shè)置為高于某個(gè)回測(cè)閾值:
由Algorithmia Research創(chuàng)建機(jī)器學(xué)習(xí)模型的簡(jiǎn)單構(gòu)造Numerai目前進(jìn)一步采取三個(gè)步驟:它使用加密數(shù)據(jù)(盡管不完全同態(tài)),它將眾包模型結(jié)合到元模型中,并根據(jù)未來(lái)表現(xiàn)(本例中為股票交易一周)獎(jiǎng)勵(lì)模型,而不是通過(guò)回溯測(cè)試一個(gè)名為Numeraire的土生土星紀(jì)念幣。?數(shù)據(jù)科學(xué)家必須將Numeraire作為游戲中的皮膚,激勵(lì)將會(huì)發(fā)生的事情(未來(lái)的表現(xiàn)),而不是發(fā)生的事情(被測(cè)試的性能)。?但是,它目前集中分發(fā)數(shù)據(jù),限制感覺(jué)是最重要的因素。
沒(méi)有人為數(shù)據(jù)創(chuàng)建一個(gè)成功的基于區(qū)塊鏈的市場(chǎng)。?海洋是一個(gè)早期嘗試勾勒出一個(gè)。
還有一些人正在開(kāi)始構(gòu)建安全的計(jì)算網(wǎng)絡(luò)。?Openmined正在創(chuàng)建一個(gè)多方計(jì)算網(wǎng)絡(luò),用于在Unity之上培訓(xùn)機(jī)器學(xué)習(xí)模型,該網(wǎng)絡(luò)可以在任何設(shè)備上運(yùn)行,包括游戲控制臺(tái)(類似于家中的Folding?),然后擴(kuò)展以確保MPC的安全。?謎也有類似的機(jī)智。
一個(gè)迷人的最終狀態(tài)將是相互擁有的元模型,它使數(shù)據(jù)提供者和模型創(chuàng)建者的所有權(quán)與他們做出更聰明的決定成比例?。?這些模型將被標(biāo)記化,隨著時(shí)間的推移可以派發(fā)股息,甚至可能受到培訓(xùn)者的支配。?一種互相擁有的蜂巢式思維。?最初的Openmined視頻是迄今為止我所見(jiàn)過(guò)的最接近的結(jié)構(gòu)。
哪些方法可能首先起作用?
我不會(huì)聲稱知道什么是最好的結(jié)構(gòu),但我有一些想法。
我用來(lái)評(píng)估區(qū)塊鏈想法的一篇論文是:在物理本地?cái)?shù)字原生區(qū)塊鏈原生區(qū)域,區(qū)塊鏈本地越多越好。?較少的區(qū)塊鏈本地化,引入了更可信的第三方,這增加了復(fù)雜性并減少了與其他系統(tǒng)構(gòu)建模塊的易用性。
在這里,我認(rèn)為這意味著如果創(chuàng)造的價(jià)值可以量化,系統(tǒng)就更有可能工作 - 理想情況下直接以貨幣形式直接創(chuàng)建,更好的是代幣。?這允許一個(gè)干凈的閉環(huán)系統(tǒng)。?將以前的加密貨幣交易系統(tǒng)的例子與識(shí)別X射線腫瘤的例子進(jìn)行比較。?在后者中,你需要說(shuō)服一家保險(xiǎn)公司X射線模型是有價(jià)值的,談判如何有價(jià)值,然后相信一小群身在現(xiàn)場(chǎng)的人來(lái)驗(yàn)證模型的成功/失敗。
這并不是說(shuō)對(duì)社會(huì)用途而言,數(shù)字原生的積極總和不會(huì)出現(xiàn)。?像前面提到的推薦系統(tǒng)可能非常有用。?如果附屬于管理市場(chǎng)?,他們是另一種情況,模型可以采用程序化的方式采取行動(dòng),并且系統(tǒng)的回報(bào)是代幣(在這種情況下來(lái)自管理市場(chǎng)),再次創(chuàng)造一個(gè)干凈的閉合回路。?現(xiàn)在看起來(lái)很模糊,但我預(yù)計(jì)區(qū)塊鏈本地任務(wù)的領(lǐng)域會(huì)隨著時(shí)間的推移而擴(kuò)大。
啟示
首先,分散式機(jī)器學(xué)習(xí)市場(chǎng)可以消除目前科技巨頭的數(shù)據(jù)壟斷。?在過(guò)去的20年中,他們將互聯(lián)網(wǎng)上的主要價(jià)值創(chuàng)造源頭標(biāo)準(zhǔn)化和商品化:專有數(shù)據(jù)網(wǎng)絡(luò)和圍繞它們的強(qiáng)大網(wǎng)絡(luò)效應(yīng)。?結(jié)果,?價(jià)值創(chuàng)造從數(shù)據(jù)轉(zhuǎn)移到算法。
科技領(lǐng)域的標(biāo)準(zhǔn)化和商品化周期,我們正在接近數(shù)據(jù)壟斷網(wǎng)絡(luò)時(shí)代的結(jié)束。? 占位符圖。換句話說(shuō),他們為AI?創(chuàng)建了一個(gè)?直接的商業(yè)模式?。?喂養(yǎng)和訓(xùn)練它。
其次,他們創(chuàng)造了世界上最強(qiáng)大的AI系統(tǒng),通過(guò)直接的經(jīng)濟(jì)激勵(lì)為他們吸引最好的數(shù)據(jù)和模型。?他們的力量通過(guò)多方面的網(wǎng)絡(luò)效應(yīng)而增加。?隨著Web 2.0時(shí)代的數(shù)據(jù)網(wǎng)絡(luò)壟斷變得商品化,它們似乎成為下一個(gè)重新聚合點(diǎn)的理想選擇。?我們可能還有幾年的時(shí)間,但看起來(lái)方向正確。
第三,正如推薦系統(tǒng)的例子所示,?搜索是顛倒的?。?產(chǎn)品搜索和競(jìng)爭(zhēng)者不是搜索產(chǎn)品的人?(信貸給布拉德這個(gè)框架)。?每個(gè)人都可能有個(gè)人策展市場(chǎng),推薦系統(tǒng)在競(jìng)爭(zhēng)中將最相關(guān)的內(nèi)容放入其供稿中,并且相關(guān)性由個(gè)人定義。
第四,它們使我們能夠從Google和Facebook等公司使用的功能強(qiáng)大的基于機(jī)器學(xué)習(xí)的服務(wù)中獲得同樣的好處,而不會(huì)泄漏我們的數(shù)據(jù)。
第五,機(jī)器學(xué)習(xí)可以更快地推進(jìn),因?yàn)槿魏喂こ處煻伎梢栽L問(wèn)開(kāi)放的數(shù)據(jù)市場(chǎng),而不僅僅是大型Web 2.0公司的一小部分工程師。
挑戰(zhàn)
首先,安全計(jì)算方法目前非常緩慢,機(jī)器學(xué)習(xí)的計(jì)算成本已經(jīng)很高。?另一方面,對(duì)安全計(jì)算方法的興趣已經(jīng)開(kāi)始出現(xiàn),性能也在不斷提高。?我看到過(guò)去6個(gè)月內(nèi)HE,MPC和ZKPs顯著性能改進(jìn)的新方法。
計(jì)算為元模型提供的一組特定數(shù)據(jù)或模型的值很難。
清理和格式化眾包數(shù)據(jù)具有挑戰(zhàn)性。?我們很可能會(huì)看到一些工具,標(biāo)準(zhǔn)化和小企業(yè)的組合可以解決這個(gè)問(wèn)題。
最后,具有諷刺意味的是,創(chuàng)建這種系統(tǒng)的廣義構(gòu)造的商業(yè)模式不如創(chuàng)建個(gè)體實(shí)例那么明確。?這似乎是很多新的加密原語(yǔ),包括管理市場(chǎng)。
結(jié)論
私人機(jī)器學(xué)習(xí)與區(qū)塊鏈激勵(lì)相結(jié)合,可以在各種應(yīng)用中創(chuàng)造出最強(qiáng)大的機(jī)器智能。?隨著時(shí)間的推移,可以解決重大的技術(shù)挑戰(zhàn)。?他們的長(zhǎng)期潛力是巨大的,并且從大型互聯(lián)網(wǎng)公司對(duì)數(shù)據(jù)的掌握中受到歡迎。?他們也有點(diǎn)可怕 - 他們引導(dǎo)自己存在,自我加強(qiáng),消費(fèi)私人數(shù)據(jù),并且?guī)缀醪豢赡荜P(guān)閉,這讓我懷疑是否創(chuàng)建它們比以前召喚更強(qiáng)大的Moloch?。?無(wú)論如何,它們是加密貨幣如何緩慢并突然進(jìn)入每個(gè)行業(yè)的又一例證。
感謝?Andrew Trask?,?Richard Craib?,?Trent McConaghy?,?Brad Burnham?,Joel Monegro?,?Simon de la Rouviere?,?Gavin Uhma?,?Morten Dahl?,Jonathan Libov?,?Matt Huang?,?Laura Behrens Wu?,?Naval Ravikant?和Daniel Gross?的對(duì)話,帖子。
https://medium.com/@FEhrsam/blockchain-based-machine-learning-marketplaces-cb2d4dae2c17
總結(jié)
以上是生活随笔為你收集整理的【译】Blockchain-based Machine Learning Marketplaces的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 【译】Using Machine Lea
- 下一篇: 【译】Introduction to S