「机密计算-隐私计算」科普
前言
- 提醒:全文10千字,預(yù)計(jì)閱讀時(shí)長(zhǎng)15分鐘;
- 讀者:對(duì)隱私計(jì)算感興趣的小伙伴;
- 目的:讀者利用15~30 分鐘對(duì)本文沉浸式閱讀理解,能夠掌握隱私計(jì)算 80% 的概念;
- 關(guān)鍵詞 :隱私計(jì)算、多方安全計(jì)算、聯(lián)邦學(xué)習(xí)、同態(tài)加密、機(jī)密計(jì)算、差分計(jì)算;
摘要
本文主要從基本概念、技術(shù)方向、法律法規(guī)、應(yīng)用等方面對(duì)隱私計(jì)算進(jìn)行了簡(jiǎn)單的科普解讀。
圖1 隱私計(jì)算市場(chǎng)規(guī)模一、概念
1.1 數(shù)據(jù) Data
數(shù)據(jù):數(shù)據(jù)已經(jīng)成為現(xiàn)代社會(huì)的主要生產(chǎn)要素,其價(jià)值創(chuàng)造依賴(lài)于數(shù)據(jù)流通。數(shù)據(jù)流通的關(guān)鍵是價(jià)值流通,數(shù)據(jù)流通的目的是價(jià)值釋放。
數(shù)據(jù)中可能包含隱私。
1.2?隱私?Privacy
定義:《民法典》第1032條第二款:“隱私是自然人的私人生活安寧和不愿為他人知曉的私密空間、私密活動(dòng)、私密信息。”
權(quán)力:《中華人民共和國(guó)民法典》第一千零三十二條: 自然人享有隱私權(quán)。任何組織或者個(gè)人不得以刺探、侵?jǐn)_、泄露、公開(kāi)等方式侵害他人的隱私權(quán)。
1.3 隱私跨境
隱私跨境:泛指因各種原因?qū)е码[私數(shù)據(jù)跨越其管控區(qū)域到其他區(qū)域,是數(shù)據(jù)跨境過(guò)程中不可避免的行為。
隱私計(jì)算是保護(hù)隱私跨境流通安全與合規(guī)的有力武器。
1.4?隱私計(jì)算?Privacy computing
定義:隱私計(jì)算是指在保護(hù)數(shù)據(jù)本身不對(duì)外泄露的前提下實(shí)現(xiàn)數(shù)據(jù)分析計(jì)算的技術(shù)集合,達(dá)到對(duì)數(shù)據(jù)“可用、不可見(jiàn)”的目的;在充分保護(hù)數(shù)據(jù)和隱私安全的前提下,實(shí)現(xiàn)數(shù)據(jù)價(jià)值的轉(zhuǎn)化和釋放。隱私計(jì)算是面向隱私信息全生命周期保護(hù)的計(jì)算理論和方法,是隱私信息的所有權(quán)、管理權(quán)和使用權(quán)分離時(shí)隱私度量、隱私泄漏代價(jià)、隱私保護(hù)與隱私分析復(fù)雜性的可計(jì)算模型與公理化系統(tǒng)。
價(jià)值:與傳統(tǒng)數(shù)據(jù)使用方式相比,隱私計(jì)算的加密機(jī)制能夠增強(qiáng)對(duì)于數(shù)據(jù)的保護(hù)、降低數(shù)據(jù)泄露風(fēng)險(xiǎn)。傳統(tǒng)數(shù)據(jù)安全手段,比如數(shù)據(jù)脫敏或匿名化處理,都要以犧牲部分?jǐn)?shù)據(jù)維度為代價(jià),導(dǎo)致數(shù)據(jù)信息無(wú)法有效被利用,而隱私計(jì)算則提供了另一種解決思路,保證在安全的前提下盡可能使數(shù)據(jù)價(jià)值最大化。
盡管應(yīng)用潛力巨大,但隱私計(jì)算技術(shù)的規(guī)模化應(yīng)用仍面臨著生態(tài)、性能、安全等多方面的挑戰(zhàn)。
1.5?隱私計(jì)算技術(shù)
多方安全計(jì)算(Secure Multi-party Computation, MPC)是指在無(wú)可信第三方的情況下,多個(gè)參與方共同計(jì)算一個(gè)目標(biāo)函數(shù), 并且保證每一方僅獲取自己的計(jì)算結(jié)果,無(wú)法通過(guò)計(jì)算過(guò)程中的交互 數(shù)據(jù)推測(cè)出其他任意一方的輸入數(shù)據(jù)(除非函數(shù)本身可以由自己的輸 入和獲得的輸出推測(cè)出其他參與方的輸入。
聯(lián)邦學(xué)習(xí)是實(shí)現(xiàn)在本地原始數(shù)據(jù)不出庫(kù)的情況下, 通過(guò)對(duì)中間加密數(shù)據(jù)的流通與處理來(lái)完成多方聯(lián)合的機(jī)器學(xué)習(xí)訓(xùn)練。聯(lián)邦學(xué)習(xí)參與方一般包括數(shù)據(jù)方、算法方、協(xié)調(diào)方、計(jì)算方、結(jié)果方、任務(wù)發(fā)起方等角色,根據(jù)參與計(jì)算的數(shù)據(jù)在數(shù)據(jù)方之間分布的情況不 同,可以分為橫向聯(lián)邦學(xué)習(xí)、縱向聯(lián)邦學(xué)習(xí)和聯(lián)邦遷移學(xué)習(xí)。
可信執(zhí)行環(huán)境(Trusted Execution Environment, TEE)通過(guò)軟硬件方法在中央處理器中構(gòu)建一個(gè)安全的區(qū)域,保證其內(nèi)部加載的程序 和數(shù)據(jù)在機(jī)密性和完整性上得到保護(hù)。TEE是一個(gè)隔離的執(zhí)行環(huán)境,為在設(shè)備上運(yùn)行的受信任應(yīng)用程序提供了比普通操作系統(tǒng)(Rich Operating System, RichOS)更高級(jí)別的安全性。
多方中介計(jì)算(Multi-partyintermediary computation, MPIC)是指多方數(shù)據(jù)在獨(dú)立于數(shù)據(jù)方和用戶的受監(jiān)管中介計(jì)算環(huán)境內(nèi),通過(guò)安全可信的機(jī)制實(shí)現(xiàn)分析計(jì)算和匿名化結(jié)果輸出的數(shù)據(jù)處理方式,是一個(gè)計(jì)算管理系統(tǒng)。在MPIC中,數(shù)據(jù)方的原始數(shù)據(jù)由其去標(biāo)識(shí)化后輸入中介計(jì)算環(huán)境或平臺(tái)參與計(jì)算,完成計(jì)算后立即被刪除,匿名化結(jié)果數(shù)據(jù)經(jīng)審核后按指定路徑輸出。在MPIC的特定環(huán)境和規(guī)則下,信息數(shù)據(jù)的身份標(biāo)識(shí)經(jīng)過(guò)加密和標(biāo)識(shí)化的處理,因其算法具有不可逆性,故無(wú)法恢復(fù)為原始數(shù)據(jù),滿足了匿名化的一個(gè)要求,即不能原復(fù);同時(shí),由于這些去標(biāo)識(shí)化的信息數(shù)據(jù)被封閉在特定受監(jiān)管環(huán)境或平臺(tái)中,客觀上達(dá)到了匿名化的另一個(gè)要求,即無(wú)法識(shí)別特定自然人。故被處理的數(shù)據(jù)實(shí)質(zhì)可視同匿名化,不再屬于個(gè)人信息,無(wú)需征得個(gè)人同意就可進(jìn)入中介計(jì)算環(huán)境或平臺(tái)參與計(jì)算。
差分隱私(differential privacy)是密碼學(xué)中的一種手段,旨在提供一種當(dāng)從統(tǒng)計(jì)數(shù)據(jù)庫(kù)查詢(xún)時(shí),最大化數(shù)據(jù)查詢(xún)的準(zhǔn)確性,同時(shí)最大限度減少識(shí)別其記錄的機(jī)會(huì)。
1.6 隱私計(jì)算平臺(tái)
隱私計(jì)算平臺(tái)是融合了隱私計(jì)算技術(shù),并提供隱私計(jì)算服務(wù)的平臺(tái)。
PrimiHub是開(kāi)源隱私計(jì)算平臺(tái),基于安全多方計(jì)算、聯(lián)邦學(xué)習(xí)、同態(tài)加密、可信計(jì)算等隱私計(jì)算技術(shù),結(jié)合區(qū)塊鏈等自主研發(fā)的隱私計(jì)算應(yīng)用平臺(tái)。秉承保護(hù)數(shù)據(jù)在應(yīng)用過(guò)程中的隱私安全,實(shí)現(xiàn)“數(shù)據(jù)可用不可見(jiàn)”。 產(chǎn)品平臺(tái)涵蓋了匿蹤查詢(xún)、隱私求交、聯(lián)合建模、聯(lián)合統(tǒng)計(jì)、算法容器管理、數(shù)據(jù)資源管理、數(shù)據(jù)確權(quán)與定價(jià)、異構(gòu)平臺(tái)互聯(lián)互通等主要應(yīng)用服務(wù)功能。
二、技術(shù)解讀
2.1 屠龍刀因武林紛爭(zhēng)?
2.1.1 獨(dú)孤求敗玄鐵重劍重現(xiàn)
-姚老師的百萬(wàn)富翁問(wèn)題-
一個(gè)屋子里只有 2個(gè)富翁你(5塊錢(qián))和我(3塊錢(qián)),是否有一個(gè)辦法在相互不泄露財(cái)產(chǎn)隱私數(shù)據(jù)的情況下比誰(shuí)是哥哥?
---------------------------------------------------我是思考線-------------------------------------------------------
規(guī)則:
1. 拿 10 個(gè)相同的盒子,按順序排列
2. 你向第 5 個(gè)箱子里放 1 罐啤酒(和資產(chǎn)相等),前 4 個(gè)放上花生米(少于你的資產(chǎn)),后 5 個(gè)放上瓜子(多于你的資產(chǎn)),全部上鎖,只有你有鑰匙。
3. 將 10 個(gè)盒子給我,維持順序
4. 我把第 4 個(gè)箱子再上一把鎖(我的資產(chǎn)),然后把其他盒子銷(xiāo)毀
5. 在雙方見(jiàn)證的情況下,打開(kāi)盒子;
6. 如果是瓜子,我是哥哥;如果是花生米,你是哥哥;如果是啤酒,一人喝一口就行了。
是時(shí)候展示真正的實(shí)力了,按照以上方法,咱倆真正比一下,你有 500w,我有 200w,看看最終能比較出來(lái)嗎?
隱私計(jì)算理論技術(shù)的百花齊放就源自這個(gè)問(wèn)題,大師們依次現(xiàn)身說(shuō)法:
- 1978 Rivest[1]首次提出同態(tài)加密這一概念
- 1979 Shamir[2] 提出門(mén)限秘密分享協(xié)議
- 1981 Rabin[3] 提出不經(jīng)意傳輸協(xié)議
- 1982 Yao[4] 提出多方安全計(jì)算協(xié)議
- 1986 Yao[5]提出混淆電路
- 1987 Goldreich[6] 提出基于秘密分享的MPC
- 1995 Chor[7] 提出PIR協(xié)議
- 1999 Paillier[8] 提出半同態(tài)加密協(xié)議
- 等等
前兩位是 RSA 的發(fā)明者吧,總體來(lái)看這些概念原型出現(xiàn)的比較早,隨著技術(shù)理論的不斷成熟以及市場(chǎng)需求,2018 年開(kāi)始這些隱私計(jì)算技術(shù)在金融、醫(yī)療、政務(wù)領(lǐng)域得到規(guī)模化應(yīng)用,相關(guān)標(biāo)準(zhǔn)也不斷的完善推出,隱私計(jì)算開(kāi)始進(jìn)入大眾視野。
2.1.2 四大門(mén)派各顯神通
圖2 隱私計(jì)算技術(shù)框架引自《隱私計(jì)算》陳凱 楊強(qiáng)?
?根據(jù)《隱私計(jì)算》一書(shū)中的分類(lèi),隱私計(jì)算技術(shù)主要包括多方安全計(jì)算、聯(lián)邦學(xué)習(xí)、同態(tài)加密、可信執(zhí)行緩解、差分隱私,各個(gè)技術(shù)既相互獨(dú)立,又有一定的聯(lián)系,比如聯(lián)邦學(xué)習(xí)和其他幾種技術(shù)都有聯(lián)系,而可信執(zhí)行環(huán)境和同態(tài)加密是相互獨(dú)立的,這些技術(shù)共同構(gòu)成隱私計(jì)算技術(shù)框架;每個(gè)隱私計(jì)算技術(shù)內(nèi)部又由更具體的技術(shù)構(gòu)成,總體來(lái)說(shuō)整個(gè)技術(shù)框架構(gòu)成清晰、層次分明、相互獨(dú)立,容易發(fā)展進(jìn)化,下面對(duì)各個(gè)技術(shù)分類(lèi)進(jìn)行介紹。
2.2?多方安全計(jì)算 MPC
2.2.1 概述?
MPC 根據(jù)參與方數(shù)量的不同,可分為:兩方計(jì)算(two party computation,簡(jiǎn)稱(chēng) 2PC)和多方計(jì)算(multi-party computation),這兩者間存在本質(zhì)的區(qū)別。目前,通用的兩方計(jì)算(2PC)已經(jīng)具備了商用的條件。多方計(jì)算在某些特定場(chǎng)景下也已經(jīng)沒(méi)有太多的性能瓶頸;而通用計(jì)算協(xié)議在可擴(kuò)展性層面依然不夠成熟,這也是學(xué)術(shù)界一直在探索的方向。
2.2.2 數(shù)學(xué)定義
假設(shè)存在n 個(gè)參與方 P1,P2,…,Pn,每個(gè)參與方都有一個(gè)私有輸入數(shù)據(jù) xi,所有參與方共同計(jì)算某個(gè)函數(shù) f(x1, x2, …, xn),且要求在計(jì)算結(jié)束時(shí),每個(gè)參與方 Pi 只能得到私有輸入數(shù)據(jù) xi 的輸出,而不能獲取其他參與方的輸入信息及輸出結(jié)果信息。
2.2.3 技術(shù)分解
秘密共享?
數(shù)學(xué)家眼中的秘密共享
圖3 秘密共享定義我等學(xué)渣眼中的秘密共享?
秘密共享的思想是將秘密以適當(dāng)?shù)姆绞讲鸱?#xff0c;拆分后的每一個(gè)份額由不同的參與者管理,單個(gè)參與者無(wú)法恢復(fù)秘密信息,只有若干個(gè)參與者一同協(xié)作才能恢復(fù)秘密消息。更重要的是,當(dāng)其中任何相應(yīng)范圍內(nèi)參與者出問(wèn)題時(shí),秘密仍可以完整恢復(fù)。
這是不是有點(diǎn)像集齊七龍珠,倚天屠龍得武穆遺書(shū),還考慮了防破壞、防背叛。皇帝密詔印多分,切碎,每個(gè)錦衣衛(wèi)一塊,分頭行動(dòng),送往目的地。
可以通過(guò)數(shù)學(xué)上的很多原理構(gòu)造秘密共享方案:
- 如果秘密是一條秘密多項(xiàng)式曲線上的一個(gè)點(diǎn),如
?
? ? ? ?那么秘密y被分割為a、b、c、x
- 更高級(jí)的,秘密可以是一個(gè)高階曲線上的點(diǎn),利用拉格朗日插值法還原更精確的秘密
? ? ? ?只需要通過(guò)?k 和 x 還原 k 個(gè)密鑰,就可以獲得秘密
給說(shuō)人話的學(xué)渣加雞腿
混淆電路
混淆電路是一種密碼學(xué)協(xié)議,由姚期智教授在80年代針對(duì)安全計(jì)算所提出的概念。其效果就是:當(dāng)幾個(gè)通信方需要一起輸入某些數(shù)據(jù),然后通過(guò)同一個(gè)函數(shù)計(jì)算出一個(gè)結(jié)果。但是通信的各方都不希望其他人知道自己的輸入是什么,此時(shí)利用混淆電路協(xié)議即可完成目的。
參考文章?混淆電路簡(jiǎn)介(GC)?即可,大同小異
不經(jīng)意傳輸?
不經(jīng)意傳輸(OT, oblivious transfer)是密碼學(xué)中經(jīng)常用到的一個(gè)安全的兩方通信協(xié)議,是密碼學(xué)中的一個(gè)基本協(xié)議。在這個(gè)協(xié)議中,發(fā)送方(Sender)和接收方(Receiver)通信,協(xié)議執(zhí)行結(jié)束后,接收方可以獲得自己想要的信息,而不能獲得發(fā)送方的其他信息,發(fā)送方對(duì)于接收方獲得了哪一條消息是不知道的。
目的:在無(wú)可信第三方協(xié)助的情況下,保證雙方能夠獲得解密自己文件的秘密。
?具體案例參考 2.1.1
2.3?聯(lián)邦學(xué)習(xí)
2.4?同態(tài)加密
2.5?機(jī)密計(jì)算
2.6?差分計(jì)算
三、案例解讀
3.1 金融營(yíng)銷(xiāo)與風(fēng)控
3.2 基因研究
3.3 醫(yī)藥研究
3.4 政府部門(mén)
四、 Information
4.1 標(biāo)準(zhǔn)、法規(guī)、讀物
4.1.1 標(biāo)準(zhǔn)
《信息安全技術(shù) 機(jī)密計(jì)算通用框架》
《電信網(wǎng)和互聯(lián)網(wǎng)聯(lián)邦學(xué)習(xí)技術(shù)要求與測(cè)試方法》
《電信網(wǎng)和互聯(lián)網(wǎng)多方安全計(jì)算技術(shù)要求與測(cè)試方法》
《隱私計(jì)算 一體機(jī)技術(shù)要求》
《隱私計(jì)算 可信執(zhí)行環(huán)境安全要求和測(cè)試方法》
《隱私計(jì)算 可信執(zhí)行環(huán)境性能要求和測(cè)試方法》
《隱私計(jì)算 金融場(chǎng)景標(biāo)準(zhǔn)及測(cè)試方法》
《基于多方安全計(jì)算的數(shù)據(jù)流通產(chǎn)品技術(shù)要求與測(cè)試方法》
《隱私計(jì)算多方安全計(jì)算產(chǎn)品性能要求與測(cè)試方法》
《隱私計(jì)算 多方安全計(jì)算安全要求與測(cè)試方法》
《多方安全計(jì)算金融應(yīng)用技術(shù)規(guī)范》
《多方安全計(jì)算金融應(yīng)用評(píng)估規(guī)范》
《Recommended Practice for Secure Multi-Party Computation》
4.1.2 行業(yè)報(bào)告
《隱私計(jì)算推動(dòng)金融業(yè)數(shù)據(jù)生態(tài)建設(shè)》
《隱私計(jì)算應(yīng)用研究報(bào)告(2022)》
《可信隱私計(jì)算研究報(bào)告》
《2022中國(guó)隱私計(jì)算產(chǎn)業(yè)研究報(bào)告》
《2022年中國(guó)隱私計(jì)算行業(yè)洞察報(bào)告》
《中國(guó)隱私保護(hù)計(jì)算技術(shù)研究報(bào)告》
《2021年中國(guó)隱私計(jì)算市場(chǎng)研究報(bào)告》
4.1.3?書(shū)刊
《隱私計(jì)算理論與技術(shù)》李鳳華
《隱私計(jì)算》陳凱
《隱私計(jì)算——推進(jìn)數(shù)據(jù)”可用不可見(jiàn)”的關(guān)鍵技術(shù)》 閆樹(shù)
4.2、組織
4.2.1?聯(lián)盟
中國(guó)信通院隱私計(jì)算聯(lián)盟
4.2.2 社區(qū)
開(kāi)放隱私計(jì)算OpenMPC
Edgeless
4.2.3 機(jī)構(gòu)
CCSA
IEEE
CFCA
中國(guó)人民銀行
4.3、開(kāi)源項(xiàng)目
4.3.1 綜合性
PySyft、SecretFlow、PrimiHub?
4.3.2 MPC
工業(yè)?TF-Encrypted、CrypTen、Rosetta、SyMPC、SPU
學(xué)術(shù)?MP-SPDZ、FudanMPL、MPC4j、EzPC 、ABY、ABY3、Cheetah
4.3.3?FL
TensorFlow-Federated、FedML、LEAF、FATE、PaddleFL、EFLS、FedLearn
4.3.4?TEE
Occlum、Gramine、OP-TEE、豆莢TEE、Teaclave(MesaTEE)、Asylo、Constellation、EdgelessDB、MarbleRun、Ego
4.4.5 HE
TFHE、FHEW、 OpenFHE,Concrete、HEhub、SEAL、HElib、TenSEAL、OpenFHE、Hehub、PEGASUS、cuHE、cuFHE、cuYASHE
總結(jié)
隱私計(jì)算是未來(lái)幾年比較火的方向,值得我們花些時(shí)間學(xué)習(xí)。
參考
《隱私計(jì)算》陳凱
終于把隱私計(jì)算、聯(lián)邦學(xué)習(xí)、多方安全計(jì)算、機(jī)密計(jì)算、差分隱私全搞清楚了!
一文剖析2022年“全球隱私計(jì)算開(kāi)源現(xiàn)狀”
術(shù)語(yǔ)
MPC
安全多方計(jì)算(Secure Multi-Party Computation,MPC)是指在無(wú)可信第三方的情況下,多個(gè)參與方協(xié)同計(jì)算一個(gè)約定的函數(shù),并且保證每一方僅獲取自己的計(jì)算結(jié)果,無(wú)法通過(guò)計(jì)算過(guò)程中的交互數(shù)據(jù)推測(cè)出其他任意一方的輸入和輸出數(shù)據(jù)。安全多方計(jì)算(MPC)包括同態(tài)加密、秘密共享、混淆電路、零知識(shí)證明、不經(jīng)意傳輸(OT)等技術(shù)。
PSI
隱私保護(hù)集合交集協(xié)議(Private Set Intersection,PSI)允許持有各自數(shù)據(jù)集合的兩方執(zhí)行雙方集合的交集運(yùn)算。PSI 協(xié)議結(jié)束之后,一方或兩方能夠得到交集結(jié)果,但是雙方都無(wú)法獲知交集以外的對(duì)方集合數(shù)據(jù)的任何信息。
寫(xiě)在后面
皮格馬利翁效應(yīng)心理學(xué)指出,贊美、贊同能夠產(chǎn)生奇跡,越具體,效果越好~ “收藏夾吃灰”是學(xué)“器”練“術(shù)”非常聰明的方法,幫助我們避免日常低效的勤奮~
總結(jié)
以上是生活随笔為你收集整理的「机密计算-隐私计算」科普的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 日语日常信函书信写作范文(6篇)
- 下一篇: 美团项目 ---首页开发2