DP敏感度(全局,局部,平滑)
L2靈敏度明顯低于L1靈敏度。
向量值拉普拉斯機制需要使用 L1靈敏度,而向量值高斯機制允許使用L1或L2靈敏度。這是高斯機制的一個主要優(yōu)勢。對于L2靈敏度遠低于L1靈敏度的應用,高斯機制允許添加更少的噪聲。
1.全局敏感度:獨立于所查詢的實際數據集(適用于相鄰的任何選擇)
添加行或刪除行會導致相鄰數據集距離為1,修改行會導致數據集距離為2.
2.局部敏感度:全局敏感度考慮的是任意的數據集,這似乎是悲觀的,因為我們將在實際的數據集上運行我們的差分隱私機制,我們難道不應該考慮該數據集的鄰居嗎?將兩個數據集中的一個固定為正在查詢的實際數據集,并考慮其所有鄰居。
???????將其中一個數據集固定為被查詢的數據集(給定的一個數據集)。當全局靈敏度較大時,必須向輸出中添加大量的噪聲,以實現差分隱私,這可能會嚴重損害數據效用.所以提出LSD。
?例如,考慮一個數據庫,其中的值在0和M>0之間,以及兩個相鄰的數據庫D(0、0、0、0、0、M、M)和D0(0、0、0、0、M、M、M)。設f為中值函數。然后,f(D)=0和f(D0)=0,以及相應的局部靈敏度為LSf(D)=0和LSf(D0)=M(定義)。相應地,如果噪聲分別根據0和M進行校準,以計算A(D)和A(D0),那么它們很容易被對手區(qū)分。如果采用局部靈敏度,算法A不滿足(?,δ)DP的。為了彌合差距,提出了一個局部靈敏度的光滑上界來確定所添加的噪聲的大小。
3.平滑敏感度:當β=0,S(D)成為常數GSf,以滿足定義5中的要求。全局靈敏度是LSf上一個簡單但可能松散的上界。當β>0時,全局靈敏度是LSf的一個保守上界。LSf可能有多個平滑邊界,并且平滑靈敏度是符合定義5的最小邊界。
平滑上界考慮的是改變多條記錄的最大敏感度,再乘以一個平滑上界函數,這個函數的目的在于做一個懲罰,這個函數一定小于1。
?
?
注意:K代表最多K個條目被修改時的敏感度變化,下圖例子K=9,最對9個例子被修改
網上例子:
4.Clip裁剪:這種對距離的特殊定義導致了通常所說的無界差分隱私。
對于將數據集映射到實數的函數,我們可以執(zhí)行類似的分析。我們將考慮表示常見聚合數據庫查詢的函數:計數、總和平均值。
具有無限敏感度的查詢無法使用拉普拉斯機制使用差分隱私回答,所以提出來一個裁剪clipping,基本思想就是對屬性值強制實施上限和下限。
?可以從直方圖看出來,上限是90歲,但是這不滿足DP,因為邊界本身可能會揭示有關數據的某些信息。通常,剪切邊界是通過使用數據集的屬性來決定的,該屬性無需查看數據即可知道(例如,數據集包含的年齡可能介于 0 和 125 之間),或者通過執(zhí)行差分隱私查詢來評估剪切邊界的不同選擇。
差分隱私查詢:通過將下限設置為0,然后不斷向上增加上限,直到查詢的輸出停止更改。嘗試計算0到100的clip邊界年齡總和,添加噪聲。在upper=80時候變化不大,隨意上限可以選擇80.
這種方法允許我們使用少量查詢測試大量可能的邊界,但代價是確定完美邊界的精度較低。
隨著上限變得非常大,噪聲將開始淹沒信號。
請注意,對于最大的裁剪參數,總和會劇烈波動!關鍵是要尋找圖形中相對平滑(意味著低噪聲)且不增加(意味著裁剪邊界足夠)的區(qū)域。
總結
以上是生活随笔為你收集整理的DP敏感度(全局,局部,平滑)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 2022年全球市场风电铸件总体规模、主要
- 下一篇: python文件的运行方法