图灵奖获得者、信息安全常青树Adi Shamir:从密码学到AI对抗性样本研究|智源大会嘉宾风采...
來源:智源大會
導讀:RSA 算法是通信、金融產業中被廣泛使用的安全基本機制,是信息時代的支柱技術。而在這個跨時代算法背后的設計者之一,正是密碼學先驅 Adi Shamir。除了RSA 公鑰密碼算法以外,零知識證明、差分密碼分析、多變元公鑰密碼體制分析和對稱密碼分析等一系列具有劃時代意義的信息安全研究成果背后都有他的身影。
2002 年,因在 RSA 公鑰密碼算法上做出的杰出貢獻,Adi Shamir 與麻省理工學院教授 Ronald L. Rivest 和加州大學伯克利分校教授 Leonard M. Adleman-Ronald 榮膺圖靈獎。而近十年,他已將自己最新的研究方向,瞄準了人工智能。
01
石破天驚:RSA 公鑰密碼算法
1978 年,Adi Shamir 加入了麻省理工學院,與 Ronald L. Rivest 和 Leonard M. Adleman 一同從事密碼學研究。受到密碼學家 Whitfield Diffie 和 Martin Hellman 的論文「New Directions in Cryptography」的啟發,他們于 1977 年在《Communications of the ACM》期刊上發表了對后世影響深遠的論文「A method for obtaining digital signatures and public-key cryptosystems」。
RSA名字來自于它的三位發明人,Shamir、Rivest和Adleman
在這篇論文中,他們展示了如何在幾乎不會被第三方解碼的情況下,在信息的發送雙方之間對消息進行編解碼。該方法使用兩個不同但在數學上相關聯的密鑰:一個用于加密消息的公鑰,另一個用于解密消息的完全不同的私鑰。加密密鑰由希望接收消息的個人公開,但秘密的解密密鑰只有信息收發雙方知道。這兩個密鑰通過一些定義明確的數學關系相關聯,但是幾乎不可能根據公開的信息確定解密密鑰,或者這種解密過程需要耗費過于高昂的計算開銷。時至今日,RSA 成為了幾乎所有基于互聯網的商業交易的基石。
Adi Shamir的另一個重要貢獻是Shamir's Secret Sharing。秘密共享(Secret Sharing,SS)是1979年由Shamir和Blakey提出的,并在此之后40多年秘密共享被廣泛認識和深入的研究,Shamir秘密共享是目前應用最為廣泛的閾值秘密共享技術,在數據安全、隱私計算以及區塊鏈等領域有廣泛應用。
秘密共享的基本概念將秘密分割后由不同的參與者進行管理,單個參與者無法恢復秘密信息,只有若干個參與者共同協作才能恢復。秘密共享著名的(t,n)閾值方案如圖1所示:設秘密s被分成n個部分,每一部分被稱為一個子秘密并由一個持有者持有,并且大于等于t個參與者所持有的子秘密可以重構(Reconstruction)秘密s,而少于t個參與者所持有的子秘密無法重構秘密并且無法獲得秘密s的任何信息。
圖1 ?秘密分享的結構
02
高瞻遠矚:圖靈獎獲獎發言
2002 年,Adi Shamir 因其在公鑰加密算法研究與應用方面的突出貢獻獲得了圖靈獎。在頒獎典禮上,Adi Shamir 發表了題為「Cryptography:State of the Science」的主題演講。在 Shamir看來,密碼學正逐漸從神秘走向公開,從藝術轉變為科學,它對現實世界的影響與日俱增。
上世紀 90 年代,盡管人們對加密技術有重大需求,但以美國為代表的多國政府認為魯棒、不可恢復的加密技術會妨礙我們打擊犯罪和恐怖主義,對其持懷疑態度,進行了嚴格的審查,試圖控制信息加密技術。然而,在巨大的需求刺激以及 Shamir 等科研工作者的推動下,密碼學領域蓬勃發展,吸引了大量的科研工作者、工業界從業者參與其中。
密碼學與數學、統計學、通信、信息論等學科緊密相關,該領域的相關研究對算力的要求也很高。此外,密碼學研究的理論與實踐之間有非常緊密的聯系,Shamir 將該領域的研究概括為:(1)「實踐化的理論」,將抽象的數學工具應用于密碼學領域,使用各種邏輯理論技術證明真實協議的安全性,開發新的密碼方案。(2)「理論化的實踐」,為安全性、攻擊、復雜性、隨機性給出新的定義,將實踐工具理論化定義。
在圖靈獎的主題演講中,Shamir 針對信息安全提出了三條重要的法則:
(1)不存在絕對安全的系統,我們應建立起「足夠安全」的概念,而不應該追求過度的設計;
(2)為了將系統的脆弱性減半,我們需要花費雙倍的成本;
(3)加密算法往往并不是安全系統最大的弱點,很少有黑客通過深入分析數學運算滲透到系統中,他們往往采取其它更簡單的方法。我們無需設計過于復雜的密碼系統。
此后,Shamir 從「密碼學理論」、「公鑰加密和簽名方案」、「分組密碼」、「流密碼」、「理論化的密碼學協議」等方面介紹了當時密碼學研究的相關領域的定義、研究現狀,以及面臨的挑戰。其中,Shamir 介紹的差分密碼分析、零知識證明、分組密碼、流密碼等概念至今仍然是密碼學領域研究的重要課題。
03
歷久彌堅:深度學習時代的 Adi Shamir
作為信息安全領域的常青樹,Adi Shamir 一直活躍在科學研究的最前沿。近年來,隨著機器學習技術的大規模應用,Adi Shamir 也將研究的目光投向了可信機器學習領域。實際上,Shamir 早在 1994 年就提出了「視覺密碼學」的概念。信息收發雙方可以將圖片分解為兩份白色和暗像素的隨機散射片段。當這兩份片段完全重疊時,就會出現真實的消息。因此,如果有人設法收集了除其中一部分片段,仍然無法讀出任何有用的消息。除了將所有片段重合,第三方無法通過重構缺失的部分來揭示秘密信息。
圖2 ?視覺密碼學示例:當兩個大小相同的黑白像素圖像疊加在一起時就會出現特殊字樣。
2013年,Szegedy 等人通過實驗發現了對抗樣本的存在,當我們向輸入加入一個人類難以察覺的變化,就可以欺騙訓練良好的神經網絡。從那時起,這一課題就成為了機器學習的最熱門的研究領域之一。這一領域還存在許多未解之謎,例如:我們仍然不清楚是哪些參數決定了為了誤導網絡需要的輸入坐標的數量。
?
2019 年,Adi Shamir 作為第一作者完成了論文「A Simple Explanation for the Existence of Adversarial Examples with Small Hamming Distance」。在本文中,Shamir 建立了一個簡單的數學框架,使我們能夠從一個新的角度來思考令人困惑的對抗樣本。他們將對抗樣本看做具有(Hamming)度規的 空間中的幾何的自然結果,從而對其進行定量分析。Shamir 等人解釋了為什么我們應該期望在任意深度的被設計用來區分 m 個輸入類的神經網絡中找到漢明距離約為 m 的目標對抗樣本。
圖3 ?使用同一組 11 個像素,通過不同程度的擾動改變輸入數字「7」,輸出任何其它數字的預測向量。紅色點的像素值會減少,綠色點的像素值會增加。
同樣是針對機器學習中的對抗性樣本問題,Adi Shamir 在其 2021 年完成的最新研究成果「The Dimpled Manifold Model of Adversarial Examples in Machine Learning」中,引入了一個新的概念框架(凹形流形模型),對對抗樣本的存在提供了一種簡單的解釋。該模型可以解釋為什么它們的擾動范數如此之小,為什么這些擾動看起來像隨機噪聲,為什么用錯誤標記的圖像進行對抗訓練的網絡仍然能夠正確地對測試圖像進行分類。論文中大量實驗的結果表明這一新模型是有效的,對抗擾動大致正交于包含所有訓練例子的低維流形。
圖4?(左)舊的心理圖像模型(中)圖像流形(右)新提出的決策邊界
基于其團隊在對抗性樣本、可信機器學習等方面發表的一系列研究成果。Adi Shamir 將在 2022 年智源大會上帶來題為「機器學習中對抗樣本的新理論」的專題報告,報告摘要如下:
2013年,幾個研究小組獨立發現了深層神經網絡在輸入端存在微小擾動時是極度脆弱的。由于其神秘的特性和重大的安全影響,研究人員在過去八年中對這些對抗樣本進行了廣泛的研究。盡管付出了巨大的努力,但這些對抗樣本仍然令人困惑,人們至今仍然很難為其給出明確的解釋。例如,有些圖片的表征與帶有「貓」標簽的圖片距離很小,但是它們卻被以很高的置信度識別為汽車、飛機、青蛙、馬或者其它人們所期望的類別;當我們對一張「貓」的圖片進行對抗性修改,即使修改后的圖片與汽車一點也不像,但是神經網絡也可能將其識別為汽車;此外,當我們使用隨機排列的標簽對網絡進行對抗性訓練,使其不會看到任何看起來像「貓」的圖片帶有「貓」的標簽,網絡仍然會將大多數的貓識別為貓。
本次演講旨在介紹一種新的對抗樣本理論——「Dimpled 流形模型」。它可以簡單而又直觀地解釋對抗性樣本存在的原因以及為什么它們具有上述奇異屬性。此外,它還為解釋機器學習中更廣泛的問題提供了新的線索,例如在常規訓練和對抗訓練中深度神經網絡會如何工作。本次演講還將介紹一系列為驗證該理論展開的實驗。
未來智能實驗室的主要工作包括:建立AI智能系統智商評測體系,開展世界人工智能智商評測;開展互聯網(城市)大腦研究計劃,構建互聯網(城市)大腦技術和企業圖譜,為提升企業,行業與城市的智能水平服務。每日推薦范圍未來科技發展趨勢的學習型文章。目前線上平臺已收藏上千篇精華前沿科技文章和報告。
??如果您對實驗室的研究感興趣,歡迎加入未來智能實驗室線上平臺。掃描以下二維碼或點擊本文左下角“閱讀原文”
總結
以上是生活随笔為你收集整理的图灵奖获得者、信息安全常青树Adi Shamir:从密码学到AI对抗性样本研究|智源大会嘉宾风采...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: day38-数据库应用软件
- 下一篇: 【搜索/推荐排序】NCF,DeepCro