TPAMI 2020 | 无监督多类域适应:理论,算法与实践
?作者|張亞斌
學校|香港理工大學
研究方向|遷移學習
本文介紹我們最近的一篇 TPAMI 工作:Unsupervised Multi-Class Domain Adaptation: Theory, Algorithms, and Practice。
?
論文標題:
Unsupervised Multi-Class Domain Adaptation: Theory, Algorithms, and Practice
論文鏈接:
https://arxiv.org/abs/2002.08681
代碼鏈接:
https://github.com/YBZh/MultiClassDA
?
太長不看精簡版:
?
理論方面:基于對 score functions 差異的充分度量,我們提出了 MCSD divergence 來充分衡量兩個 domain 的 divergence;進而引出新的 theoretical bound.
算法方面:基于 MCSD divergence 提出了兩個新的算法框架:McDalNets 和 SymNets. McDalNets 統一了 MCD, DANN, MDD 等經典算法,SymNets 對我們 CVPR 論文的初始版本進行了改進。
實踐方面:在 Closed set, partial, and open set 三個任務多個數據集上驗證了我們方法的有效性。
?
域適應(domain adaptation)是遷移學習中的重要課題。該課題的目標是:
輸入有標簽的源域數據和無標簽的目標域數據,輸出一個適用于目標域的模型。?源域和目標域假設任務相同但是數據分布不同。
既然源域和目標域的數據分布不同,該任務的經典解決方法是:
找到一個特征空間,將分布不同的源域和目標域數據映射到該特征空間后,希望源域和目標域的數據分布差異盡可能小;這樣基于源域數據訓練的模型,就可以用于目標域數據上。
因此如何找到該特征空間,更具體來說,如何衡量兩個域數據分布之間的差異是域適應任務的核心問題。
?
通過對抗訓練的方式實現兩個域的數據分布對齊在域適應任務中被廣泛采用 [1]。近期很多對抗域適應的算法采用特征映射網絡和分類器進行對抗的方式 [2,3,4,5]。
雖然基于分類器進行對抗訓練的方法 [2,3,4,5] 取得了不錯的結果,但是這些算法與現有理論并不是完全吻合的;也就是說,理論和算法之間存在一定的差距。出于此目的,我們對現有的域適應理論進行了改進,使其可以更好的支撐現有算法。
同時,基于該理論框架,我們提出了一系列新的算法,并在 closed set, partial, and open set 域適應三個任務上驗證了其有效性。該文章的要點可以總結如下:
1. 理論方面:提出了 Multi-Class Scoring Disagreement (MCSD) divergence 來衡量兩個域數據分布之間的差異;其中 MCSD 可以充分衡量兩 個 scoring hypotheses(可以理解為分類器)之間的差異?;?MCSD divergence, 我們提出了新的 Adaptation Bound,并詳細討論了我們理論框架和之前框架的關系。
2. 算法方面:基于 MCSD divergence 的理論,我們提出了一套新的代碼框架 Multi-class Domain-adversarial learning Networks (McDalNets)。McDalNets的不同實現與近期的流行方法相似或相同,因此從理論層面支撐了這些方法 [2,3,4,5]。此外,我們提出了一個新的算法 SymmNets-V2, 該方法是我們之前會議工作 [3] 的改進版本。
3. 實踐方面:我們在 closed set, partial, and open set 三種實驗設置下驗證了我們提出方法的有效性。
?
理論方面
如上文所言,如何衡量兩個域之間的差異是域適應任務的核心問題。為了更加細粒度地衡量兩個域之間的差異,我們引入了如下的 MCSD divergence:
其中
充分衡量了 scoring functions 在域 D 上的不一致性(相對于下面將要描述的其他度量方法)。
的定義如下:
是 ramp loss, 指代 absolute margin function?? 的第 k 個值。上述定義有些復雜,我們接下來對其直觀描述: 的每一列 計算了 violations of absolute margin function?,進而 度量了 之間margin violations 的差異,一個直觀的例子如 Fig 1(c) 所示:
到了這里,大家應該會疑惑:這個 MCSD divergence 看上去挺復雜的,它有什么好處?MCSD 的優勢如下:
理論角度:MCSD 可以充分度量?兩個 scoring functions 的差異!!同時導出后續的 bound.
算法角度:對 scoring functions 的差異的充分度量可以直接支撐基于分類器進行對抗訓練的方法?[2,3,4,5].
為了展示 MCSD 對 scoring functions 差異的充分度量,我們基于 absolute margin function 引入其他 domain divergence [6,7] 的變種或等效形式。
是absolute margin-based variant of margin disparity (MD) [6]: , where 是relative margin function,進而基于 得到的 divergence 是 MDD [6] 的變種。
是absolute margin-based equivalent of the hypothesis disagreement (HD) [7]: 。進而基于 得到的 divergence 等效于 。
作為 3 種不同的度量 scoring functions 差異的方法,其直觀對比如 Fig 1 所示,可以總結如下:
采用 0-1 二值 loss 只衡量了 的最終類別預測是否一致。
相對 , 通過引入 margin 在 0 和 1 之間做了一個平滑的過渡。
以上兩者都只考慮了 scoring functions 的部分輸出, 首次將 scoring functions 的所有輸出值加以考慮。故而 MCSD 可以充分度量 scoring functions 的差異。
基于 MCSD divergence, 我們可以得到如下的 bound:
,其中 是 targer error, 是 source error, 可視為與數據集合 hypothesis space 相關的常數。相應的 PAC bound 也可以導出。
總的來說,我們提出了一種 MCSD divergence 來充分度量兩個 scoring functions 的差異,進而提出了一種新的 adaptation bound. 那么充分度量兩個 scoring functions 的差異有什么好處呢?后續的對比實驗經驗性的回答了該問題。
算法方面
上述理論可以推導出一系列的算法,我們將這些算法統一命名為 McDalNets。基于上述 bound, 為了最小化 target error ,我們需要找到可以最小化 的 feature extractor 以及可以最小化 source error 的 和 。將 展開成 的形式可以得到如下的優化目標:
其中 分別是分布 , 經由映射 得到的特征分布。該優化目標如下圖所示:
?
上述目標仍然難以直接優化,因為 ramp loss 會導致梯度消失的問題。為了便于優化,我們引入了一些 MCSD 的替代度量方法。這些替代度量方法應該具有如下特點:
當 在 domain 上的輸出越趨于一致,替代度量方法的值越小
當 在 domain 上的輸出越差異越大,替代度量方法的值越大
我們在本文中采用了三種 MCSD 的替代度量方法,分別是:
其中 是 softmax 函數, 是 KL 散度, 是交叉熵函數。其他具有上述兩點特點且便于優化的函數都可以用來作為 MCSD 的替代度量方法。
當采用 loss 作為替代度量時,McDalNet 與 MCD [2] 方法極其相似。需要強調的是,雖然 MCD 算法是從 -divergence [7] 推導而出的,但是 MCD 算法與 -divergence 存在明顯 gap:MCD 算法采用 L_1 loss 衡量了classifiers outputs 在 element-wise 的差異,而 -divergence只考慮了classifiers 類別預測的不一致性。
考慮到 MCSD 是基于對 classifiers outputs 在 element-wise 的差異的度量,因此 MCSD divergence 可以更直接,更緊密的支撐 MCD 這類基于 classifiers outputs 差異做對抗訓練的方法。
類似 ,我們也可以基于 和 得到對應的類似 McDalNet 的算法。其中基于 得到的方法完全等效于 DANN [1],基于 得到的方法是 MDD [6] 的一個變種。
我們將不同 McDalNet 的算法在標準的域適應數據集上進行對比,結果如下圖所示:
除了上述的 McDalNet 框架,基于 MCSD divergence, 我們還引入了一個? Domain-Symmetric Networks (SymmNets) 的新框架,如下圖所示。
該框架是基于 CVPR 的論文 [3] 做的改進,因此我們稱之為 SymmNets-V2. 相對于 McDalNets, SymmNets-V2 沒有額外的 task classifier,而是將其與 classifiers for 域對齊進行了合并。
該方法在網絡結構上的鮮明特點是將兩個 classifiers 拼接到一起,并用拼接得到的 classifier 用作域對齊;通過這種方式,我們賦予了兩個 classifiers 明確的 domain 信息,同時取得了更優的實驗結果。SymmNets-V2 的優化目標如下:
其中 是分類損失,用來賦予 類別信息, 用來增大 的輸出差異, 和 分別用來減小 在源域數據和目標域數據上的輸出差異。其具體定義和與 MCSD 的聯系請參考論文。
對于熟悉 DANN [1] 的讀者,可以將 SymmNets 看做將 category information 引入 DANN 的直接擴展。具體來說,如果我們分別將 中的所有類別當成整體,那么整體化之后的 就分別對應著 DANN 二分類 domain classifier 中的源域和目標域;
這樣 SymmNets 中的增大/減小 的輸出差異就對應著 DANN 中的 domain discrimination/domain confusion. 將 DANN 二分類 domain classifier 中的源域和目標域擴展成由 拼接成的 2K 分類器,可以為在域對齊過程中引入 category information 做好模型結構準備。
實踐方面
我們在 closed set, partial, and open set domain adaptation 三個任務共七個數據集上驗證了我們提出的 McDalNets 和 SymmNets 的有效性。
相對 closed set 的任務,partial and open set domain adaptation 任務中的難度增大很大程度是兩個域中共享類別的樣本與其中一個域中獨有類別的樣本在 adaptation 過程中發生了錯誤對齊帶來的;因此 SymmNets 中對 category information 的引入和對 category level alignment 的促進可以極大的緩解該錯誤對齊現象,從而對 partial 和 open set domain adaptation 帶來幫助。
最后,我們通過如下的 t-SNE 可視化來說明我們提出的 SymmNets 的有效性。
參考文獻
[1] Domain-Adversarial Training of Neural Networks, JMLR16
[2] Maximum Classifier Discrepancy for Unsupervised Domain Adaptation, CVPR18
[3] Domain-Symmetric Networks for Adversarial Domain Adaptation, CVPR19
[4] Unsupervised Domain Adaptation via Regularized Conditional Alignment, ICCV19
[5]?Sliced wasserstein discrepancy for unsupervised domain adaptation, CVPR19
[6] Bridging Theory and Algorithm for Domain Adaptation, ICML19
[7] A theory of learning from different domains,ML10
?
更多閱讀
?
#投 稿?通 道#
?讓你的論文被更多人看到?
如何才能讓更多的優質內容以更短路徑到達讀者群體,縮短讀者尋找優質內容的成本呢?答案就是:你不認識的人。
總有一些你不認識的人,知道你想知道的東西。PaperWeekly 或許可以成為一座橋梁,促使不同背景、不同方向的學者和學術靈感相互碰撞,迸發出更多的可能性。?
PaperWeekly 鼓勵高校實驗室或個人,在我們的平臺上分享各類優質內容,可以是最新論文解讀,也可以是學習心得或技術干貨。我們的目的只有一個,讓知識真正流動起來。
?????來稿標準:
? 稿件確系個人原創作品,來稿需注明作者個人信息(姓名+學校/工作單位+學歷/職位+研究方向)?
? 如果文章并非首發,請在投稿時提醒并附上所有已發布鏈接?
? PaperWeekly 默認每篇文章都是首發,均會添加“原創”標志
?????投稿郵箱:
? 投稿郵箱:hr@paperweekly.site?
? 所有文章配圖,請單獨在附件中發送?
? 請留下即時聯系方式(微信或手機),以便我們在編輯發布時和作者溝通
????
現在,在「知乎」也能找到我們了
進入知乎首頁搜索「PaperWeekly」
點擊「關注」訂閱我們的專欄吧
關于PaperWeekly
PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公眾號后臺點擊「交流群」,小助手將把你帶入 PaperWeekly 的交流群里。
與50位技術專家面對面20年技術見證,附贈技術全景圖總結
以上是生活随笔為你收集整理的TPAMI 2020 | 无监督多类域适应:理论,算法与实践的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 投诉村民在部队辖区放羊,怎么回复1234
- 下一篇: 二战德国第19集团军溃败速度有多快?