Open Set Domain Adaptation 开集领域适应
1. Motivation
2017年ICCV上發(fā)表了一篇題為OpenSetDomainAdaptationOpen Set Domain AdaptationOpenSetDomainAdaptation[1]的論文說:一般我們所講的領(lǐng)域適應(yīng)(domain adaptation)是在一個(gè)閉集(close set)的前提條件下進(jìn)行的,即源域和目標(biāo)與擁有相同的標(biāo)簽類別。但是在大多數(shù)的實(shí)際情況中,源域和目標(biāo)域可能只共享了一部分相同類別。如圖1所示(圖片來源于文獻(xiàn)[1]),在Close set domain adaptation問題中,目標(biāo)與中出現(xiàn)的標(biāo)簽類別全在源域中出現(xiàn)了,而在Open set domain adaptation問題中,目標(biāo)域中出現(xiàn)的摩托車、電視、飛機(jī)等均未在源域中出現(xiàn);相反,源域中出現(xiàn)的鳥、筆記本、杯子也未在目標(biāo)域中出現(xiàn)。
顯然domain adaptation in close set中的方法不能用于解決domain adaptation in open set問題,在進(jìn)行特征對(duì)齊的時(shí)候只能對(duì)其已知的類別,不能對(duì)齊未知的類別。
隨后,在2018年ECCV上有一篇論文Open Set Domain Adaptation by Backpropagation,對(duì)Open-set domain adaptation進(jìn)行了重新定義,
2. Method
為解決Open Set問題,作者提出了Open Set Domain Adaptation方法,步驟如下:
( a ) 源域中包含已知帶標(biāo)簽的樣本(分別用紅、藍(lán)、綠以及不同形狀表示)和未知樣本(灰色表示),而目標(biāo)域中不包含任何標(biāo)簽信息;
( b ) 首先,我們?yōu)橐恍┠繕?biāo)樣本分配類別標(biāo)簽,留下未標(biāo)記的異常樣本;
( c ) 通過減小標(biāo)記為同一類別的源域和目標(biāo)域數(shù)據(jù)之間的距離,我們可以學(xué)習(xí)到從源域到目標(biāo)域的映射關(guān)系。將( b )和( c )反復(fù)迭代,直到源域與目標(biāo)域之間的距離收斂到局部最小值;
( d ) 為了個(gè)目標(biāo)域的樣本打上標(biāo)簽(紅色,綠色,藍(lán)色和灰色(未知類別)),我們?cè)谝呀?jīng)映射到目標(biāo)域的源域數(shù)據(jù)上學(xué)習(xí)分類器,并用它來分類目標(biāo)域樣本。
####2.1 Unsupervised Domain Adaptation
源域數(shù)據(jù):CCC個(gè)類別,其中∣C?1∣\left | C-1\right |∣C?1∣個(gè)已知,1個(gè)未知
目標(biāo)域數(shù)據(jù):T={T1,T2,...,TT}\mathcal{T}=\left \{T_1, T_2, ...,T_{\mathcal{T}}\right \}T={T1?,T2?,...,TT?}
目標(biāo):給目標(biāo)域中的每一個(gè)數(shù)據(jù)T\mathcal{T}T打上標(biāo)簽c∈Cc \in Cc∈C
損失函數(shù):將目標(biāo)域樣本TtT_tTt?標(biāo)記為標(biāo)簽ccc的損失函數(shù)記為:dct=∥Sc?Tt∥22d_{ct}=\left \| S_{c}-T_{t}\right \|_{2}^{2}dct?=∥Sc??Tt?∥22?,其中TtT_{t}Tt?是目標(biāo)域樣本t的特征表達(dá),ScS_{c}Sc?是源域中標(biāo)簽為ccc的樣本的均值。這里采用的是樣本一階矩來度量兩個(gè)分布間差異,當(dāng)然我們是希望dctd_{ct}dct?越小越好,表明給目標(biāo)域數(shù)據(jù)TcT_{c}Tc?的標(biāo)簽越接近真實(shí)標(biāo)簽。
為了增加模型的魯棒性,這里并不會(huì)為目標(biāo)域中的沒有一個(gè)樣本都分配一個(gè)標(biāo)簽ccc,而是引入了異常值oto_{t}ot?,整個(gè)模型的優(yōu)化目標(biāo)如下:
其中xctx_{ct}xct?和oto_{t}ot?是兩個(gè)二值變量,他們要么是0要么是1。當(dāng)xctx_{ct}xct?為0 ,oto_{t}ot?為1表明目標(biāo)域中的該樣本為異常值,反之亦然。第二個(gè)約束條件確保至少有一個(gè)樣本被標(biāo)記為了標(biāo)簽ccc。所以最終的目標(biāo)是確保目標(biāo)域中所有樣本的dctd_{ct}dct?與oto_{t}ot?的和最小。
2.2 Semi-supervised Domain Adaptation
當(dāng)目標(biāo)域有一小部分標(biāo)記數(shù)據(jù)之后無監(jiān)督問題可以變成一個(gè)半監(jiān)督問題。要處理semi-supervised情況,只需要在現(xiàn)有的unsupervised情況下,添加那些有l(wèi)abel的target的約束信息。作者為了達(dá)到這個(gè)目的,引入了一個(gè)新的變量xc^tt=1,?(t,c^t)∈Lx_{\hat{c}_{t}t} = 1,\forall (t,\hat{c}_{t})\in \mathcal{L}xc^t?t?=1,?(t,c^t?)∈L,其中L\mathcal{L}L表示帶目標(biāo)域帶標(biāo)簽樣本集,c^t\hat{c}_{t}c^t?表示目標(biāo)域樣本ttt的標(biāo)簽。該項(xiàng)表示所有已有標(biāo)簽的目標(biāo)域樣本不改變其標(biāo)簽。目標(biāo)函數(shù)就變成了:
其中,dcc′=∥Sc?Sc′∥22d_{cc'}=\left \| S_{c}-S_{c'}\right \|_{2}^{2}dcc′?=∥Sc??Sc′?∥22?,它表示當(dāng)樣本ttt的臨近點(diǎn) 中有臨近點(diǎn)NtN_{t}Nt?被分配到另一類的時(shí)候,額外加上一個(gè)類間的距離差作為損失。
2.3 Mapping
我們假設(shè)有一個(gè)線性變換,可以估計(jì)出源域到目標(biāo)域的映射關(guān)系,用一個(gè)矩陣W∈RD×DW \in \mathbb{R}^{D \times D}W∈RD×D。損失函數(shù)如下:
對(duì)WWW求偏導(dǎo)可以求出使f(W)f(W)f(W)最小的WWW。
本文原載于我的簡書
References:
[1] Busto, P. P. , and J. Gall . “Open Set Domain Adaptation.” IEEE International Conference on Computer Vision IEEE, 2017.
[2] 《小王愛遷移》系列之九:開放集遷移學(xué)習(xí)(Open Set)
總結(jié)
以上是生活随笔為你收集整理的Open Set Domain Adaptation 开集领域适应的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 微步在线安全事件分析:全球数亿主机被Fi
- 下一篇: Learning Transferabl