當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

CVPR19 基于图卷积网络的多标签图像识别模型论文笔记

發(fā)布時間：2023/12/3 编程问答 42 豆豆

生活随笔收集整理的這篇文章主要介紹了 CVPR19 基于图卷积网络的多标签图像识别模型论文笔记小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

筆記

曠視研究院的研究員提出了如下模型,用于圖像的多標(biāo)簽分類.

該模型與一般模型不一樣的一點是,它的分類器是生成的,因此它有一個專門生成分類器的子網(wǎng)絡(luò).

網(wǎng)絡(luò)主要由兩部分構(gòu)成

特征表示子網(wǎng)絡(luò),該網(wǎng)絡(luò)由ResNet-101構(gòu)成,即藍(lán)色框圈出的部分.

分類器生成子網(wǎng)絡(luò),該網(wǎng)絡(luò)由3個GCN層串聯(lián)組合而成,即紅色框組成部分.

動機

基于標(biāo)簽的共現(xiàn)模式，曠視研究員設(shè)計了一個全新的標(biāo)簽相關(guān)系數(shù)矩陣，可顯式地用 GCN建模標(biāo)簽相關(guān)性，讓節(jié)點的特征在更新時也能從相關(guān)聯(lián)的節(jié)點（標(biāo)簽）吸收信息。

由于從詞嵌入向量到分類器的映射參數(shù)在所有類別中是共享的，所以習(xí)得的分類器能夠在詞嵌入空間中（語義相關(guān)的概念在詞嵌入空間中彼此臨近）保留較弱的語義結(jié)構(gòu)。與此同時，對于可以對標(biāo)簽依賴性進行隱式建模的分類器函數(shù)，所有分類器的梯度都會對它產(chǎn)生影響。

GCN層

每個標(biāo)簽可以看做是一個特征向量.
在第一層的時候,標(biāo)簽的特征向量是 $d$ 維度的,剛好是一個詞嵌入向量.
在第二層的時候,標(biāo)簽的特征向量是 $d^{'}$ 維度的,是經(jīng)過了一個轉(zhuǎn)換矩陣 $W^2$ 的映射.
在第三層的時候,標(biāo)簽的特征向量是 $D$ 維度的,也是經(jīng)過了一個轉(zhuǎn)換矩陣 $W^3$ 的映射,映射完之后,每個標(biāo)簽的特征向量維度剛好和ResNet101抽取到的特征維度相同了,因此可以作為該標(biāo)簽的分類器了.
這對應(yīng)第2個動機.

至此還未用到標(biāo)簽間的拓?fù)鋱D結(jié)構(gòu),也就沒有用到標(biāo)簽間的共現(xiàn)關(guān)系,因此他們設(shè)計了一個共現(xiàn)矩陣 $A$ ,用于引導(dǎo)信息在標(biāo)簽間的傳遞.
$\in R^{n*n}$ ,其中 $n$ 是標(biāo)簽的數(shù)量.
矩陣是一個先驗矩陣,不需要被學(xué)習(xí).
這就對應(yīng)了第1個動機

因此得到了GCN變換公式:

$Hl∈Rn?d,Wl∈Rd?d′,A∈Rn?nH^l \in R^{n*d},W^l\in R^{d*d'},A\in R^{n*n}$

$H^{l+1}=h(AH^{l}W^{l})$

$A$ 的設(shè)計

如圖所示,一個很樸素的想法,就是計算一對標(biāo)簽的條件概率作為他們的相關(guān)系數(shù).
這樣有兩個壞處

測試和訓(xùn)練過程中的條件概率可能會不一樣.

存在噪音問題導(dǎo),致長尾分布.

作如下改進: 將矩陣進行二值化,設(shè)置一個閾值 $τ∈[0,1]\tau \in [0,1]$

$Aij=[Pij≥τ]A_{ij}=[P_{ij} \ge \tau]$

二值化之后解決了上述兩個問題,然而也會引入新的問題,即過度平滑問題.

因此他們提出了二次加權(quán)的方法:

$p$ 是一個預(yù)設(shè)的超參數(shù).
當(dāng) $\rightarrow 1$ 的時候,節(jié)點自身的特征往往不會被考慮.
當(dāng) $\rightarrow 0$ 的時候,節(jié)點相鄰點的特征往往不會被考慮.

細(xì)節(jié)

當(dāng)一個標(biāo)簽包含多個單詞的時候,將所有單詞的embedding取平均.

實驗結(jié)果

可視化

通過對分類器的可視化,我們可以發(fā)現(xiàn),確實使用GCN可以學(xué)習(xí)到吧標(biāo)間之間的內(nèi)在關(guān)聯(lián)性.

總結(jié)

以上是生活随笔為你收集整理的CVPR19 基于图卷积网络的多标签图像识别模型论文笔记的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： Simple-Faster-RCNN源码
下一篇： bilibili怎么注销