2018年5月5日论文阅读
國外精讀!title(27):We don’t need no bounding-boxes:?Training object class detectors using only human verification(我們不需要任何邊界框:只使用人工驗證來訓(xùn)練對象類別檢測器)---20170424
這篇文章主要設(shè)計了一個框架,輸入是圖片和image-level的類標(biāo)簽。目標(biāo)就是:1、訓(xùn)練detector,能夠自動predict出比較好的bounding box;2、減小人工標(biāo)注bounding box的工作量。
文章的內(nèi)容和目標(biāo)檢測有關(guān)。目標(biāo)檢測兩個基本的模式包括:1)全監(jiān)督:即需要提供所有物體的bounding box 2) 弱監(jiān)督:只提供圖片級別的標(biāo)簽,無bounding box 3) 半監(jiān)督:介于兩者之間。與這些模式不同,本文提出了一種全新的訓(xùn)練detector的方式:
如上圖所示,文章首先生成很多proposal出發(fā),然后從一個傳統(tǒng)的弱監(jiān)督檢測算法出發(fā),訓(xùn)練出一個detector,每次將分?jǐn)?shù)最高的輸出交給標(biāo)注者做驗證,然后根據(jù)反饋 1) 重新訓(xùn)練detector 2) 去除掉明顯不可能的proposal。作者在文章中提出了兩種驗證的方式:
標(biāo)注者只回答Yes/No,即框是不是框住了一個特定的物體。
如果回答是No,標(biāo)注者要提供更詳細(xì)的信息:Part, Container, Mixed, Missed,分別對應(yīng)以下四種情況:
如果采用后者的標(biāo)注方式,則可以根據(jù)這些信息進(jìn)一步篩選proposal,這里文章作者引入了本文最大的一個限制條件來達(dá)到這個目的:限制每張圖每類物體只能有一個bounding box。如果加上這個條件,例如對于Part的標(biāo)注,那么我們可以消除掉所有和這個bounding box不相交的框,從而快速縮小搜索的范圍。
下面是一個兩種標(biāo)注方法比較的例子,可以看到額外的信息確實大幅提高了找到正確框的速度:
在最后的實驗中,和全監(jiān)督的方法比較,本文的方法以犧牲6%(51%->45%)的代價將標(biāo)注時間縮短了6到9倍。不過由于是在VOC這樣相對較小的數(shù)據(jù)集上進(jìn)行的實驗,我相信如果將數(shù)據(jù)規(guī)模加大,這個性能差距會更進(jìn)一步減小。
綜上所述,本文提供了一個全新的目標(biāo)檢測訓(xùn)練方式,將人工驗證帶入到整個訓(xùn)練流程中,通過active learning的辦法,力求在人工標(biāo)注的速度和準(zhǔn)確性上取得了一個平衡。除了前面提到的本文的限制,文章使用的active learning的算法也比較初級,這些都制約了算法的最終性能。然而如果從這個文章拓展出去,我們可以發(fā)現(xiàn)有很多有意思的問題有待解決,例如:
對于類別數(shù)目很多的分類問題,我們怎么更為有效地轉(zhuǎn)化為適合人類分類的二元分類問題加快數(shù)據(jù)標(biāo)注?我們?nèi)绾卧O(shè)計這樣二元問題可以使每次標(biāo)注得到的信息量最大?
對于目標(biāo)檢測問題,除了這種判斷Yes/No的方式,是否有更多快速但是可以提供更多信息的標(biāo)注方式?例如是否可以通過某種快速的點(diǎn)擊提供更多的位置信息從而轉(zhuǎn)化問題為一種全新的弱監(jiān)督學(xué)習(xí)的問題?
在視頻數(shù)據(jù)上,如何更有效地利用時序信息進(jìn)行標(biāo)注和訓(xùn)練?
很希望這些問題在不久的未來都會有圓滿的解決,這些問題在這個數(shù)據(jù)為上的時代不管從理論還是實踐上都有很大的意義 :)
?
轉(zhuǎn)載于:https://www.cnblogs.com/ariel-dreamland/p/8993683.html
總結(jié)
以上是生活随笔為你收集整理的2018年5月5日论文阅读的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 做梦梦到指甲断了是什么意思
- 下一篇: 孕妇梦到前夫和孩子怎么回事