Learning Deep Similarity Models with Focus Ranking for Fabric Image Retrieval 学习笔记
在本文中,我們提出了一種新的嵌入方法,稱為焦點排序,可以很容易地統一成一個CNN,在細粒度織物圖像檢索的背景下,共同學習圖像表示和度量。
Focus ranking的目的是通過將排列在不同樣本之下的相似樣本的總成本最小化來懲罰排序障礙,從而使相似樣本的排名高于所有不同樣本。在培訓階段,將培訓樣本組織成重點排序單元,進行有效優化。我們建立了一個大規模的織物圖像檢索數據集(FIRD),其中包含4300種織物的25000幅圖像。
傳統的圖像檢索方法主要包括兩個關鍵部分:一是設計一種魯棒性和鑒別性的圖像表示方法;二是確定給定圖像表示的有效距離或相似度度量。傳統方法中使用的圖像再現語句通常是手工制作的,例如SIFT[1]、GIST[2,3]、Bag of Words (BoW)[4]、Fisher Vector (FV)[5,6]和VLAD[7]。這些方法雖然在圖像檢索中取得了合理的成功,但在很大程度上依賴于特征工程。更嚴重的是,這兩個組件分別設計或學習,導致次優解。
一種基于卷積神經網絡(CNN)的圖像表示方法和距離或相似度度量方法[8,9],可以無縫地用于圖像檢索。具體來說,這些方法訓練了一個帶有度量學習嵌入的CNN。兩種簡單而有效的度量學習嵌入方法是對嵌入和三重嵌入。
優化了這兩種嵌入方法,將不同標簽的樣本拉開,將相同標簽的樣本推近。這些判別模型最重要的優點是可以聯合學習圖像表示和語義有意義的度量,對類內變化和類間混淆具有較強的魯棒性。
一個圖像檢索系統的目的是找出具有相同標簽的樣本與許多負面的樣本。但是,成對和三重嵌入方法對一個不超過一個負圖像作為參考的度量建模,這是對實際設置的非常粗略的近似。本文提出了一種新的嵌入方法,即焦點排序法,可以方便地統一到CNN中進行聯合優化。特別是,所提出的模型旨在將標簽相同的樣本(即匹配樣本)排在所有負樣本之上。因此,我們通過將匹配樣本的總成本降到低于任何負樣本的最低來懲罰排序混亂。在訓練階段,我們將訓練樣本組織成焦點排序單元,每個單元由探針樣本、匹配樣本和參考集組成,進行有效的優化。它學習將匹配的樣本排在參考集合中所有負樣本的頂部。
據我們所知,目前還沒有公開的織物圖像檢索數據集。建立了大規模的織物圖像檢索數據集(FIRD)。它包含4300種織物,每一種都有5到10個實例。我們將FIRD數據集分為兩部分,隨機選取一半的面料作為訓練集,另一半面料作為測試集。
?
總結
以上是生活随笔為你收集整理的Learning Deep Similarity Models with Focus Ranking for Fabric Image Retrieval 学习笔记的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 6.#闲谈|小编一手腾讯课堂送花脚本 j
- 下一篇: 云蹦迪云广场舞软件开源源码