Cross-Scale Cost Aggregation for Stereo Matching
摘要:
人類處理立體通信跨越多個尺度。然而,這種生物靈感就是忽略了最先進的成本匯總方法密集的立體聲通信。在本文中,一個通用的提出跨規模成本匯總框架允許成本匯總中的多尺度互動。我們首先從統一優化中重新構建成本匯總透視和顯示不同的成本匯總方法在相似性內核的選擇上基本不同。然后,引入一個跨規模的正則化器進行優化并解決這個新的優化問題導致了提出框架。由于正則化術語是獨立的的相似內核,各種成本聚合方法可以納入擬議的總體框架。我們表明跨規模框架很重要因為它有效和高效地擴展了最先進的成本聚合方法并導致顯著改善,在Middlebury,KITTI和新筑城進行評估數據集。
1.介紹:
? ? 兩個圖像之間密集的對應關系是關鍵計算機視覺中的問題[12]。添加約束這兩個圖像是相同場景的立體聲對密集的通信問題退化為立體聲匹配問題[23]。一種立體匹配算法需要四個步驟:成本計算,成本聚合,視差計算和視差改進[23]。在成本計算中,3D成本量(也稱為作為視差空間圖像[23])通過計算生成在所有可能的水平視差,每個像素的匹配成本。在成本匯總中,成本被匯總,執行分布不均勻,超過支持區域每個像素。然后,計算每個像素的視差局部或全局優化方法,并通過變量進行細化成本匯總不同尺度的成本計算在后兩步分別通過各種后處理方法完善。在這些步驟中,成本匯總的質量對立體聲算法的成功有重要的影響。它是最先進的局部算法的關鍵因素[36,21,33,16]和一些主要的建筑模型全局算法[34,31]。 所以在這個文章,我們主要集中在成本匯總上。
大多數成本聚合方法可以看作是聯合的過濾成本量[21]。其實呢,甚至很簡單線性圖像濾波器如框或高斯濾波器可以
用于成本聚合,但作為各向同性擴散濾波器,它們傾向于模糊深度邊界[23]。因此,一個數字的邊緣保留過濾器,如雙邊過濾器[28]和
1引導圖像濾波器[7]被引入成本聚合。Yoon和Kweon [36]采用雙邊過濾器成本聚合,產生了吸引人的差異圖在Middlebury數據集[23]。但是,他們的方法是計算上昂貴,因為大的核大小(例如,35×35)通常用于高視差精度。解決雙邊的計算限制
過濾器,Rhemann等人[21]介紹了導向圖像過濾成為成本聚合,其計算復雜度獨立于內核大小。最近,楊[33]
提出了一種非本地成本匯總方法內核大小到整個圖像。通過計算在圖像圖上的最小生成樹(MST),可以非常快地執行非本地成本聚合。
Mei等[16]遵循非本地成本匯總思想并表明通過強制使用差距一致性分段樹代替MST,更好的差距圖可以比[33]。
所有這些最先進的成本匯總方法為立體視覺做出了巨大貢獻。 一個共同的財產這些方法的成本是在
最佳尺寸的輸入立體圖像。 然而,人類一般處理立體對應關系多尺度[17,15,14]。 根據[14]的信息
在粗略和細小的尺度上進行交互式處理人體立體視覺系統的對應搜索。因此,從這個生物靈感來看,成本是合理的
應該跨越多個尺度而不是最佳規模,如傳統方法(圖1)。
在本文中,一般的跨規模成本匯總框架被提出。第一,靈感來自于制定的圖像濾波器[18],我們展示了各種成本
聚合方法可以均勻配制為加權最小二乘(WLS)優化問題。然后,從這里統一優化的觀點,通過加廣義
Tikhonov正則化器進入WLS優化目標,我們強化了成本之間的一致性相鄰尺度,即尺度間的一致性。新的優化
規模正規化的目標是凸起的并且可以容易地和分析地解決。作為intrascale成本額的一致性仍然維持常規的成本聚合
方法,其中很多都可以被納入我們的框架以產生更強大的成本體積和更好的差距圖。圖1顯示
擬議框架的效果。切片的成本卷包括四種代表性的成本匯總方法非局部方法[33](NL),分段樹
方法[16](ST),雙邊濾波法[36](BF)和引導過濾法[21](GF)可視化。我們用紅點表示本地獲勝者所產生的差異
(WTA)優化在每個成本和綠色點表示地面真相差距。可以發現更加強大的成本和更準確的差距通過采用跨規模的
成本匯總。廣泛實驗在Middlebury [23],KITTI [4]和New筑波[20]數據集也揭示了更好的差距圖可以使用
交叉規模的成本聚合獲得。綜上所述,本文的貢獻有三個方面:
?統一的WLS制定各種成本匯總方法從優化的角度。
?一種新穎有效的跨規模成本匯總框架。
?代表性成本匯總的定量評估三種數據集的方法。
本文的其余部分安排如下。 在第2節,我們總結相關工作。 WLS配方第3節給出了成本匯總
第4節描述了規模間正規化。然后我們詳細介紹我們的框架在第5節的實現。最后提出實驗結果和分析
第6節和結論性說明在第7節中作了說明。
2.相關工作
? ?最近的研究[9,29]給出了充分的比較分析各種成本匯總方法。 我們參考讀者可以通過這些研究來了解不
同的成本聚合方法,我們將重點關注立體匹配涉及多尺度信息的方法,非常與我們的想法相關,但有很大的差異
??早期的立體視覺研究人員采用粗略 -?精細(CTF)立體匹配策略[15]。差距首先分配了粗略的分辨率,并且分辨率越差被用來減少搜索空間的計算更精細差距。這種CTF(分級)策略已經廣泛應用用于全局立體聲方法,如動態編程
[30],半全局匹配[25]和信念傳播[3,34]為了加速融合避免意外的局部最小值。不僅全局的方法
而且本地方法采用CTF策略。不像全球立體聲方法,采用的主要目的本地立體聲方法的CTF策略是減??少
搜索空間[35,11,10]或利用多尺度相關圖像表示[26,27]。在那里時是本地CTF方法的一個例外。閔和索恩
[19]通過各向異性擴散模擬了成本匯總并有效地解決了所提出的變分模型多尺度方法他們的模式的動機是
降低與我們非常相似的成本,但是我們的方法執行成本量的規模間一致性通過正規化。
總的來說,大多數CTF方法都有類似的財產。他們明確或隱含地模擬差異演變在尺度空間[27]中的過程,即差異一致性跨越多個尺度 與以前的CTF方法不同,我們的方法模擬了規模空間中成本量的演變,即成本體積的一致性
秤。 從優化角度看,CTF方法縮小解決方案空間,而我們的方法沒有改變解決方案空間,但增加了規模間的正則化
進入優化目標。 因此,結合多尺度在正規化之前是我們的方法的獨創性。另外值得一提的是本地CTF
方法的效果不如最先進的成本匯總方法[10,11],而我們的方法可以表明,大大提高了成本匯總方法[21,33,16]。
總結
以上是生活随笔為你收集整理的Cross-Scale Cost Aggregation for Stereo Matching的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 分布式系统一致性测试框架Jepsen在女
- 下一篇: 一款跑在云上的定制容器专属 OS 来了—