视觉研究的前世今生(中)王天珍(武汉理工大学)
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?視覺研究的前世今生(三)
王天珍
?
§3?空間知覺
§3-1概述
學術界一致同意空間知覺是視覺的最高層次,也是視覺中最抽象,最難以理解的。眾所周知。物體上一點發出的光線落到視網膜上只是一個點,但我們怎么能單憑視覺知道物體的遠近,大小和位置?這個能力是先天的還是經驗所致?這些問題在17-19世紀引起了學術界極大的興趣,吸引了第一流的哲學家,物理學家,數學家,生理學家參加討論,除了理工科學生熟悉的赫姆霍茨,海林,笛卡兒外,還有洛克(Lock)馬爾布蘭希(Malbranche),毛凌諾(Molyneu),康德(Kant),伯克萊(Berkeley)等。
當時流行的空間知覺理論是笛卡兒派的數學學說。笛卡兒繼承了柏拉圖和歐幾里德的視覺觀念,把光學和視覺等同起來,在幾何光學的基礎上加上對于視網膜,視神經的解剖和電生理知識,他發展了一套空間知覺理論。
最主要的觀點可以簡單歸結如下:
1?在近處,物體的遠近由物體對于雙眼所夾的角決定,夾角越大物體越近,夾角越小物體越遠;
2?在遠處,是由可見點而來的光線落入眼睛的分光程度決定的,分光程度越大,離觀察者的距離就越近,光線分散程度越小,離觀察者的距離就越遠。
因為知覺的遠近是由幾何定律決定的,因此笛卡兒派認為人生來就具有空間知覺能力。
但是這個觀點,很多學者是不同意的。其中最著名的是洛克。他在他的名著“人類理解論”中,引用英國哲學家毛凌諾的信,提出了有名的毛凌諾問題。毛凌諾問題假設一個先天性的盲人,長大后學會了用手去區分方和圓的物體。如果此后他恢復了視力,在他第一眼看到物體時,能否憑借視力判斷哪一個物體是方的,哪一個物體是園的?洛克和毛凌諾認為他在初視之下是不能憑視力分辨出方圓的。強調識別是與經驗有關的,并不是先天所有的。
約翰·繆勒創立了神經特殊能量說,認為感覺神經分5種,不能互相替代,但不同性質的刺激作用同一感官可以引起同一感覺,如光刺激視網膜或者電流通過視網膜都能引起光的感覺。他主張視網膜同位觀念,認為視網膜在它自身的活動中能自己感覺自己,我們自己的身體也在視野中。一切方向問題只能涉及各部分視野的相互位置。視覺方向僅僅依賴視網膜感覺部位的安排。(MACH,感覺的分析?P97)
大物理學家赫姆霍茨和海林不僅在顏色理論上各執一詞,在空間知覺的看法更是水火不容。
海林主張先驗論,認為空間知覺來自天生。例如,他贊同約翰·繆勒的觀念,主張雙眼輻合運動不是練習的結果,而是由遺傳所致,應將雙眼視為統一器官,協同運動依賴于天生的解剖基礎。視覺空間是直接給予的東西。許多心理現象是由于人腦生來如此。
而赫姆霍茨則主張經驗論,他提出了有名的無意識(unconscious inference)推理說,指出有些知覺看起來是直接認識,實際上是由于反復練習和聯想才變為無意識的。例如根據所看見熟悉的物像的大小判斷物體的距離,雙眼的輻合運動,事實上依然是由經驗而來的。與平常的推理類似,只不過平時沒有自覺意識,故稱為無意識推理。
在這場長達數百年的學術之爭中,影響最大的就是1709年伯克萊寫的“視覺新論”。他在這本不過8萬字的小冊子里系統地駁斥了笛卡兒派的數學學說,認為空間知覺是人們的一種內省經驗,是人們用接近聯想把視覺與觸覺聯系起來的結果。把對空間知覺的研究從幾何光學中解脫出來,強調內省研究法,心理學就此進入了空間知覺研究的領域。
1838年,物理學家惠斯登(Wheaston)發明了實體鏡,讓人們第一次知曉了立體視覺-這一全新的深度知覺現象。實體鏡給空間知覺研究提供了可控的研究條件,空間知覺研究從此進入了實驗室研究階段。
1885年,馬赫寫了“感覺的分析”的。在他那個時代,物理學取得了巨大的成就,甚至改變了感覺心理學,但是正是此時,物理學也遇到了危機:笛卡兒1664年提出來的“以太”觀念(20世紀科學史P38)在光和電磁理論勝利后,在光速的測量中遇到了很大的麻煩。邁克爾孫-莫雷實驗的否定結果挑戰于機械的宇宙觀。馬赫就是在在物理學遇到危機的時候,反思物理學研究中可能出現的哲學問題,希望借此把“他畢生從事的各個不同科學部門(物理學,感覺生理學,心理學)理解為一種統一的事業”(愛因斯坦)。在此書中,他以大量的篇幅分析了空間知覺,把空間感覺與眼的運動和相應的神經支配過程聯系起來,進一步提出了空間時間與運動的關系,愛因斯坦(Einstein)就是受了馬赫“感覺的分析”的啟示才提出相對論的。
20世紀初。格式塔心理學提出了完形說
1951年J·吉布森出版了“視世界”(Visual Would)。認識到只在實驗室用體視鏡等儀器研究空間知覺是方向性的錯誤。
1987年澳大利亞心理學家BabraGillam發現遮擋存在時,雙眼融合后共同區旁存在一個單眼區,對體視融合起了關鍵作用。這個現象被稱為達芬奇立體視,以區分因視差產生的惠斯登立體視??臻g知覺的研究來到新的時期。
下面分幾段敘述有關的重大研究。
§3-2視覺新論
1709年24歲的伯克萊寫“視覺新論”。這本小冊子出版是響應洛克在“人類理解論”中,對知覺研究中笛卡兒的幾何學和生理學派的的先天論的哲學觀念的批判。但它比洛克說理更清楚,更深刻。有力的捍衛了全新的視覺研究觀點,清算了笛卡兒以來在這個領域里積累的偏見,為學術界獲得了積極發現所需要的自由氣氛。(“感覺的分析”P96)
該書采用了一種不常見的格式,一共8萬字的小冊子,分成了160小段,按照1934年譯者關文運的分析,可以分為7個自然部分,第一段是第一部分,是開張明義說明著述的目的是說明我們怎么知覺物體的距離,大小(幅度),和位置的。(這里,我用的2002年從Yorku?大學下載原文中magnitude?的原義“大小”,代替關老師譯文中的“體積”。體積是3 D?的,含距離。大小既可以是體積,也可以是面積(2D),和長度(1D),這樣更容易理解原文。)并進一步考慮視覺和觸覺之間的差別,和有沒有什么觀念對兩者是共同的。第二部分為2至51段,討論什么是距離。第三部為52至87段,研究物體大小,面與體。第四部分為88到120段,解釋什么是物體的位置。第五部分121-146,研究視覺和觸覺有沒有共同的對象。第六部分只有兩段147-148說明視物體是大自然(造物者)構成的一種宇宙語言,幫助人們得以生存。第7部分(149-160)觸覺的對象是實體,視覺的對象是顏色,在心中。
該書首先討論什么是距離。伯克萊說眾所周知,光是直線傳播的,物體不論遠近,從物體上一個點發出的的光落到網膜上都是一個點,為什么我們能用眼知覺距離呢?笛卡兒學派認為,距離主要是由兩個方面決定的。首先是由物體對雙眼張開的角度決定的,角度越大,物體離得越近。其次是由物體發出的光的分光程度,越分散,離得越近。伯克萊用內省法批駁說隨便找個人試試,除了笛卡兒派的幾何光學家,誰看見物體發出來的角度了?在英文原文的第4段有一句括號里的話(thefancy that we see only one eye at once being exploded?)我認為考慮到伯克萊寫書之時,學術界關于雙眼單視從蓋倫以來有一種觀點,說實際上雖然人類具有雙眼,但只用一只眼時視精神更集中。而到了17世紀,法國的波爾塔更提出,雖然有雙眼,每時刻實際上只有一只眼在工作。因此這段注解可以有解釋為批評波爾塔等的單眼論。說,看看泡泡破了吧,大家都認為是雙眼同時工作的。
對分光說決定遠近,伯克萊引用了主流學派自己的反例,說幾何學派的Barrow博士用反射,折射鏡組合的實驗得到的結果自己否定了自己。
伯克萊除了同意在遠距離用視覺估計距離時,可以以物體到觀察者間遮擋視線的其他物體多少來幫助估計遠近外。提出了自己的兩條原則;第一,人們是以注視物體時雙眼的轉動來知曉遠近的;第二,人們是以視物時眼睛肌肉是否緊張來決定遠近的。這兩條為什么能知覺距離,是因為它們是與相應的觸覺同時出現的,根據觸覺,人們能知曉距離,由于眼動,眼肌緊張總是伴隨相應的觸覺,所以根據同時聯想法則,人們用視覺也能根據這兩條知覺遠近??傊?#xff0c;伯克萊在這兒強調的是,距離不是用眼知覺到的,而是由于經驗的作用,需要學習,空間知覺是心理現象,不能等同于網膜的幾何特征。在后面幾段,伯克萊將他的推理引申到對大小,位置的研究上,以毛凌諾的先天盲人問題為例,反復論證是經驗而不是幾何推理使人們能知覺大小位置。該書在對月亮大小,上下顛倒的問題的論證也很巧妙。
雖然當時的科學水平,還不能直接證實他們(伯克萊,洛克,毛凌諾)的關于突然得到視力的盲人,是無法將他由觸覺得到關于遠近形狀的能力轉化為視覺能力的推斷。但這百年以來科學的進步已經提供了這樣的條件,白內障摘除,角膜移植使很多先天盲人得到了了光明,但是研究發現如果他們是在關鍵期后得到的視力,終其一身,雖然有進步,但是還是不能使用視力正常生活。
2002年發現雜志就報道了這樣一個例子,標題是“Sight Unseen”。報道美國加州一個有名的盲人企業家,運動員Mike May的故事。May3歲時由于礦燈爆炸失去左眼,右眼也因角膜混濁失去視力,但作為盲人這并沒有影響他的發展,他甚至創造了盲人山地滑雪的世界紀錄。在2000年May由于角膜移植重見光明,手術后第一個月他的行為完全證實了毛凌諾等的推測。此后,雖然他的視力漸漸改善,但是他始終沒有學會用視覺去行動,出門依然帶著他的導盲犬和手丈,成為一個有視覺的盲人。圣地亞哥的加州大學實驗室的研究人員得出結論,手術后,物體發出的光信號到達了May的腦中,但是因為沒有兒時的經驗,沒有很好的被解釋。完全證實了300年前伯克萊的推斷。
人們能用視覺知覺距離,大小,位置是視覺的內省經驗而不是幾何推理,這個觀點是洛克和和毛凌諾先提出來的,但是伯克萊“視覺新論”里將其歸結于于同時聯想的作用,強調視覺是心理活動與幾何計算無關是他的的新意所在。從此后心理學代替幾何光學成為了視覺研究的主力。
在這兒要提到的是過去批評伯克萊總是以他否定視覺的對象不在心外,以此說明他是唯心主義,否定實物存在。我認為從今天生物信息論的角度來看,伯克萊說的有一定道理。300年前的心意味著腦(或者今天的神經系統),伯克萊說視覺的對象就只是光與色,這句話沒有錯,今天的解剖學證實視網膜能接受的就只是光與色,這是人們視神經系統的輸入變量,只有經過神經系統的加工,在視覺系統的輸出處,才是已經被識別了的物體和景物。在當時的科學發展水平稱這為“心”是可以理解的。但是視覺系統到底是怎怎么加工光與色,使它們成為可以識別的事物,至今人類也沒有解決這個問題。2011年,國際知名雜志“視覺研究”(Vision Research)在慶祝它創刊50周年的兩篇回憶文章中(L.Ungerleider,A.Bell;G.Westhemer)承認這個問題的解決依然在路上。
?
§3-3實體鏡的發明-空間知覺的實驗室研究
惠斯登是個大物理學家,他發明的電橋使他幾乎家喻戶曉,但是他最大的貢獻是他1838年發明了實體鏡,使得被人們忽視了幾千年的立體視覺現象被發現。
他是在設計電聲儀器時,偶然發現在兩塊金屬平板里反射出來的略有差別的蠟燭火焰圖像,如果分別被兩眼同時看見,融合后就有就會有實體感。他很有興趣這個新現象,反復琢磨,最后發明了實體鏡。1838年他公布了自己的發明,并稱之為視覺理論的新事實。指出雙眼中兩個稍稍不同的圖像的結合產生實體感。(Wade perception1987,P785)他指出這是一種以前沒有觀察到的現象,他稱之為立體視覺。
實體鏡和立體視覺現象很快吸引了年青學生的注意,也風靡了市民社會,從1838年來幾乎沒有任何其他視現象像它一樣被如此多的實驗研究,并作為理論前沿。兩個圖片(2D)引起實體感覺(3D),3D空間知覺能用2D圖像而不是3D?實體來檢驗,視差能由圖像線索控制,使得空間知覺能從它的客觀基地上解脫,使得空間知覺的研究從自然觀察進入到實驗室研究,開創了空間研究的新時代。
其實,雙眼儀器早就被發明,視差的概念也早就被提出(早在1679?法國的LeClere就用網膜視差攻擊笛卡兒的雙眼單視理論),立體視覺現象被成千上萬的人看到過,但是為什么直到惠斯登才發現立體視覺呢?惠斯登對自己的發現是這樣評價的,他說這事很奇怪,類似這樣的現象已經被看見成千次,但從來沒有足夠的注意力讓它成為哲學觀察的主體?直到偶然被他注意到。(P811)1987年J.Wade?同意1942年波林(Boring)對立體視覺發現的評價,他說,惠斯登能發現立體視覺,不是因為他站在巨人的肩上,看得更清楚,而是因為他不熟悉他們的工作。換句話說是偏見比無知離真理更遠,是舊的依據視覺方向解釋雙眼單視的理論從思想上阻礙了立體視覺的發現。
§3-4?馬赫的“感覺的分析”
19世紀是物理學大豐收的時期,也是物理學困惑的時期。光學,熱力學,電磁學都取得了引人注目的成就,麥克斯韋方程預言了電磁波的存在,并很快得到了驗證,電磁波的出現,光電統一,為無線電通信,以至100多年后的互聯網開辟了道路。但是也出現了了意想不到的煩惱和危機,高精度的邁克耳孫(A Mickelson)莫雷(JMorley)干涉儀(測量光速)實驗的否定結果,否定了由笛卡兒提出的以太的存在,挑戰從牛頓以來建立的機械的世界觀。
在牛頓那兒,物質在與物質無關的絕對的時間和絕對的空間中有序運動,但現在這種理論受到挑戰,問題出在哪兒?當時作為實驗物理學家馬赫(Mach?奧地利,1838-1916)由于工作性質,不僅研究光學和聲學也研究聽覺,視覺和運動感覺。他研究氣體動力學,發現了聲速和流速之比的馬赫數,馬赫角,和馬赫效應。他研究圓盤高速旋轉時的視亮度分布,發現了主觀感覺在亮的一端呈現一個特別的亮帶,在暗的一端呈現一個特別暗的帶,后來這被命名為馬赫帶,是神經系統相互作用產生的。他研究動覺,通過轉椅實驗發現人和動物感覺到的是加速,減速而不是“絕對運動”。他把流體力學知識用來解釋這種現象,指出運動感覺來源于內耳半規管內流體的慣性。具有這樣交叉學科的研究經歷,在這樣的大環境之下,馬赫自然就想到伯克萊對笛卡兒等同幾何光學與空間知覺的批評。認為物理學的危機是不是牛頓力學把來自經驗的東西和任意約定的東西混在一起引起的。經過了長達20多年的醞釀,馬赫在1886年出版了“感覺的分析”。一書。(馬赫研究P61)馬赫的愿望是希望獲得一種觀點把他畢生從事的各個不同科學部門統一起來,為解決自然科學認識問題尋找一種哲學立場。
試圖對牛頓的脫離任何物質的絕對空間和絕對時間的先驗理論進行研究。把感覺看成物理經驗和心理經驗的共同要素。用感覺的復合來統一物理,生理和心理科學。他和伯克萊不同,時代對伯克萊提出的要求是在空間知覺研究中清除先驗論的幾何光學的影響,用心理學的接近聯想法,用視觸結合的方法去認識距離,大小,位置。而在馬赫的時代需要對空間,時間本身定位,馬赫根據當時心理學的研究認為空間,時間和顏色,聲音一樣也是感覺。他希望把客體,身體,意志記憶,用感覺統一起來,他說實在的世界和被感知的世界并沒有真正的鴻溝,不同的只是考察方式。他指責盲目的借用其它學科的觀點,方法會造成科學研究的混亂。他認為視覺,聽覺是和空間感覺互相結合。
在這本19世紀最偉大的哲學著作中他用了5章去討論空間感覺,一章討論時間感覺,還有一章討論聲音感覺,因為本文是介紹視覺研究,我只能去把盡可能把馬赫對空間感覺的研究介紹清楚。
馬赫對什么是空間感覺的介紹很有特色,他舉了有色字母的例子,說兩個字母同形不同色,我們能一眼看出色的不同,但形式相同,這種相同的感覺成分就是空間感覺。這不是幾何問題而是與眼動有關的。眼動相同的度量和方向引起相同的空間感覺。
馬赫回顧了19世紀空間知覺研究的進展:1)清除了笛卡兒先驗論的偏見;2)繆勒創立了神經特殊能說,主張視網膜同位說,認為視覺空間是先天的;3)惠斯登發明了實體鏡;4)海林將雙眼視為統一的器官,它們的協合運動依賴于天生的解剖基礎,與高度感覺,寬度感覺,深度感覺相對應的是一個3D神經支配過程,這個過程按具體情況引起眼睛的左右轉向,升降和收斂。他把繆勒的視網膜同位說總結提高,把空間視覺歸結為一條簡單的原理,同一視網膜部位具有同一高度與廣度量值,對稱視網膜部位則具有同一深度量值,因此,更嚴密的論證出空間直觀是天生的。馬赫對此有更深層的考慮,提出是否能用赫姆霍茨的方式從科學進化史的角度解釋空間視覺。他用思想實驗考察了這個問題,得出結論,認為促進視動的意志或神經活動就是空間感覺本身(感覺分析P101)。建立在運動感覺上的空間看來實際上是原始的東西。馬赫在該書第7章14節應用耳迷路(耳蝸,半規管,耳石器的生理學研究結果支持自己的論點。他從生物目的論的出發用視網膜為例,說明空間知覺起源于生物的需要(P144),在某種意義上繼承了伯克萊在視覺新論第6部分的觀點,我們的空間視覺能力是造物主(author of nature)安排,是為了幫助人們趨利避害的得以幸福生存。
馬赫在感覺的分析中用懷疑的經驗論對牛頓脫離任何物質的絕對空間和絕對時間的先驗論的批判,對理論物理做了巨大的貢獻。深深影響了愛因斯坦,使得他能擺脫舊的機械的時空論影響,創建了相對論,統一了力學和電磁學。愛因斯坦自己認為是馬赫給了他很大的啟示。
§3-5?吉布森(J·Jibson)的視世界
吉布森是美國二戰后最著名的心理學家之一,他有著與其他學者不同的一段經歷,1941-1946,他在美國空軍服役,擔任航空心理專案計劃執行人。當時飛機降落主要依靠駕駛員目測,他的研究發現飛機降落成功與否,主要取決與駕駛員的視知覺能力,于是提出以運動知覺作為甄選飛行員的必要條件。
二戰開始后美國空軍發現迫切需要了解當一個飛行物(航空器,飛鳥)登陸到飛機時如何從地面估計距離,空軍專門立項研究與飛行有關的深度和距離知覺。他們在實驗室研究各種單眼雙眼線索,典型的儀器是,實體鏡,深度知覺儀,或者能進光線的暗箱。心理學家在室內,在均勻的背景下,作了各式各樣的實驗,但沒有一個能夠準確預估在這個任務中,一個飛行器是成功或者失敗。到了二戰快結束了,學者才意識到,實驗應該在自然環境在戶外進行。
由于他的特殊身份,吉布森是少數幾個在戰爭結束前,與飛行員一起用戶外環境,照片,以及運動圖片進行空間知覺研究的實驗者。因為在飛行員的眼里,空間是由地面和地平線決定的,而不是被他飛行的空氣中的物體和物體陣決定的,(P6-7)所以吉布森有了和其他研究者很不同的空間觀念。在全面研究了空間知覺研究史,在討論了先天論和經驗論曠日持久的論戰后,在格式塔心理學的啟示下,吉布森依據他在二戰中的實驗結果,提出了一個被稱為地面理論的假說,這個理論的基本概念是視空間不是知覺作為物體和物體陣,而是作為一個連續的表面或者相鄰表面陣。
他提出環境光和生態光學理論,提出了光流的概念,他提出從二維平面的光流場可以恢復3D空間運動參數和結構參數的假說。他把這一切寫進他的專著“視世界”(Visual World,1950)中。這本專著引起了學術界極大的重視,他提出的人是如何在不斷變化的感覺基礎上獲得恒定知覺的問題,成了指導后來關于空間知覺研究的鑰匙。
他的光流說,得到了計算機視覺的主流理論-3D重建理論的創始者Marr的重視,被寫進了各式各樣的計算機視覺教材,作為簡單實用的圖像運動的數字表示法,影響至今。
現在計算機視覺在沒有找到通用理論的情況下,用光流計算也算是一種可行的做法。但是也有人提出了質疑。2000年,國際知名雜志“perception”上,JE Cutting?發表一篇論文“Images,imagination, and movement: Picturial representations and their development inthe work of James Gibson”,談到有名的鳥飛光流圖的可信性。有興趣的可自己找來讀。
§3-6達芬奇(?Da Vinci)立體視,遮擋問題研究(一)
在立體鏡發現之前,學術界公認的深度知覺線索是雙眼轉動,眼肌緊張,另外視物的模糊,視物的大小,和遮擋(中間物體)也是很重要的線索。各種距離線索,比如眼動,眼肌緊張,視物模糊,因為與眼科學和神經生理學有關都被長期研究過,但很少有人想過遮擋為什么能引起空間知覺。
立體視覺的發現不但為空間知覺研究提供了實驗手段,且因為立體知覺不需要經驗,從而支持了數學學說的先天論者。60年代末,Julesz設計了隨機點立體圖對(RDS),說明只要視差不需要形狀信息就能決定深度,更加支持了先天論的計算學派。80年代初,MIT人工智能實驗室的Mar依此提出了按視差計算物體深度的3D重建理論,成了計算機視覺的主流理論,風靡一時。在這個理論中,為了達到物體和景物3D重建的目的,需要解決雙眼圖象對應點匹配的問題,因此學術界的焦點都放在了解對應性問題上,Marr雖然注意到遮擋存在時,雙眼有不對稱區存在,但他把不對稱區作為噪聲拋棄,遮擋對深度知覺的作用再一次被邊沿化。
雖然Marr在80年代幾乎被神化,不但在計算機視覺,也在心理,生理學界有了很大的影響,但仍然有一些學者發現遮擋引起的雙眼不對稱區對產生深度感是有作用的,不能被忽視。其中有澳大利亞南方新沃爾斯大學的Babara Gillam,哈佛大學視覺研究所的KenNakayama,加州大學伯克萊校區的G Westheimer加拿大約克大學的HiroshiOno?等。
1987年,B Gillam通過RDS實驗,發現(1)單眼區是加速而不是延遲立體感的產生,(2)立體感起源于視差不連續處,不匹配僅僅在不連續區發現并且定位它們。Gillam還通過視覺史的研究發現早在文藝復興時代大畫家達芬奇(Da Vinci)就注意到這一點,達芬奇說兩眼一起能看到小的前景物體背后整個背景,就像前面小的遮擋物是透明的一樣。
Gillam指出,當前景物足夠寬的時候,背景被完全擋住,但是在雙眼觀察時前景物的兩邊各有一條單眼區,只能被一只眼看見。就是在Julesz設計的隨機點立體圖對(RDS)中,為了產生視差,中心方移動的結果每個眼的圖像中空出了一塊,Julesz用隨機點填補了這些區域。這樣的區域在另一眼的圖像中沒有對應的區域是單眼區。Crimson,Mayhew及Frisby?等在80年代初就發現他們的算法在表面深度不連續初遇到極大的麻煩。
Gillam于是提出了新的假說,她認為深度的不連續是因為雙眼圖像的不匹配區,這些區域被視系統用來決定深度不連續,附加的單眼細節有助于雙眼過程。她用心理物理實驗來驗證自己的新設想,實驗結果證實了她的想法,前面流行的基于視差計算的3D重建模型開始遇到了有力的挑戰。
Ken Nakayama等接著對這種現象進行了系統的實驗和理論研究,1990年他的“DA VINCI STEREOPSIS:DEPTH AND SUBJECTIVE OCCLUDING CONTOURS FROM UNPAIREDIMAGE POINTS”一文在“Vision Research”發表,他用對系統的實驗結果分析指出,這種雙眼圖像在遮擋物后的不對稱可以分成兩種,一種是現實生活中可以發生的,因為遮擋物在正中,或者由于孔徑(縫隙)對周邊的遮擋引起的。他稱為生態可行遮擋限制,另一種是現實生活中不可能出現的雙眼圖像不對稱,被分為生態不可行限制,指出視系統正是用在真實世界中無處不在的遮擋關系從不對稱點恢復深度、輪廓和表面,這種由于遮擋引起的立體視因為最早被達芬奇發現故稱為達芬奇立體視。
1990年Nakayama等在Perception(知覺雜志)發表題為“Transparancy:relation to?depth,subjective contours,luminance,and neon colour spreading“一文。受Marr的啟示提出了一個視表面表象中間層知覺理論希望通過這個理論來統一解釋兩種立體視。
1994?年BartonAnderson?與Nakayama在“PsychologicalReview”上發表“Toward a General Theory of Stereopsis:Binocular Matching Occluding Contours and Fusion?”提出融合,立體視,遮擋是一致的,并提出一個簡單的理論框架。
18年后,2009年知覺雜志就Nakayama1990年論文“Transparancy:relation to depth,subjective contours,luminance,and neoncolour spreading“中提出的視表面表象中間層知覺理論這個問題重新組織了一個討論專題,Nakayama?在討論中回顧了90年代初的各種視覺理論從Barlow到Marr?,和自己提出這個理論的學術背景,并指出在1992年受Gibson光流的啟示,改進了自己的模型,并指出一切工作仍然在在幼年期。討論中Anderson?指出了自己與這個理論的分歧。
26年后,Gillam,Barton Anderson,J Wade?,HiroshiOno等仍在遮擋問題上做研究工作,堅持至今。
Ken Nakayama?曾經領跑此項研究,依照Marr與Gibson提出過表面表象,但近年來他已經主要在研究面孔知覺了。
本文轉自:http://blog.sciencenet.cn/blog-1239700-853316.html
總結
以上是生活随笔為你收集整理的视觉研究的前世今生(中)王天珍(武汉理工大学)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 流放之路人物智力属性分析 增加智力方法及
- 下一篇: 看了数百个PPT封面,我只想告诉你这两个