人工智能 图片识别 图像识别
圖像識別,是指利用計算機(jī)對圖像進(jìn)行處理、分析和理解,以識別各種不同模式的目標(biāo)和對像的技術(shù)。一般工業(yè)使用中,采用工業(yè)相機(jī)拍攝圖片,然后再利用軟件根據(jù)圖片灰階差做進(jìn)一步識別處理。另外在地理學(xué)中指將遙感圖像進(jìn)行分類的技術(shù)。
圖像識別是人工智能的一個重要領(lǐng)域。為了編制模擬人類圖像識別活動的計算機(jī)程序,人們提出了不同的圖像識別模型。例如模板匹配模型。這種模型認(rèn)為,識別某個圖像,必須在過去的經(jīng)驗中有這個圖像的記憶模式,又叫模板。當(dāng)前的刺激如果能與大腦中的模板相匹配,這個圖像也就被識別了。例如有一個字母A,如果在腦中有個A模板,字母A的大小、方位、形狀都與這個A模板完全一致,字母A就被識別了。這個模型簡單明了,也容易得到實際應(yīng)用。但這種模型強(qiáng)調(diào)圖像必須與腦中的模板完全符合才能加以識別,而事實上人不僅能識別與腦中的模板完全一致的圖像,也能識別與模板不完全一致的圖像。例如,人們不僅能識別某一個具體的字母A,也能識別印刷體的、手寫體的、方向不正、大小不同的各種字母A。同時,人能識別的圖像是大量的,如果所識別的每一個圖像在腦中都有一個相應(yīng)的模板,也是不可能的。
為了解決模板匹配模型存在的問題,格式塔心理學(xué)家又提出了一個原型匹配模型。這種模型認(rèn)為,在長時記憶中存儲的并不是所要識別的無數(shù)個模板,而是圖像的某些“相似性”。從圖像中抽象出來的“相似性”就可作為原型,拿它來檢驗所要識別的圖像。如果能找到一個相似的原型,這個圖像也就被識別了。這種模型從神經(jīng)上和記憶探尋的過程上來看,都比模板匹配模型更適宜,而且還能說明對一些不規(guī)則的,但某些方面與原型相似的圖像的識別。但是,這種模型沒有說明人是怎樣對相似的刺激進(jìn)行辨別和加工的,它也難以在計算機(jī)程序中得到實現(xiàn)。因此又有人提出了一個更復(fù)雜的模型,即“泛魔”識別模型。
圖像識別的發(fā)展經(jīng)歷了三個階段:文字識別、數(shù)字圖像處理與識別、物體識別。文字識別的研究是從 1950年開始的,一般是識別字母、數(shù)字和符號,從印刷文字識別到手寫文字識別, 應(yīng)用非常廣泛。
數(shù)字圖像處理和識別的研究開始于1965年。數(shù)字圖像與模擬圖像相比具有存儲,傳輸方便可壓縮、傳輸過程中不易失真、處理方便等巨大優(yōu)勢,這些都為圖像識別技術(shù)的發(fā)展提供了強(qiáng)大的動力。物體的識別主要指的是對三維世界的客體及環(huán)境的感知和認(rèn)識,屬于高級的計算機(jī)視覺范疇。它是以數(shù)字圖像處理與識別為基礎(chǔ)的結(jié)合人工智能、系統(tǒng)學(xué)等學(xué)科的研究方向,其研究成果被廣泛應(yīng)用在各種工業(yè)及探測機(jī)器人上。現(xiàn)代圖像識別技術(shù)的一個不足就是自適應(yīng)性能差,一旦目標(biāo)圖像被較強(qiáng)的噪聲污染或是目標(biāo)圖像有較大殘缺往往就得不出理想的結(jié)果。
圖像識別問題的數(shù)學(xué)本質(zhì)屬于模式空間到類別空間的映射問題。目前,在圖像識別的發(fā)展中,主要有三種識別方法:統(tǒng)計模式識別、結(jié)構(gòu)模式識別、模糊模式識別。圖像分割是圖像處理中的一項關(guān)鍵技術(shù),自20世紀(jì)70年代,其研究已經(jīng)有幾十年的歷史,一直都受到人們的高度重視,至今借助于各種理論提出了數(shù)以千計的分割算法,而且這方面的研究仍然在積極地進(jìn)行著。
現(xiàn)有的圖像分割的方法有許多種,有閾值分割方法,邊緣檢測方法,區(qū)域提取方法,結(jié)合特定理論工具的分割方法等。從圖像的類型來分有:灰度圖像分割、彩色圖像分割和紋理圖像分割等。早在1965年就有人提出了檢測邊緣算子,使得邊緣檢測產(chǎn)生了不少經(jīng)典算法。但在近二十年間,隨著基于直方圖和小波變換的圖像分割方法的研究計算技術(shù)、VLSI技術(shù)的迅速發(fā)展,有關(guān)圖像處理方面的研究取得了很大的進(jìn)展。圖像分割方法結(jié)合了一些特定理論、 方法和工具,如基于數(shù)學(xué)形態(tài)學(xué)的圖像分割、基于小波變換的分割、基于遺傳算法的分割等。
相關(guān)公司
圖像識別創(chuàng)業(yè)公司小花兒人工智能
小花兒人工智能曾于2010年得到關(guān)注,當(dāng)時該公司獲得了100萬美元投資并開發(fā)了一款A(yù)PI(應(yīng)用程序接口),幫助網(wǎng)絡(luò)零售商和應(yīng)用開發(fā)者提供視覺搜索引擎。該公司隨后還出席了2010年的DEMO大會,并被業(yè)內(nèi)人士認(rèn)為是最值得關(guān)注的創(chuàng)業(yè)公司之一。
圖片識別
總結(jié)
以上是生活随笔為你收集整理的人工智能 图片识别 图像识别的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 图像识别并用机械手进行抓取
- 下一篇: Python使用pytesseract进