常用的圖像處理算法:數(shù)字圖像處理基礎(chǔ)、遙感數(shù)字圖像處理、機(jī)器視覺、計(jì)算機(jī)視覺
圖像處理程序:C++ OpenCV、Matlab與圖像處理
數(shù)字圖像處理-概述
其實(shí),造成“不可能圖形”(三角形的三個(gè)角都是90°)的并不是圖形本身,而是你對圖形的三維知覺系統(tǒng),這一系列在你知覺圖形的立體心理模型時(shí)強(qiáng)制作用。在把二維平面圖形知覺為你三維立體心理圖形時(shí),執(zhí)行這一過程的機(jī)制會(huì)極大地影響你的視覺系統(tǒng)。
正是在這一強(qiáng)制執(zhí)行的機(jī)制的影響下,你的視覺系統(tǒng)對圖形中的每一個(gè)點(diǎn)都賦予了深度。換句話說,一幅圖像的某些二維結(jié)構(gòu)元素和你三維知覺解釋系統(tǒng)的某些結(jié)構(gòu)元素相對應(yīng)。二維直線被解釋成三維直線。二維的平面被解釋為三維的平面。在透視圖像中,銳角和鈍角都被解釋為90°角。外面的線段被看作是外形輪廓的分界線。這一外形分界線在你定義整個(gè)心理圖像的外形輪廓時(shí)起著及其重要的作用。這說明,在沒有相反信息的影響下,你的視覺系統(tǒng)總是假定你從一個(gè)主要視角觀看事物。
三角形的每一個(gè)頂角都產(chǎn)生透視,三個(gè)90°的角,而且,每條邊的距離變化不同。把三個(gè)頂角合成一個(gè)整體,就產(chǎn)生了一個(gè)空間不可能圖形。
相對性:環(huán)境對比的影響
計(jì)算機(jī)視覺的發(fā)展歷史:
1950s:二維圖像分析和識(shí)別,如光學(xué)字符識(shí)別,工件表面、顯微圖片和航空圖片的分析和解釋等。是模式識(shí)別的重要內(nèi)容。
1960s:MIT的Roberts通過計(jì)算機(jī)程序從數(shù)字圖像中提取出諸如立方體、楔形體、棱柱體等多面體的三維結(jié)構(gòu),并對物體形狀及物體的空間關(guān)系進(jìn)行描述.這項(xiàng)研究開創(chuàng)了以理解三維場景為目的的三維計(jì)算機(jī)視覺的研究.Roberts對積木世界的創(chuàng)造性研究給人們以極大的啟發(fā),許多人相信,一旦由白色積木玩具組成的三維世界可以被理解,則可以推廣到理解更復(fù)雜的三維場景.
1970s:出現(xiàn)了一些視覺應(yīng)用系統(tǒng).
-70年代中期,麻省理工學(xué)院(MIT)人工智能(AI)實(shí)驗(yàn)室正式開設(shè)“計(jì)算機(jī)視覺” ( Machine Vision) 課程,由B.K.P.Horn教授講授.
-David Marr教授于1973年應(yīng)邀在MIT AI 實(shí)驗(yàn)室領(lǐng)導(dǎo)一個(gè)以博士生為主體的研究小組,1977年提出了不同于“積木世界”分析方法的計(jì)算視覺理論.
1980s:Marr理論成為計(jì)算機(jī)視覺研究領(lǐng)域中的一個(gè)十分重要的理論框架.(ICCV, Marr獎(jiǎng))
計(jì)算機(jī)視覺獲得蓬勃發(fā)展,新概念、新方法、新理論、新應(yīng)用不斷涌現(xiàn),比如,基于感知特征群的物體識(shí)別理論框架,主動(dòng)視覺理論框架,視覺集成理論框架等.
Marr模型
80年代初,Marr首次從信息處理的角度綜合了圖像處理、心理物理學(xué)、神經(jīng)生理學(xué)及臨床神經(jīng)病理學(xué)的研究成果,提出了第一個(gè)較完備的視覺系統(tǒng)框架。
Marr將系統(tǒng)分為基元圖、2.5維圖(部分的、不完整的三維信息,缺少深度信息)和三維模型三個(gè)層次來表達(dá)視覺信息的處理過程,而每層的表達(dá)將適當(dāng)?shù)男畔⒚骼驶?/p>
基元圖:使亮度變化(邊沿)的信息明朗化,如角點(diǎn)、邊緣、紋理、線條、邊界等基本特征。
2.5維圖:使表面朝向的信息明朗化,如場景可見部分的深度、法線方向、輪廓等。
三維模型:物體的形狀與空間位置信息明朗化。
優(yōu)點(diǎn):系統(tǒng)地闡述了用二維圖像恢復(fù)三維物體的可能性和一般性方法。
缺點(diǎn):沒有考慮視覺本身具有的反饋機(jī)制和不同層次的處理力度。
計(jì)算機(jī)視覺(Computer Vision)與相關(guān)學(xué)科的關(guān)系
- 圖像處理 (Image Processing) 圖像處理通常是把一幅圖像變換成另外一幅圖像,也就是說,圖像處理系統(tǒng)的輸入是圖像,輸出仍然是圖像,信息恢復(fù)任務(wù)則留給人來完成。
- 計(jì)算機(jī)圖形學(xué) (Computer Graphics) 通過幾何基元,如線、圓和自由曲面等,來生成圖像,屬于圖像綜合,它在可視化(Visualization)和虛擬現(xiàn)實(shí)(Virtual Reality)中起著很重要的作用.計(jì)算機(jī)視覺正好是解決相反的問題,即從圖像中估計(jì)幾何基元和其它特征,屬于圖像分析.
- 模式識(shí)別 (Pattern Recognition) 研究分類問題,確定符號(hào)、圖畫、物體等輸入對象的類別.強(qiáng)調(diào)一類事物區(qū)別于其它事物所具有的共同特征。一般不關(guān)心三維世界的恢復(fù)問題。
- 人工智能 (Artificial Intelligence) 涉及到智能系統(tǒng)的設(shè)計(jì)和智能計(jì)算的研究.在經(jīng)過圖像處理和圖像特征提取過程后,接下來要用人工智能方法對場景特征進(jìn)行表示,并分析和理解場景.
- 媒體計(jì)算 (Multimedia Computing) 文字\圖形\圖像\動(dòng)畫\視頻\音頻等各類感覺媒體的共性基礎(chǔ)計(jì)算理論、計(jì)算方法,以及媒體系統(tǒng)實(shí)現(xiàn)技術(shù)。以實(shí)現(xiàn)下一代計(jì)算機(jī)能聽、能看、會(huì)說、會(huì)學(xué)習(xí)為目標(biāo)。
- 認(rèn)知科學(xué)與神經(jīng)科學(xué) (Cognitive science and Neuroscience) 將人類視覺作為主要的研究對象.計(jì)算機(jī)視覺中已有的許多方法與人類視覺極為相似.許多計(jì)算機(jī)視覺研究者對研究人類視覺計(jì)算模型比研究計(jì)算機(jī)視覺系統(tǒng)更感興趣,希望計(jì)算機(jī)視覺更加自然化,更加接近生物視覺
圖信號(hào)處理層次
- 圖像處理:圖像采集、儲(chǔ)存;圖像重建;圖像變換、增強(qiáng)、恢復(fù)、校正;圖像(視頻)壓縮編碼。
- 圖像分析:邊緣檢測、圖像分割;目標(biāo)表達(dá)、描述;目標(biāo)顏色、形狀、紋理、空間和運(yùn)動(dòng)分析;目標(biāo)檢測、識(shí)別。
- 圖像理解:圖像配準(zhǔn)、融合;3-D表示、建模、場景恢復(fù);圖像感知、解釋、推理;基于內(nèi)容的圖像和視頻檢索。
計(jì)算機(jī)視覺技術(shù)的應(yīng)用
- 工業(yè)領(lǐng)域(生產(chǎn)裝配、質(zhì)量檢驗(yàn))
- 機(jī)器人(星球探測機(jī)器人)
- 遙感圖像分析(植被分析)
- 醫(yī)學(xué)圖像分析(骨骼定位)
- 安全鑒別、監(jiān)視與跟蹤(門禁系統(tǒng)、視頻監(jiān)控)
- 國防系統(tǒng)(目標(biāo)自動(dòng)識(shí)別與目標(biāo)跟蹤)
- 圖像與視頻檢索(基于內(nèi)容的檢索)
- 文物保護(hù)(數(shù)字博物館)
- 其他(游戲、動(dòng)畫、體育、人機(jī)交互)