一、機(jī)器視覺系統(tǒng)
機(jī)器視覺系統(tǒng)是指利用機(jī)器替代人眼做出各種測量和判斷。機(jī)器視覺是工程領(lǐng)域和科學(xué)領(lǐng)域中的一個(gè)非常重要的研究領(lǐng)域,它是一門涉及光學(xué)、機(jī)械、計(jì)算機(jī)、模式識別、圖像處理、人工智能、信號處理以及光電一體化等多個(gè)領(lǐng)域的綜合性學(xué)科。
其應(yīng)用范圍隨著工業(yè)自動化的發(fā)展逐漸完善和推廣,其中母子圖像傳感器、CMOS和CCD攝像機(jī)、DSP、ARM嵌入式技術(shù)、圖像處理和模式識別等技術(shù)的快速發(fā)展,有力地推動了機(jī)器視覺的發(fā)展。
機(jī)器視覺是一種比較復(fù)雜的系統(tǒng)。因?yàn)榇蠖鄶?shù)系統(tǒng)監(jiān)控對象都是運(yùn)動物體,系統(tǒng)與運(yùn)動物體的匹配和協(xié)調(diào)動作尤為重要,所以給系統(tǒng)各部分的動作時(shí)間和處理速度帶來了嚴(yán)格的要求。
在某些應(yīng)用領(lǐng)域,例如機(jī)器人、飛行物體導(dǎo)致等,對整個(gè)系統(tǒng)或者系統(tǒng)的一部分的重量、體積和功耗都會有嚴(yán)格的要求。
機(jī)器視覺系統(tǒng)的構(gòu)成和工作過程一個(gè)完整的機(jī)器視覺系統(tǒng)包括:照明光源、光學(xué)鏡頭、 CCD 攝相機(jī)、圖像采集卡、圖像檢測軟件、監(jiān)視器、通訊單元等。
工業(yè)機(jī)器視覺系統(tǒng)的工作過程主要如下:
1、當(dāng)傳感器探測到被檢測物體接近運(yùn)動至攝像機(jī)的拍攝中心,將觸發(fā)脈沖發(fā)送給圖像采集卡;
2、圖像采集卡根據(jù)已設(shè)定的程序和延時(shí),將啟動脈沖分別發(fā)送給照明系統(tǒng)和攝像機(jī);
3、一個(gè)啟動脈沖送給攝像機(jī),攝像機(jī)結(jié)束當(dāng)前的拍照,重新開始一副新的拍照,或者在啟動脈沖到來前攝像機(jī)處于等待狀態(tài),檢測到啟動脈沖后啟動,在開始新的一副拍照前攝像機(jī)打開曝光構(gòu)件(曝光時(shí)間事先設(shè)定好);另一個(gè)啟動脈沖送給光源,光源的打開時(shí)間需要與攝像機(jī)的曝光時(shí)間匹配;攝像機(jī)掃描和輸出一幅圖像;
4、圖像采集卡接收信號并通過A/D轉(zhuǎn)換將模擬信號數(shù)字化,或者是直接接收攝像機(jī)數(shù)字化后的數(shù)字視頻數(shù)據(jù);
5、圖像采集卡將數(shù)字圖像存儲在計(jì)算機(jī)的內(nèi)存中;
6、計(jì)算機(jī)對圖像進(jìn)行處理、分析和識別,獲得檢測結(jié)果;
7、處理結(jié)果控制流水線的動作、進(jìn)行定位、糾正運(yùn)動的誤差等。
二、機(jī)器視覺相關(guān)技術(shù)
1、圖像采集技術(shù)——機(jī)器視覺的基礎(chǔ)
圖像采集部分一般由光源、鏡頭、數(shù)字?jǐn)z像機(jī)和圖像采集卡構(gòu)成。采集過程可簡單描述為在光源提供照明的條件下,數(shù)字?jǐn)z像機(jī)拍攝目標(biāo)物體并將其轉(zhuǎn)化為圖像信號,最后通過圖像采集卡傳輸給圖像處理部分。
在設(shè)計(jì)圖像采集部分時(shí),要考慮到多方面的問題,主要是關(guān)于數(shù)字?jǐn)z像機(jī)、圖像采集卡和光源方面的問題。
(1)光源照明
照明是影響機(jī)器視覺系統(tǒng)輸入的重要因素,其直接影響輸入數(shù)據(jù)的質(zhì)量和應(yīng)用效果。到目前為止,還未有哪種機(jī)器視覺照明設(shè)備能通用各種應(yīng)用,因此在實(shí)際應(yīng)用中,需針對應(yīng)用選擇相應(yīng)的照明設(shè)備以滿足特定需求。
照明系統(tǒng)按其照射方法可分為:背向照明、前向照明、結(jié)構(gòu)光和頻閃光照明等。其中,背向照明是指將被測物放在光源和攝像機(jī)之間,以提高圖像的對比度。前向照明是光源和攝像機(jī)位于被測物的同側(cè),其優(yōu)點(diǎn)是便于安裝。
結(jié)構(gòu)光照明是將光柵或線光源等投射到被測物上,并根據(jù)其產(chǎn)生的畸變,解調(diào)出被測物的三維信息。頻閃光照明是將高頻率的光脈沖照射到物體上,攝像機(jī)拍攝要求與光源同。
(2)光學(xué)攝像頭
光學(xué)攝像頭的任務(wù)就是進(jìn)行光學(xué)成像,一般在測量領(lǐng)域都又專門的用于測量的攝像鏡頭,因?yàn)槠鋵Τ上褓|(zhì)量有著關(guān)鍵性的作用。
攝像頭需要注意的一個(gè)問題是畸變。這個(gè)就需要使用相應(yīng)的畸變校正方法,目前也開發(fā)出了很多自動畸變自動校正系統(tǒng)。
(3)CCD 攝像機(jī)及圖像采集卡
CCD( Charge Coupled Device) 攝像機(jī)及圖像采集卡共同完成對目標(biāo)圖像的采集與數(shù)字化。目前 CCD,CMOS等固體器件的應(yīng)用技術(shù),線陣圖型敏感器件,像元尺寸不斷減小,陣列像元數(shù)量不斷增加,像元電荷傳輸速率也得到大幅提高。
在基于PC機(jī)的機(jī)器視覺系統(tǒng)中,圖像采集卡是控制攝像機(jī)拍照來完成圖像的采集與數(shù)字化,并協(xié)調(diào)整個(gè)系統(tǒng)的重要設(shè)備。
圖像采集卡直接決定了攝像頭的接口為:黑白、彩色、模擬、數(shù)字等形式。
2、圖像處理與分析——機(jī)器視覺的核心
用于機(jī)器視覺的圖像處理與分析方法的核心是,解決目標(biāo)的檢測識別問題。當(dāng)所需要識別的目標(biāo)比較復(fù)雜時(shí),就需要通過幾個(gè)環(huán)節(jié),從不同的側(cè)面綜合來實(shí)現(xiàn)。
對目標(biāo)進(jìn)行識別提取的時(shí)候,首先是要考慮如何自動地將目標(biāo)物從背景中分離出來。目標(biāo)物提取的復(fù)雜性一般就在于目標(biāo)物與非目標(biāo)物的特征差異不是很大,在確定了目標(biāo)提取方案后,就需要對目標(biāo)特征進(jìn)行增強(qiáng)。
隨著計(jì)算機(jī)技術(shù)、微電子技術(shù)以及大規(guī)模集成電路的發(fā)展,圖像信息處理工作越來越多地借助硬件完成,如 DSP 芯片、專用的圖像信號處理卡等。
軟件部分主要用來完成算法中并不成熟又較復(fù)雜或需不斷完善改進(jìn)的部分。這一方面提高了系統(tǒng)的實(shí)時(shí)性,同時(shí)又降低了系統(tǒng)的復(fù)雜度。
三、機(jī)器視覺的應(yīng)用與優(yōu)勢
1、機(jī)器視覺技術(shù)的應(yīng)用范圍
(1) 在工業(yè)檢測方面
近幾十年來,在工業(yè)檢測中利用視覺系統(tǒng)的非接觸、速度快、精度合適、現(xiàn)場抗干擾能力強(qiáng)等突出的優(yōu)點(diǎn),使機(jī)器視覺技術(shù)得到了廣泛的應(yīng)用,取得了巨大的經(jīng)濟(jì)與社會效益。
自動視覺識別檢測目前已經(jīng)用于產(chǎn)品外形和表面缺陷檢驗(yàn),如木材加工檢測、金屬表面視覺檢測、二極管基片檢查、印刷電路板缺陷檢查、焊縫缺陷自動識別等。
這些檢測識別系統(tǒng)屬于二維機(jī)器視覺,技術(shù)已經(jīng)較為成熟,其基本流程是用一個(gè)攝像機(jī)獲取圖像,對所獲取的圖像進(jìn)行處理及模式識別,檢測出所需的內(nèi)容。
(2) 在醫(yī)學(xué)上的應(yīng)用在醫(yī)學(xué)領(lǐng)域
機(jī)器視覺主要用于醫(yī)學(xué)輔助診斷。首先采集核磁共振、超聲波、激光、X射線、γ射線等對人體檢查記錄的圖像,再利用數(shù)字圖像處理技術(shù)、信息融合技術(shù)對這些醫(yī)學(xué)圖像進(jìn)行分析、描述和識別,最后得出相關(guān)信息,對輔助醫(yī)生診斷人體病源大小、形狀和異常,并進(jìn)行有效治療發(fā)揮了重要的作用。
不同醫(yī)學(xué)影像設(shè)備得到的是不同特性的生物組織圖像,如X射線反映的是骨骼組織,核磁共振影像反映的是有機(jī)組織圖像,而醫(yī)生往往需要考慮骨骼有機(jī)組織的關(guān)系,因而需要利用數(shù)字圖像處理技術(shù)將兩種圖像適當(dāng)?shù)丿B加起來,以便于醫(yī)學(xué)分析。
(3) 交通監(jiān)控領(lǐng)域中的應(yīng)用
智能交通監(jiān)控領(lǐng)域中,在重要的十字路口安放攝像頭,就可以利用攝像頭的快速拍照功能,實(shí)現(xiàn)對違章、逆行等車牌的車牌進(jìn)行自動識別、存貯,以便相關(guān)的工作人員進(jìn)行查看。
(4) 在橋梁檢測領(lǐng)域中的應(yīng)用
人工檢測法和橋檢車法都是依靠人工用肉眼對橋梁表面進(jìn)行檢測,其速度慢,效率低,漏檢率高,實(shí)時(shí)性差,影響交通,存在安全隱患,很難大幅應(yīng)用;
無損檢測包括激光檢測、超聲波檢測以及聲發(fā)射檢測等多種檢測技術(shù),它們儀器昂貴,測量范圍小,不能滿足日益發(fā)展的橋梁檢測要求;
智能化檢測有基于導(dǎo)電性材料的混凝土裂縫分布式自動檢測系統(tǒng)和智能混凝土技術(shù),也有最前沿的基于機(jī)器視覺的檢測方法。
導(dǎo)電性材料技術(shù)雖然使用方便,設(shè)備簡單,成本低廉,但是均需要事先在混凝土結(jié)構(gòu)上涂刷或者埋設(shè)導(dǎo)電性材料進(jìn)行檢測,而且智能混凝土技術(shù)還無法確定裂縫位置、裂縫寬度等一系列問題距實(shí)用化還有較長的距離;
而基于機(jī)器視覺的檢測方法是利用CCD相機(jī)獲取橋梁表觀圖片,然后運(yùn)用計(jì)算機(jī)處理后自動識別出裂縫圖像,并從背景中分離出來然后進(jìn)行裂縫參數(shù)的計(jì)算的方法,它具有便捷、直觀、精確、非接觸、再現(xiàn)性好、適應(yīng)性強(qiáng)、靈活性高、成本低廉的優(yōu)點(diǎn),能解放勞動力,排除人為干擾,具有很好的應(yīng)用前景。
據(jù)統(tǒng)計(jì),混凝土橋梁的損壞有90%以上都是由裂縫引起的,因此對橋梁的健康檢測主要是對橋梁表觀的裂縫進(jìn)行檢測與測量。
基于機(jī)器視覺的橋梁檢測技術(shù)主要包括三部分內(nèi)容:橋梁表觀圖像的獲取技術(shù)、基于圖像的裂縫自動識別理論與算法以及基于圖像的裂縫寬度等病害程度定量化測量方法。
基于機(jī)器視覺的自動化、智能化檢測技術(shù)已經(jīng)在道路、隧道上得到了成功應(yīng)用,在橋梁上也得到了初步的應(yīng)用,但主要集中在視線開闊的高空混凝土構(gòu)件表觀圖像獲取技術(shù)上,在病害的自動識別方面仍停留在理論研究階段,還無法應(yīng)用于實(shí)際工程當(dāng)中。
針對量大面廣的混凝土梁體,智能化視頻橋梁檢測車進(jìn)入理論與關(guān)鍵部件模型的研制階段,但是受到橋梁細(xì)小裂縫自動識別與清晰圖像快速化獲取難度大的限制,目前離達(dá)到實(shí)用化程度的要求還相距甚遠(yuǎn)。
2、機(jī)器視覺技術(shù)的優(yōu)勢
針對量大面廣的混凝土梁體
1、效率:工業(yè)自動化的快速發(fā)展,使生產(chǎn)效率大幅提升,從而對檢測效率提出了更高的要求。人工檢測效率是在一個(gè)固定區(qū)間,無法大幅提升,而在流水線重復(fù)且機(jī)械化的檢測過程中,檢察人員很容易出現(xiàn)疲勞而導(dǎo)致檢測效率降低;而機(jī)器視覺能夠更快的檢測產(chǎn)品,特別是在生產(chǎn)線檢測高速運(yùn)動的物體時(shí),機(jī)器能夠提高檢測效率,速度甚至能夠到達(dá)人工10-20倍;
2、精度:由于人員有物理?xiàng)l件的限制,即使是依靠放大鏡或顯微鏡來檢測產(chǎn)品,也會受到主觀性方面的影響,精度無法得到保證,而且不同的檢測人員的標(biāo)準(zhǔn)也會存在有差異;在精確性上機(jī)器有明顯的優(yōu)點(diǎn),它的精度能夠達(dá)到千分之一英寸。而且機(jī)器不受主觀控制,只要參數(shù)設(shè)置沒有差異,相同配置的多臺機(jī)器均能保持相同精度
3、客觀性:人工檢測難免會出現(xiàn)疲勞,同時(shí)有一個(gè)致命缺陷,就是情緒帶來的主觀性,檢測結(jié)果會隨檢察人員心情的好壞產(chǎn)生變化;而機(jī)器沒有喜怒哀樂,它所帶來的檢測結(jié)果自然更加客觀可靠。
4、重復(fù)性:機(jī)器可以以相同的方法一次一次的完成檢測工作而不會感到疲倦;與此相反,人工長期重復(fù)性檢測肯定會產(chǎn)生疲勞,同時(shí)每次檢測產(chǎn)品時(shí)都會有細(xì)微的不同,即使產(chǎn)品是完全相同。
5、環(huán)境:機(jī)器視覺是通過即圖像攝取裝置將目標(biāo)轉(zhuǎn)換成圖像信號,傳送給專用的圖像處理系統(tǒng),在測量工件過程中,無需與工件進(jìn)行接觸,因此能夠適應(yīng)惡劣危險(xiǎn)生產(chǎn)環(huán)境,同時(shí)也不會對工件造成接觸性損傷;而人工則需要與工件進(jìn)行接觸性檢測,因?yàn)闊o法應(yīng)對惡劣環(huán)境,且在檢查過程中不可避免的會對工件造成接觸性損傷;
6、成本機(jī)器視覺前期投入會比較多,但屬于一次性投入,長期產(chǎn)出,由于機(jī)器視覺的發(fā)展越來越迅速,價(jià)格也會逐漸降低;而人工檢測則需要長期投入,且人工管理成本會呈不斷上升的趨勢。由于機(jī)器比人工的檢測效率高很多,因此長期來看,機(jī)器視覺成本會更低;
7、信息集成:機(jī)器視覺可以通過多工位檢測方法,一次性完成待檢產(chǎn)品的輪廓、尺寸、外觀缺陷、產(chǎn)品高度等多技術(shù)參數(shù)的測量;而人工檢測在面對不同的檢測內(nèi)容時(shí),只能通過多工位合作協(xié)調(diào)完成,而不同員工檢測標(biāo)準(zhǔn)不一,極容易出現(xiàn)誤檢的情況;
8、數(shù)字化:機(jī)器視覺在工作過程中產(chǎn)生的說要測量數(shù)據(jù),均可獨(dú)立拷貝或以網(wǎng)絡(luò)連接方式拷出,便于生產(chǎn)過程統(tǒng)計(jì)和分析。同時(shí)還可在檢測后導(dǎo)出指定數(shù)據(jù)并生產(chǎn)報(bào)表,無需人工一一添加,這無疑大大優(yōu)于人工檢測的數(shù)據(jù)統(tǒng)計(jì);
總體來說,機(jī)器視覺對比人工檢測具有自動化、客觀、非接觸和高精度等特點(diǎn)。特別是在工業(yè)生產(chǎn)領(lǐng)域,機(jī)器視覺強(qiáng)調(diào)生產(chǎn)的精度和速度,以及工業(yè)現(xiàn)場環(huán)境下的可靠性,在重復(fù)和機(jī)械性的工作中具有較大的應(yīng)用價(jià)值,對企業(yè)來說是實(shí)現(xiàn)自動化生產(chǎn)重要的一步。
四、機(jī)器視覺未來發(fā)展趨勢
機(jī)器視覺可以說是人工智能的最下層的基礎(chǔ)設(shè)施層, 在人工智能產(chǎn)業(yè)行業(yè)應(yīng)用最主要幾個(gè)應(yīng)用領(lǐng)域中,機(jī)器視覺的應(yīng)用領(lǐng)域非常深、非常多,從整個(gè)產(chǎn)業(yè)鏈的全景圖來講,中國的人工智能產(chǎn)業(yè)處在快速的生態(tài)的構(gòu)建期。
從整個(gè)機(jī)器視覺的領(lǐng)域來講,它是處在快速的重構(gòu)期,通過市場分析來看,機(jī)器視覺并不是特別新興的領(lǐng)域,這從最早圖像處理衍生到現(xiàn)在,市場上有很多大的廠商對智能安防和交通做了很久的深耕,他們最開始不是做機(jī)器視覺、人臉識別起家的,在這幾個(gè)行業(yè)中很多廠商都處于并駕齊驅(qū)、快速發(fā)展階段。
2018年中國人工智能市場規(guī)模會超過406億,這個(gè)復(fù)合增長率會達(dá)到25.8%,增速是快于全球的整個(gè)增長率的。在市場結(jié)構(gòu)上來講,也是存在著整體的情況。投資規(guī)模來講,在去年一年,從投資的整個(gè)額度包括投資筆數(shù)都呈快速增加的態(tài)勢,而且很多從事人工智能和機(jī)器視覺的企業(yè)數(shù)量也在快速地增加。
未來,通過人工智能方面利好的政策,在這四個(gè)領(lǐng)域會有比較大的機(jī)遇,安防、交通,金融,消費(fèi)電子這是機(jī)器視覺領(lǐng)域重點(diǎn)關(guān)注的應(yīng)用行業(yè)方向。
第一是現(xiàn)在巨頭做機(jī)器視覺,包括人工智能演進(jìn),他們都是呈開元化,這在中國來講比如華為,對他們來說開源的思路,到底開源怎么用,有很多理念上跟國外還是有一定的差距,很多開源做完代碼自己封裝自己用了,其實(shí)從整個(gè)思路來講,國外開源理念上是更先進(jìn)的。當(dāng)然有其背后的原因,很多企業(yè)基本上在提交人工智能代碼上走著開源化部署道路。
整個(gè)產(chǎn)業(yè)的演進(jìn)方向,目前處在快速回報(bào)期。整個(gè)產(chǎn)業(yè)和產(chǎn)品技術(shù)演進(jìn)會存在周期的波動,機(jī)器視覺領(lǐng)域以及計(jì)算機(jī)視覺,仍是處在快速的回報(bào)期,也就是說它的技術(shù)已經(jīng)得到成熟,市場關(guān)注度也在快速地回升,它是未來能夠得到快速回報(bào)的重點(diǎn)產(chǎn)品和領(lǐng)域。
最后就是在目前中國整個(gè)市場發(fā)展,包括政府的規(guī)劃中,智慧城市這個(gè)話題又重新火熱起來了,很多年前建設(shè)了很多,但是發(fā)展都不是特別順利,現(xiàn)在隨著人工智能整個(gè)產(chǎn)業(yè)發(fā)展,這個(gè)動力和熱潮,主要原因就是技術(shù)實(shí)力能夠解決真正的剛需和真正的問題,在數(shù)據(jù)方面我們預(yù)測今年中國智慧城市建設(shè)數(shù)量超過500個(gè),在整個(gè)智慧城市的產(chǎn)業(yè)定義上來講,機(jī)器視覺領(lǐng)域需求量特別大的,很多的包括智慧城市的定義就是說,什么叫智慧城市,就是攝象頭數(shù)量多少個(gè),這是一個(gè)很剛性的標(biāo)準(zhǔn),對智能,包括具備人臉識別功能攝象頭需求量未來是非常大的。