機器視覺是指利用相機、攝像機等傳感器,配合機器視覺算法賦予智能設(shè)備人眼的功能,從而進行物體的識別、檢測、測量等功能。機器視覺是在上世紀 50 年代從統(tǒng)計模式識別開始的,當時的工作主要集中在二維圖像分析和識別。隨著 5G、AI 等技術(shù)的不斷發(fā)展,行業(yè)應(yīng)用需求的不斷提升,機器視覺從二維向三維過渡不但成為可能,更是必須的方向。
機器視覺從2D進化到3D立體“視界”,常見常用的刷臉支付、Face ID、VR、無人便利店、智能機器人等產(chǎn)品技術(shù),背后關(guān)鍵的科技便是3D視覺技術(shù)。
在過去幾年里,3D視覺概念迭出,大量資本涌入這個賽道,新進企業(yè)眾多。業(yè)內(nèi)人士普遍認為,3D視覺在工業(yè)領(lǐng)域的產(chǎn)值和產(chǎn)出,可能要遠遠大于消費領(lǐng)域,但因為滲透率很低,推進速度不夠快,當前3D工業(yè)相機的規(guī)模在幾億美金區(qū)間,設(shè)備和軟件在20億美金水平,但行業(yè)市場有50倍以上的滲透率增長空間。
從2D到3D的賽道變化
2D技術(shù)起步較早,技術(shù)也相對成熟,在過去的30年中已被證明在廣泛的自動化和產(chǎn)品質(zhì)量控制過程中非常有效。
2D技術(shù)根據(jù)灰度或彩色圖像中對比度的特征提供結(jié)果。2D適用于缺失/存在檢測、離散對象分析、圖案對齊、條形碼和光學(xué)字符識別(OCR)以及基于邊緣檢測的各種二維幾何分析,用于擬合線條、弧線、圓形及其關(guān)系(距離,角度,交叉點等)。
3D視覺利用近紅外線光來掃描周圍環(huán)境,再由CMOS圖像傳感器接收并轉(zhuǎn)換為數(shù)字信號,最后通過芯片計算出物體在三維空間中的遠近與相對位置,因此能了解物體的動作、與環(huán)境的互動,由此即能發(fā)展出由動作控制計算機的體感操控,檢測出前方的物體等。
由于2D視覺逐漸無法滿足對復(fù)雜對象識別和尺寸測量精度日益增加的要求,因此也催生了3D視覺的增長。從2D轉(zhuǎn)向3D,需要所獲取信息質(zhì)量和數(shù)量的飛躍。相對來說,2D視覺市場積淀深,3D視覺方案只有達到一定的成熟度,才可以全面實現(xiàn)2D向3D的轉(zhuǎn)變。
過去工業(yè)生產(chǎn)采用的機械臂都是盲取,閉著眼睛照著設(shè)定好的路徑加工,沒有更高階的智慧判斷。如果采用3D視覺后,就可以在更復(fù)雜的環(huán)境里更精準的夾取物件。業(yè)界認為,從2D到3D的過渡將成為繼黑白到彩色,低分辨率到高分辨率以及靜態(tài)圖像到電影之后的第四次革命。
但是3D機器視覺技術(shù)門檻高,涉及到光學(xué)、結(jié)構(gòu)、散熱等跨學(xué)科設(shè)計問題,再加上芯片、算法構(gòu)成的復(fù)雜系統(tǒng)設(shè)計,需要一定的技術(shù)實力,投入足夠的時間和人才,才可以研發(fā)相關(guān)方案。技術(shù)門檻高、投入大、研發(fā)企業(yè)少都是3D視覺發(fā)展路上的攔路虎。
在3D視覺興起之后,選擇2D視覺還是3D視覺,成為一個有爭議的問題。有業(yè)內(nèi)人士表示,3D視覺將全面替代2D視覺;但也有觀點認為,3D視覺價格高,在可以應(yīng)用2D視覺的場合,沒有必要用3D視覺;當然還有第三方觀點認為,2D視覺和3D視覺可以融合應(yīng)用。
就具體技術(shù)角度而言,2D顏色和3D幾何數(shù)據(jù)的采集是從兩個不同的物理通道進行的。
從落地來看,目前3D主要應(yīng)用于大型工業(yè)制造業(yè)企業(yè)、物流、智慧城市監(jiān)控,以及少部分消費應(yīng)用場景等,從探索到突破,在落地的路上逐顯繁榮。
3D視覺的不同技術(shù)形態(tài)
目前市場上主流的有四種3D視覺技術(shù),雙目視覺、TOF、結(jié)構(gòu)光3D成像和激光三角測量。
1.雙目視覺
雙目技術(shù)是目前較為廣泛的3D視覺系統(tǒng),它的原理就像我們?nèi)说膬芍谎劬,用兩個視點觀察同一景物以獲取在不同視角下的感知圖像,然后通過三角測量原理計算圖像的視差,來獲取景物的三維信息 。
由于雙目技術(shù)原理簡單,不需要使用特殊的發(fā)射器和接收器,只需要在自然光照下就能獲得三維信息,所以雙目技術(shù)具有系統(tǒng)結(jié)構(gòu)簡單、實現(xiàn)靈活和成本低的優(yōu)點。適合于制造現(xiàn)場的在線、產(chǎn)品檢測和質(zhì)量控制,不過雙目技術(shù)的劣勢是算法復(fù)雜,計算量大,而且光照較暗或者過度曝光的情況下效果差。
2.3D結(jié)構(gòu)光技術(shù)
它通過一個光源投射出一束結(jié)構(gòu)光,這結(jié)構(gòu)光可不是普通的光,而是具備一定結(jié)構(gòu)(比如黑白相間)的光線打到想要測量的物體上表面,因為物體有不同的形狀,會對這樣的一些條紋或斑點發(fā)生不同的變形,有這樣的變形之后,通過算法可以計算出距離、形狀、尺寸等信息從而獲得物體的三維圖像。
3. 激光三角測量法
它基于光學(xué)三角原理,根據(jù)光源、物體和檢測器三者之間的幾何成像關(guān)系,來確定空間物體各點的三維坐標 。
通常用激光作為光源,用CCD相機作為檢測器,具有結(jié)構(gòu)光3D視覺的優(yōu)點,精準、快速、成本低。
4. TOF飛行時間法成像技術(shù)
TOF是Time Of Flight的簡寫。它的原理通過給目標物連續(xù)發(fā)送光脈沖,然后用傳感器接收從物體返回的光,通過探測光脈沖的飛行時間來得到目標物距離。
TOF的核心部件是光源和感光接收模塊,由于TOF是根據(jù)公式直接輸出深度信息,不需要用類似雙目視覺的算法來計算,所以具有響應(yīng)快、軟件簡單、識別距離遠的特點,而且由于不需要進行灰度圖像的獲取與分析,因此不受外界光源物體表面性質(zhì)影響。典型的TOF 3D掃描系統(tǒng)每秒可測量物體上10,000至100,000個點的距離。不過TOF技術(shù)的缺點是:分辨率低、不能精密成像、而且成本高。
總的來說,無論是立體視覺、結(jié)構(gòu)光、激光三角測量還是TOF,沒有哪種技術(shù)是更好的,只有哪種技術(shù)是更適合的。
3D或?qū)⒊蔀橹髁?/strong>
機器人、自動駕駛、金融支付已經(jīng)體現(xiàn)出對3D視覺的強需求,當然,還有虛實相融的元宇宙,AR、VR等XR設(shè)備和3D交互需求已經(jīng)率先凸顯。這些需求帶來了龐大的市場,但這也是極度碎片化的市場。
GGII數(shù)據(jù)顯示,預(yù)計到2023年我國機器視覺市場規(guī)模將達到208.6億元,其中3D視覺市場規(guī)模將達到34.28億元,預(yù)計到2025年我國3D視覺市場規(guī)模將超過100億元。在這個未來的百億級市場中,3D視覺將趨于智能化、集成化、實時性、高性能、多場景應(yīng)用等方向。
2D視覺雖為當前主流,但隨著測量精度要求越來越高,被測物體條件越來越復(fù)雜,2D系統(tǒng)的缺陷也愈發(fā)突出,而3D視覺技術(shù)不斷獲得突破,在精度、靈活性和速度方面都是2D無可比擬的,所以3D機器視覺檢測有取代2D系統(tǒng)的趨勢,相信3D視覺未來將成為主流視覺系統(tǒng)。