電子產(chǎn)品頻道訊:3D深度相機(jī)是區(qū)別于我們平時(shí)用到的2D相機(jī)。與傳統(tǒng)相機(jī)不同之處在于該相機(jī)可同時(shí)拍攝景物的灰階影像資訊及包含深度的3維資訊。其設(shè)計(jì)原理系針對待測場景發(fā)射一參考光束,藉由計(jì)算回光的時(shí)間差或相位差,來換算被拍攝景物的距離,以產(chǎn)生深度資訊,此外再結(jié)合傳統(tǒng)的相機(jī)拍攝,以獲得2維影像資訊。
這種深度相機(jī)具備以下優(yōu)點(diǎn):
1)相對二維圖像,可通過距離信息獲取物體之間更加豐富的位置關(guān)系,即區(qū)分前景與后景
2)深度信息依舊可以完成對目標(biāo)圖像的分割、標(biāo)記、識別、跟蹤等傳統(tǒng)應(yīng)用
3)經(jīng)過進(jìn)一步深化處理,可以完成三維建模等應(yīng)用
4)能夠快速完成對目標(biāo)的識別與追蹤
5)主要配件成本相對低廉,包括CCD和普通 LED 等,對今后的普及化生產(chǎn)及使用有利
6)借助 CMOS 的特性,可獲取大量數(shù)據(jù)及信息,對復(fù)雜物體的姿態(tài)判斷極為有效,無需掃描設(shè)備輔助工作。
根據(jù)硬件實(shí)現(xiàn)方式的不同,目前行業(yè)內(nèi)所采用的主流3D機(jī)器視覺大約有三種:結(jié)構(gòu)光、TOF時(shí)間光、雙目立體成像。
1)結(jié)構(gòu)光(Structure Light)
通過激光的折射以及算法計(jì)算出物體的位置和深度信息,進(jìn)而復(fù)原整個(gè)三維空間。結(jié)構(gòu)光的代表產(chǎn)品有微軟的Kinect一代。通過發(fā)射特定圖形的散斑或者點(diǎn)陣的激光紅外圖案,當(dāng)被測物體反射這些圖案,通過攝像頭捕捉到這些反射回來的圖案,計(jì)算上面散斑或者點(diǎn)的大小,跟原始散斑或者點(diǎn)的尺寸做對比,從而測算出被測物體到攝像頭之間的距離。
目前是業(yè)界比較成熟的深度檢測方案,很多的激光雷達(dá)和3D掃描技術(shù)都是采用的結(jié)構(gòu)光方案。不過由于以折射光的落點(diǎn)位移來計(jì)算位置,這種技術(shù)不能計(jì)算出精確的深度信息,對識別的距離也有嚴(yán)格的要求。而且容易受到環(huán)境光線的干擾,強(qiáng)光下不適合,響應(yīng)也比較慢。
典型的結(jié)構(gòu)光方案包括:PrimeSense(微軟Kinect1代)、英特爾RealSense(前置方案)。
2)光飛行時(shí)間(TIme of Flight)
TOF系統(tǒng)是一種光雷達(dá) (LIDAR) 系統(tǒng),可從發(fā)射極向?qū)ο蟀l(fā)射光脈沖,接收器則可通過計(jì)算光脈沖從發(fā)射器到對象,再以像素格式返回到接收器的運(yùn)行時(shí)間來確定被測量對象的距離。TOF系統(tǒng)可同時(shí)獲得整個(gè)場景,確定3D范圍影像。利用測量得到的對象坐標(biāo)可創(chuàng)建3D影像,并可用于機(jī)器人、制造、醫(yī)療技術(shù)以及數(shù)碼攝影等領(lǐng)域的設(shè)備控制。
TOF方案的優(yōu)點(diǎn)在于響應(yīng)速度快,深度信息精度高,不容易受環(huán)境光線干擾,這些優(yōu)點(diǎn)使其成為移動端手勢識別最被看好的方案。代表廠商有微軟(Kinect2代)、意法半導(dǎo)體、英飛凌、德州儀器等。
3)多角立體成像(MulTI-camera)
現(xiàn)在手勢識別領(lǐng)域的佼佼者Leap MoTion使用的就是這種技術(shù)。它使用兩個(gè)或者兩個(gè)以上的攝像頭同時(shí)采集圖像,通過比對這些不同攝像頭在同一時(shí)刻獲得的圖像的差別,使用算法來計(jì)算深度信息,從而多角三維成像。
Leap MoTion方案使用2個(gè)攝像機(jī)獲得左右立體影像,該影像有些輕微偏移,與人眼同序。計(jì)算機(jī)通過比較這兩個(gè)影像,就可獲得對應(yīng)于影像中物體位移的不同影像。該不同影像或地圖可以是彩色的,也可以為灰階,具體取決于特定系統(tǒng)的需求。
雙目多角立體成像方案的優(yōu)點(diǎn)在于不容易受到環(huán)境光線的干擾,適合室外環(huán)境,滿足7*24小時(shí)的長時(shí)間工作要求,不易損壞。缺點(diǎn)是昏暗環(huán)境、特征不明顯時(shí)不適合,目前應(yīng)用在智能安防監(jiān)控、機(jī)器人視覺、物流檢測等領(lǐng)域。
由于3D深度相機(jī)的原理,他的出現(xiàn)將進(jìn)一步解放雙手,打開新的智能人機(jī)交互空間。
回到2011年,蘋果在推出的iPhone4S配備了語音識別助手Siri,利用人工智能技術(shù),通過與消費(fèi)者的語言對話,實(shí)現(xiàn)信息的交互。隨后,語音交互越來越多地出現(xiàn)在智能終端上,尤其是隨著人工智能語義識別技術(shù)的進(jìn)步,語音交互的準(zhǔn)確性和實(shí)用性大幅提升。亞馬遜于2015年推出的ECHO智能音箱便是典型成功例子。
語音識別可以完全解放雙手,但是在人機(jī)互動方面的應(yīng)用場景有一定的局限性,對于游戲娛樂、互動體驗(yàn)、拍照等領(lǐng)域,這些必須有用戶肢體參與的場景,語音交互無法滿足需求。因此,比現(xiàn)今觸控屏更高層次的體感交互成為了廣大廠商追求的目標(biāo)。
要實(shí)現(xiàn)體感交互,最重要的就是手勢識別,因?yàn)槭植縿幼魇侨梭w最豐富也是最常用的體感動作。對于智能手機(jī)而言,如果手勢識別可以得到應(yīng)用,那么包括手機(jī)自拍、游戲、瀏覽網(wǎng)頁、購物等眾多應(yīng)用場景,在用戶體驗(yàn)上均可以實(shí)現(xiàn)大幅提升,手機(jī)也將從觸控屏?xí)r代走向手勢識別時(shí)代。
同時(shí),人臉識別與追蹤也是體感交互最具前景的方向之一。我們認(rèn)為,人臉識別在移動端具有更加廣闊的應(yīng)用空間。例如目前指紋識別已經(jīng)成為智能手機(jī)的標(biāo)配,通過指紋識別來實(shí)現(xiàn)開機(jī)、支付、登陸確認(rèn)等功能已經(jīng)被大眾所認(rèn)可,并且創(chuàng)造了巨大的市場價(jià)值,但是指紋識別的局限性在于必須通過手指完成,手指放置的位置、手指表面的潔凈度等因素都會極大地影響使用體驗(yàn),而人臉識別可以完全解放雙手,只需要借助攝像頭對人臉信息的采集便可以完成識別與交互。
因此無論是消費(fèi)級市場的游戲、娛樂、交互,還是商業(yè)領(lǐng)域的醫(yī)療、工業(yè)、軍事等,都需要豐富的手部動作來參與,因此手勢識別具有非常廣泛的應(yīng)用場景。人臉識別也是3D深度相機(jī)所擅長的一個(gè)方向。
注:文章內(nèi)的所有配圖皆為網(wǎng)絡(luò)轉(zhuǎn)載圖片,侵權(quán)即刪!