Email:[email protected]
(一)“活在三維空間,、困于二維信息”的難題,,將在5G時代得到解決
在現(xiàn)實世界中,我們通過鍵盤,、鼠標(biāo)等設(shè)備與PC進(jìn)行交互,,通過觸屏方式與移動設(shè)備進(jìn)行交互,這些都是建立在二維世界的2D界面交互,。而在VR虛擬現(xiàn)實的世界,,2D交互顯然遠(yuǎn)遠(yuǎn)不足以滿足“沉浸感”的需求,這就要求交互方式要全面的顛覆:從傳統(tǒng)2D交互升級為用多種方式(動作捕捉,、手勢控制,、眼球追蹤、觸覺反饋,、語音交互,,甚至腦電波)與多維信息環(huán)境的3D立體交互。3D視覺是計算機(jī)視覺的終極體現(xiàn)形式,,2D視覺技術(shù)主要在二維空間下完成工作,,三維信息基本上沒有得到任何利用,,而三維信息才真正能夠反映物體和環(huán)境的狀態(tài),也更接近人類的感知模式,。近年來,,學(xué)術(shù)界和工業(yè)界推出了一系列優(yōu)秀的算法和產(chǎn)品,被廣泛應(yīng)用到各個領(lǐng)域,。
視覺是一個感知的過程,,在視覺中我們經(jīng)歷了從黑白到彩色,再從模擬數(shù)字普清到高清的四次革命,。截至目前,,仍有很多應(yīng)用場景都以2D為主,2D拍攝到的是平面信息,,沒有辦法獲取空間的三維結(jié)構(gòu),。因此眼下2D也達(dá)到了瓶頸期,在消費電子,、以VR/AR為助視體驗,、以及裸眼3D都在不斷地向3D做升級。我們生存在三維的立體空間,,我們希望通過3D攝像頭獲取到三維空間,,所以3D視覺是人工智能感知硬件的入口,能夠通過視覺的部分,,讓我們的硬件達(dá)到AI的感知到認(rèn)知,,最后實現(xiàn)決策的功能。
3D攝像頭正在成為智能設(shè)備的一個入口,,3D攝像頭特點在于除了能夠獲取平面圖像以外,,還可以獲得拍攝對象的深度信息,即三維的位置及尺寸信息,,其通常由多個攝像頭+深度傳感器組成,。3D攝像頭實現(xiàn)實時三維信息采集,為消費電子終端加上了物體感知功能,,從而引入多個“痛點型應(yīng)用場景”,,包括人機(jī)交互、人臉識別,、三維建模,、AR、安防和輔助駕駛等多個領(lǐng)域,,取得3D影像主要有四種方法,,包括立體視覺法、結(jié)構(gòu)光3D成像、雷射三角法以及ToF(光飛時間),。隨著蘋果iPhone集成了雙攝像頭后,,掀起攝像頭產(chǎn)業(yè)發(fā)展新浪潮,國內(nèi)外各大企業(yè)如英特爾,、微軟,、圖漾科技、奧比中光,、華捷艾米,、海康威視,、舜宇光學(xué),、樂行天下、縱目科技,、凌云光技術(shù),、弼智仿生已經(jīng)在電子產(chǎn)品等配置3D攝像頭。以英特爾RealSense為例,,其智能3D攝像頭主要有三部分組成:(1)傳統(tǒng)的2D攝像頭,;(2)近紅外圖像傳感器;(3)紅外激光發(fā)射器,。英特爾RealSense 3D攝像頭有兩種類型:一種是用于遠(yuǎn)距離、精度稍低的后置3D攝像頭,;另一種是用于近距離,、精度較高的前置3D攝像頭。