Email:[email protected]
(一)“活在三維空間,、困于二維信息”的難題,,將在5G時代得到解決
在現(xiàn)實世界中,我們通過鍵盤,、鼠標(biāo)等設(shè)備與PC進(jìn)行交互,,通過觸屏方式與移動設(shè)備進(jìn)行交互,這些都是建立在二維世界的2D界面交互,。而在VR虛擬現(xiàn)實的世界,,2D交互顯然遠(yuǎn)遠(yuǎn)不足以滿足“沉浸感”的需求,這就要求交互方式要全面的顛覆:從傳統(tǒng)2D交互升級為用多種方式(動作捕捉,、手勢控制,、眼球追蹤、觸覺反饋、語音交互,,甚至腦電波)與多維信息環(huán)境的3D立體交互,。3D視覺是計算機視覺的終極體現(xiàn)形式,2D視覺技術(shù)主要在二維空間下完成工作,,三維信息基本上沒有得到任何利用,,而三維信息才真正能夠反映物體和環(huán)境的狀態(tài),也更接近人類的感知模式,。近年來,,學(xué)術(shù)界和工業(yè)界推出了一系列優(yōu)秀的算法和產(chǎn)品,被廣泛應(yīng)用到各個領(lǐng)域,。
視覺是一個感知的過程,,在視覺中我們經(jīng)歷了從黑白到彩色,再從模擬數(shù)字普清到高清的四次革命,。截至目前,,仍有很多應(yīng)用場景都以2D為主,2D拍攝到的是平面信息,,沒有辦法獲取空間的三維結(jié)構(gòu),。因此眼下2D也達(dá)到了瓶頸期,在消費電子,、以VR/AR為助視體驗、以及裸眼3D都在不斷地向3D做升級,。我們生存在三維的立體空間,,我們希望通過3D攝像頭獲取到三維空間,所以3D視覺是人工智能感知硬件的入口,,能夠通過視覺的部分,,讓我們的硬件達(dá)到AI的感知到認(rèn)知,最后實現(xiàn)決策的功能,。
3D攝像頭正在成為智能設(shè)備的一個入口,,3D攝像頭特點在于除了能夠獲取平面圖像以外,還可以獲得拍攝對象的深度信息,,即三維的位置及尺寸信息,,其通常由多個攝像頭+深度傳感器組成。3D攝像頭實現(xiàn)實時三維信息采集,,為消費電子終端加上了物體感知功能,,從而引入多個“痛點型應(yīng)用場景”,包括人機交互,、人臉識別,、三維建模、AR、安防和輔助駕駛等多個領(lǐng)域,,取得3D影像主要有四種方法,,包括立體視覺法、結(jié)構(gòu)光3D成像,、雷射三角法以及ToF(光飛時間),。隨著蘋果iPhone集成了雙攝像頭后,掀起攝像頭產(chǎn)業(yè)發(fā)展新浪潮,,國內(nèi)外各大企業(yè)如英特爾,、微軟、圖漾科技,、奧比中光,、華捷艾米、??低?、舜宇光學(xué)、樂行天下,、縱目科技,、凌云光技術(shù)、弼智仿生已經(jīng)在電子產(chǎn)品等配置3D攝像頭,。以英特爾RealSense為例,,其智能3D攝像頭主要有三部分組成:(1)傳統(tǒng)的2D攝像頭;(2)近紅外圖像傳感器,;(3)紅外激光發(fā)射器,。英特爾RealSense 3D攝像頭有兩種類型:一種是用于遠(yuǎn)距離、精度稍低的后置3D攝像頭,;另一種是用于近距離,、精度較高的前置3D攝像頭。