You are on page 1of 5

當 3D 視覺感知遇上微機電系統

──精細之眼,讓 AI 看懂世界

2017 年,隨著 iPhone X 首次搭載前置 3D 鏡頭作人臉辨識,「3D 視覺」成為新


科技寵兒,進入一般消費者的生活中。上(2020 年 4)月,iPad Pro 後置鏡頭採
用光達(LiDAR)模組,再次以領先的 3D 感知技術驚艷世界。

根據法國市場研究機構優樂發展(Yole Développement)報告顯示,全球 3D 成像
與感測市場在 2019~2025 年的複合年均增長率(compound annual growth rate,
CAGR)為 20%,且將在 2025 年超過市值 150 億美元;其中,消費與手機行業、
車用兩大領域將成長 4 倍,可推測 3D 感測的龐大市場潛力將在這幾年爆發。

究竟,何謂「3D 視覺感知」?是一個技術噱頭,還是真的會對我們現在的生
活,帶來新的科技革命?

定位需求帶來的立體革命

從簡單的物理角度來說,一個平面、一張照片即是 2D,每個像素點擁有 X 與 Y 軸
座標;而三維空間的每個立體點雲(point cloud)則是多了 Z 軸深度,從而使機器
得到被測物或空間的 3D 數據、認知完整的三維世界,進而實現定位。

TM
透過 3D 座標數據可以建立立體模型(由 OPUS 3DSLiM Apollo S 深度相機拍攝)

從技術的角度來說,不需事先進行路徑規劃,即能透過自身感測器採集環境的空間
數據、傳輸到演算法進行識別、並下指令避開障礙物,達成自主移動的目標。若
「獲取」且「被正確計算」的資訊量越大,機器判斷的準確性就越高。

然而,3D 視覺並非新技術,過去因為高昂的軟硬體成本,僅用於工業檢測、地形
測繪等少數領域,極少用到一般生活中。消費級市場的開端,可追溯到 2010 年微
軟 Xbox 推出 Kinect 體感遊戲,透過感測手勢、動作來進行互動,但十年前由於晶
片運算速度不夠、加上成本考量,應用場景止步於娛樂。

人工智慧對 3D 感測技術的影響

這幾年,因人工智慧(artificial intelligence, AI)快速發展、物聯網成為科技風口,


使 3D 感測技術再度掀起熱潮。簡單來說,如果 AI 是機器的大腦;3D 感測就是機
器的「眼睛」,透過 3D 感測器讓手機、機器人、汽車等智能終端跟人一樣具備辨
識週遭環境深度的能力,藉由 AI 讓智慧裝置具備自我判斷的意識、瞭解週遭環境
的事件、進而自主做出適當的決策指令,產生更多新興的智慧城市、智慧交通與智
能出行等應用場景,協助人類生活更便利、更省心。

而因應 AI+3D 感知技術,也掀起了新興產業鏈的波瀾,上下游廠商價格也因增


量、技術升級而得以受惠,包含硬體部分的控制晶片、處理器、紅外光雷射發射與
接收模組、光學鏡頭、CMOS(互補性氧化金屬半導體)影像感測器,以及軟體部
分的大數據分析、演算法、機器學習等。

讓 3D 感測再起的關鍵要角—
微機電系統中的微振鏡

其中,屬於微機電系統(micro electronical mechanical systems, MEMS)領域的微振鏡


(micro mirror)也因其微型化、集成化、低成本的元器件優勢被推向了趨勢風口,
成為當紅技術議題之一。其原理即是利用半導體製程工藝將矽基反射鏡面與驅動所
需的機械結構於晶片層級微型化,通過電子訊號控制,以靜電、電磁或是壓電方式
驅動,讓反射鏡面進行高速擺動,在晶片層級提供傳統機械掃描無法達成的功能,
包括高品質雷射反射掃描與高畫質掃描投影成像。這些功能可在 3D 感測領域實現
短距離的動態結構光(structured light)投影成像,中長距離下也可透過脈衝雷射以
飛時測距(time of flight, ToF)原理的高解析度 3D 光達。

OPUS 1D MEMS 微振鏡,以半導體工藝微型化電子與機電結構


據從 2003 年即投入 MEMS 振鏡領域的臺灣研發團隊先進微機電系統公司(Opus
Microsystems, OPUS)分享,MEMS 設計上需考慮的層面比起以電訊號為主的 IC 晶
片複雜許多,且在晶圓製程上並沒有標準流程能滿足不同 MEMS 的設計需求,是
一個需要與晶圓廠深度合作、累積足夠設計與製造經驗才能掌握的領域。

過去 MEMS 微振鏡主要應用於雷射列印與微投影,目前在 3D 深度感測、擴增實境


(augmented reality, AR)眼鏡應用上已經開始萌芽,接下來在汽車領域的 AR 抬頭
顯示器、智慧化雷射頭燈等都有很大的發展機會,OPUS 也從 2018 年重新佈局產品
策略,將自家累幾的三十多項 MEMS 相關發明專利運用到 3D 感知下的新興應用場
景。

高解析度、高精度 3D 人臉識別,賦能高安全性個人身份認證

3D 感知用於人臉識別領域,可以一秒認證、解鎖、啓動、支付,並阻絕利用圖
片、仿真面具欺騙電腦的可能性,實現真正的「個人認證」;若能採集到越多的臉
部特徵點,將能提供越高的安全保障。目前,iPhone 採用以繞射光學元件進行空間
編碼實現的散斑結構光技術,可以在一次掃描獲取 3 萬個點雲數據;而基於 MEMS
晶片的動態結構光,透過時間與空間同時編碼的原理目前能即時取得高達 100 萬個
數據,因此受到許多金融支付、安防、工業等領域企業的關注。

AR∕VR 應用於智慧型裝置,將助力商業應用爆發

國際大廠 Apple、Google 與 Facebook 等,近年來也經常傳出佈局 AR∕VR 軟硬體領


域的消息,而 3D 感知正是作為應用落地的最後一哩路。舉例而言,電商賣家可以
透過智慧型裝置將商品進行 3D 掃描以快速建模;買家則能以手機 3D 鏡頭感知空
間位置,將虛擬 3D 物件與真實環境做真實的互動,解決 AR 應用中虛擬物體飄浮
空中、與實際物體交疊的痛點。而 MEMS 可以透過不同的技術方案支持遠、近距
離的應用,在 50 公分內提供高解析度與高精度的 3D 建模,1.5 公尺內提供人臉、
手勢感知,並在 5 公尺內以光達技術實現全環境掃描感知。
TM
OPUS 3DSLiM Apollo S 可建立百萬級點雲數據、精度最高達 0.2 毫米的 3D 模型

機器深度視覺將成為智慧製造、自動化的關鍵

2019 年 5G 正式商用化,大量數據可藉由 5G 高帶寬、廣連接、低時延的優勢,讓


機器能擁有更精準的數據決策。然而,由於工業微米級 3D 相機高達數十萬元的成
本限制,工業機器在視覺這一塊始終居於一個細分市場。

然而,許多抓取、分揀、倉庫歸位與物流需求其實僅需「毫米級」精度即能完成。
為避免大材小用,多數工站選擇採用價格較低廉、但須事先編程、只能在固定路徑
完成工作的方案暫代。倘若這些設備都能安上深度感知的「眼睛」,將能自主找到
物品、規劃最適抓取路徑、自主進行裝配等工作,降低高精度、高重複性或高危險
性工作對人的依賴,讓生產更有效率。而基於 MEMS 技術開發的 3D 深度相機因其
微型化、低成本的優勢,正能切入這些需求,提供較低的入門門檻,加速工業製造
邁向智慧化。

MEMS 光達為無人駕駛的核心 3D 感知部件

若通過測量脈衝雷射光從發射到接收回來的時間差,換算成前方物體的相對距離與
速度,就能賦予汽車 3D 深度感知的能力,感知所處道路環境進而自主判斷停行。
隨著 Google、特斯拉等科技巨頭的投入,無人駕駛成為科技新創的熱門賽道。而基
於 MEMS 微鏡的光達是目前普遍認為性能、成本、商業化時間上較可行的方案,
除了沒有機械式多線光達架構複雜、機械易產生磨耗等問題,透過單一 MEMS 晶
片將雷射以柵式掃描方式覆蓋三維空間達到水平 0.1 度、垂直 0.15 度的高解析度,
大幅簡化機械式多線 3D 光達的製造困難,也提升光達環境感知解析能力。OPUS
曾提到,因 MEMS 受到眾多自動駕駛公司關注,目前也接到非常多相關技術合作
接洽,可說是風口上的核心元器件。
OPUS 80 線 MEMS 光達,可清楚辨識前方人體、障礙物

新科技將重新定義未來生活

隨著科技帶來的便利成為世人對未來生活的美好想像,新興科技不再僅限於學術領
域,而是盡其所能地快速落地、服務於人類生活中。當機器有了更精準的視覺,具
備辨識遠、近空間的特性,將具備自主移動能力。未來,電影裡的人機互動、高智
慧萬物聯網不僅會成為日常,透過科技改善生活,將重新打造我們的生活模式。

You might also like