Professional Documents
Culture Documents
──精細之眼,讓 AI 看懂世界
根據法國市場研究機構優樂發展(Yole Développement)報告顯示,全球 3D 成像
與感測市場在 2019~2025 年的複合年均增長率(compound annual growth rate,
CAGR)為 20%,且將在 2025 年超過市值 150 億美元;其中,消費與手機行業、
車用兩大領域將成長 4 倍,可推測 3D 感測的龐大市場潛力將在這幾年爆發。
究竟,何謂「3D 視覺感知」?是一個技術噱頭,還是真的會對我們現在的生
活,帶來新的科技革命?
定位需求帶來的立體革命
從簡單的物理角度來說,一個平面、一張照片即是 2D,每個像素點擁有 X 與 Y 軸
座標;而三維空間的每個立體點雲(point cloud)則是多了 Z 軸深度,從而使機器
得到被測物或空間的 3D 數據、認知完整的三維世界,進而實現定位。
TM
透過 3D 座標數據可以建立立體模型(由 OPUS 3DSLiM Apollo S 深度相機拍攝)
從技術的角度來說,不需事先進行路徑規劃,即能透過自身感測器採集環境的空間
數據、傳輸到演算法進行識別、並下指令避開障礙物,達成自主移動的目標。若
「獲取」且「被正確計算」的資訊量越大,機器判斷的準確性就越高。
然而,3D 視覺並非新技術,過去因為高昂的軟硬體成本,僅用於工業檢測、地形
測繪等少數領域,極少用到一般生活中。消費級市場的開端,可追溯到 2010 年微
軟 Xbox 推出 Kinect 體感遊戲,透過感測手勢、動作來進行互動,但十年前由於晶
片運算速度不夠、加上成本考量,應用場景止步於娛樂。
人工智慧對 3D 感測技術的影響
讓 3D 感測再起的關鍵要角—
微機電系統中的微振鏡
高解析度、高精度 3D 人臉識別,賦能高安全性個人身份認證
3D 感知用於人臉識別領域,可以一秒認證、解鎖、啓動、支付,並阻絕利用圖
片、仿真面具欺騙電腦的可能性,實現真正的「個人認證」;若能採集到越多的臉
部特徵點,將能提供越高的安全保障。目前,iPhone 採用以繞射光學元件進行空間
編碼實現的散斑結構光技術,可以在一次掃描獲取 3 萬個點雲數據;而基於 MEMS
晶片的動態結構光,透過時間與空間同時編碼的原理目前能即時取得高達 100 萬個
數據,因此受到許多金融支付、安防、工業等領域企業的關注。
AR∕VR 應用於智慧型裝置,將助力商業應用爆發
機器深度視覺將成為智慧製造、自動化的關鍵
然而,許多抓取、分揀、倉庫歸位與物流需求其實僅需「毫米級」精度即能完成。
為避免大材小用,多數工站選擇採用價格較低廉、但須事先編程、只能在固定路徑
完成工作的方案暫代。倘若這些設備都能安上深度感知的「眼睛」,將能自主找到
物品、規劃最適抓取路徑、自主進行裝配等工作,降低高精度、高重複性或高危險
性工作對人的依賴,讓生產更有效率。而基於 MEMS 技術開發的 3D 深度相機因其
微型化、低成本的優勢,正能切入這些需求,提供較低的入門門檻,加速工業製造
邁向智慧化。
若通過測量脈衝雷射光從發射到接收回來的時間差,換算成前方物體的相對距離與
速度,就能賦予汽車 3D 深度感知的能力,感知所處道路環境進而自主判斷停行。
隨著 Google、特斯拉等科技巨頭的投入,無人駕駛成為科技新創的熱門賽道。而基
於 MEMS 微鏡的光達是目前普遍認為性能、成本、商業化時間上較可行的方案,
除了沒有機械式多線光達架構複雜、機械易產生磨耗等問題,透過單一 MEMS 晶
片將雷射以柵式掃描方式覆蓋三維空間達到水平 0.1 度、垂直 0.15 度的高解析度,
大幅簡化機械式多線 3D 光達的製造困難,也提升光達環境感知解析能力。OPUS
曾提到,因 MEMS 受到眾多自動駕駛公司關注,目前也接到非常多相關技術合作
接洽,可說是風口上的核心元器件。
OPUS 80 線 MEMS 光達,可清楚辨識前方人體、障礙物
新科技將重新定義未來生活
隨著科技帶來的便利成為世人對未來生活的美好想像,新興科技不再僅限於學術領
域,而是盡其所能地快速落地、服務於人類生活中。當機器有了更精準的視覺,具
備辨識遠、近空間的特性,將具備自主移動能力。未來,電影裡的人機互動、高智
慧萬物聯網不僅會成為日常,透過科技改善生活,將重新打造我們的生活模式。