特别黄的视频免费播放-亚洲欧美不卡高清在线-男女羞羞无遮掩视频免费网站-国产精品奶水无码视频免费-久久久久无码精品国产

機器視覺的發(fā)展關鍵:深度感應和3D傳感技術
2023-02-16
文章詳情


什么是人類視覺能做到而計算機視覺所不能的?人類從三個維度感知世界,而深度傳感器是實現(xiàn)更高級別機器視覺并釋放自動駕駛功能的關鍵。

在傳感技術最新發(fā)展的助力之下,越來越多的機器被賦予了感知、行動及與環(huán)境交互的能力。EE Times Europe團隊對當前3D視覺格局進行了研究,以期更清晰地了解其市場驅動因素、元器件供應商面臨的機遇和挑戰(zhàn),以及實現(xiàn)更高級別深度敏感度的新興技術。

往縱深發(fā)展

根據(jù) Yole Développement 的數(shù)據(jù),在模塊層面,3D 傳感市場目前市值為 68億美元,將以 15% 的復合年增長率增長,到 2026 年預計達到 150 億美元。

由于華為被禁,而且安卓陣營事實上放棄了3D傳感技術,因此在移動和消費這類主要驅動市場的增長將有暫時的中斷,Yole Développement 光學和傳感部門首席分析師Pierre Cambou告訴EE Times Europe。但另一方面,他又補充道,蘋果通過在 iPad 和 iPhone 中添加LiDAR 傳感器又加速了這一趨勢。

3D在汽車領域的應用也在加速。LiDAR 傳感器和座艙內 3D 攝像頭越來越多地被采用,我們對汽車市場的 3D 傳感發(fā)展非常樂觀,未來五年其市值應該會翻四倍。(如圖1)

圖1:Yole預計汽車市場的3D傳感市值將在未來五年內翻四倍

截至目前,較為流行的3D成像技術包括立體視覺、結構光和飛行時間(ToF)。

Cambou指出,立體視覺在10米以外的遠程傳感應用中表現(xiàn)極佳,例如大疆等公司提供的消費級無人機和梅賽德斯、捷豹和斯巴魯?shù)溶囆椭械那耙旳DAS 攝像頭。

結構光技術一直是1米以內短距離傳感的首選方案。典型應用案例如蘋果iPhone將其用于前置面部識別。該技術也用于某些工業(yè)應用中,如被Photoneo等公司采用。

Cambou還提到,TOF系統(tǒng)主要用于中程測距,目前主要有兩種方法。一種是間接 ToF,2019 年和 2020 年,間接 ToF 被應用于來自華為、三星和 LG 等廠商的Android 手機的背面,主要用于拍照。另一種是直接ToF,蘋果在其最先進的智能手機中采用了直接ToF方法。

Cambou 指出,直接ToF是LiDAR 中已經采用的技術(如Velodyne、Innoviz、Ibeo、Hesai 和 RoboSense等公司的產品),但最終可能會在接收側使用矩陣形傳感器。這類傳感器由于來自自動駕駛市場的激勵,正在取得進展。

EELs 還是 VCSELs?

LiDAR 技術捕捉整個場景的能力使其在機器視覺應用中極具價值。獲取三維點云最常用的兩種系統(tǒng)為閃光LiDAR和掃描LiDAR。Ams-Osram全球營銷經理 Matthias Hoenig 表示,在掃描 LiDAR 系統(tǒng)中,聚焦脈沖激光束通過機械旋轉鏡或微機電系統(tǒng) (MEMS) 鏡定向到某個小的立體角。

由于高功率激光束可以被控制發(fā)射到很小的立體角,因此與使用 3D 閃光系統(tǒng)可達到的距離相比,使用光學功率器件可達到的距離要遠得多。邊緣發(fā)射激光器 [EEL] 是這種系統(tǒng)架構的理想產品,它通過一個很小的發(fā)射區(qū)域在極小空間內提供大量的光,因此在功率和射程方面均表現(xiàn)出色。Hoenig指出。

現(xiàn)在已成為Ams子公司的歐司朗宣布,隨著封裝溫度在應用過程中上升,其激光器在波導穩(wěn)定性方面最近取得了不少進展,該公司目前正在探索面向LiDAR 應用的具有更多波長的產品。

Yole 預測,就激光二極管而言,EEL是目前最大的市場機會,但垂直腔面發(fā)射激光器 (VCSEL) 將會在未來迅速趕上。VCSEL可以將紅外 LED 的高功率密度和簡單封裝優(yōu)點與激光器的光譜寬度和速度結合起來。

這項技術的優(yōu)勢包括出色的光束質量、簡單的設計和小尺寸,這也解釋了 VCSEL市場增長的原因,Hoenig說。雖然它們比 EEL 發(fā)射器需要更多的板載空間,但在某些應用領域又具有優(yōu)勢。他解釋到,例如,VCSEL所具有的輻射特性使其尤其適用于閃光 LiDAR 系統(tǒng)以及工業(yè)應用(如機器人和物流車輛等)中的主動立體視覺。

至于VCSEL相關的技術挑戰(zhàn),Hoenig 表示,Ams-Osram 正在研究更高的光輸出。繼2018 年收購 Vixar 之后,歐司朗相繼展示了比單結 VCSEL 效率更高、速度更快的雙結和三結VCSEL技術。在今年的美國西部光電展(Photonics West)上,又推出了基于多結技術的 PowerBoost VCSEL 產品組合。該公司表示,他們還在探索改善散熱的各種方法,例如,從頂部發(fā)射組件改為底部發(fā)射組件。

Ams-Osram高級營銷經理 Lei Tu 表示,所有常見的 3D 傳感方法都依賴于各種系統(tǒng)構建模塊之間的順暢交互。通常,這些系統(tǒng)由光源、特殊光學器件、檢測器和相應處理檢測信號的下游軟件組成。她還說,未來,對Ams-Osram這樣的元件制造商來說,重點將在以最佳方式滿足客戶的要求。

這包括組件的小型化、光學性能和使用壽命的優(yōu)化,當然還有易用性。 Tu補充道,有些客戶喜歡現(xiàn)成的即插即用解決方案,而另一些客戶則更傾向于自己組裝單個元件,或借助第三方將它們組裝成完整的解決方案。

用于盲點檢測的深度和側面感應

深度感知是指從三個維度看物體并測量物體距離的能力。LiDAR無疑充當了自動駕駛汽車的眼睛,許多汽車制造商都利用它來構建車輛周圍環(huán)境的 3D 地圖。不過,開發(fā)工作主要還是集中在具有較長檢測范圍(超過 200 米)但視野相對狹窄(約 20°至30°)的前置 LiDAR 系統(tǒng)。

2019年從德國Fraunhofer硅技術研究所 (ISIT) 獨立出來的OQmented 公司正在努力改變這種狀況。該公司表示,他們已開發(fā)出一種 MEMS 鏡技術,可以使側面 LiDAR 具有 180°視野。

OQmented 創(chuàng)始人兼董事總經理 Ulrich Hofmann 表示,側視 LiDAR 系統(tǒng)主要針對短距離盲點檢測。盲點檢測是一項重要的安全功能,它使短距離側掃系統(tǒng)比遠視系統(tǒng)更有意義。

例如,在進入一個十字路口時,您需要這些LiDAR觀察系統(tǒng)在短距離范圍進行觀察,因為這種環(huán)境中的行人、騎自行車的人和汽車都很多,很容易混亂并發(fā)生意外。出于這個原因,不僅在廣角上有清晰的視角很重要,較高的橫向分辨率也很重要,它可以區(qū)分不同的物體,包括靜態(tài)和移動的物體。

與平面玻璃蓋不同,OQmented 在其 MEMS 鏡器件頂部放置了一個曲面玻璃蓋,用來實現(xiàn)激光束出入的封裝,并實現(xiàn) 180°激光掃描。(見圖2)Hofmann稱,這種Bubble MEMS專利技術不僅提供了密封真空封裝和保護,可以免受環(huán)境污染物的影響,而且還確保了激光束成功地傳入和傳出封裝,因為激光束與玻璃的角度始終垂直。

而使用平面玻璃蓋時,情況就并非總是理想了。當掃描角度較大時,部分光線會在蓋子處反射回封裝中。Hofmann指出,這對于任何類型的LiDAR 解決方案都是不可接受的。

圖2:Bubble MEME 技術的命名來源于OQmented MEMS 鏡器件上方的曲面玻璃蓋

更接近數(shù)據(jù)源

圖像傳感器會生成大量的數(shù)據(jù)。盡管目前大部分處理都在云端或中央處理單元完成,但其發(fā)展趨勢是使計算更接近數(shù)據(jù)源,并將智能因素嵌入傳感器內部或附近。

Yole 公司的 Cambou 表示,通常情況下,數(shù)據(jù)采用H264技術壓縮,這意味著它可以通過 100 Mbps 的帶寬傳輸。但在傳感領域,數(shù)據(jù)流通常要大 10 到 100 倍——典型機器視覺數(shù)據(jù)流可達到1 Gbps ——而且,如果同時使用 10 個攝像頭,則很快會達到 10 Gbps 甚至更高。

由于CPU 不堪重負,靠近傳感器進行數(shù)據(jù)處理的必要性越來越大。如果需要,所有預處理、清理和 AI 增強都必須在更靠近傳感器的位置進行,以減輕 CPU 的負擔。

但是,目前還幾乎沒有計算能夠在傳感器本身進行,因為這會產生熱量,Cambou指出。

前景展望

圖像傳感器是推動自動駕駛的一個關鍵因素,但卻不能無限制地添加;因為它所需要的計算能力也會激增。Yole的分析師表示,有一種解決方案是提高數(shù)據(jù)質量。但如果真的想解決自動駕駛問題,我們很快就會需要更多樣化的解決方案。

新技術不斷涌現(xiàn),用以提高靈敏度并構建可以看得更清楚的機器。Cambou 指出了兩個方向:神經擬態(tài)感知,即每個像素都充當神經元并嵌入一定程度的智能;以及量子成像,即單獨檢測每個光子。

總部位于法國的神經擬態(tài)初創(chuàng)公司 Prophesee 推出了基于事件的工業(yè)級視覺傳感器:第三代 Metavision 傳感器。Prophesee 產品營銷和創(chuàng)新總監(jiān) Simone Lavizzari 表示:如果將Metavision 傳感器與 VCSEL 投影儀或其它可以投射合適圖案的投影儀結合使用,就可以實現(xiàn)基于事件的結構光傳感器。 也就是說,當今最先進的深度傳感技術在曝光時間、精確度和穩(wěn)健性之間取得了平衡。

Lavizzari 說,將 IR 投影儀與 Prophesee 的 Metavision 傳感器相結合,可為每個獨立像素提供快速響應時間,進而允許直接在傳感器內部進行時間模式識別和提取。

如果采用基于事件的傳感器來做結構光,響應會非常快。我們可以將掃描時間提高 50 倍,只需1 毫秒就能獲得完整的 3D 掃描,而傳統(tǒng)基于幀的方法則需要10 到 33 毫秒。其精確度也是最高標準的,但軟件復雜度已降至最低,因為不需要在后處理中做匹配工作。

匹配不是在事件發(fā)生后在幀上完成,而是在傳感器級逐個像素完成。Lavizzari說,其中一個優(yōu)勢是,它沒有運動模糊,因為可以非??焖俚夭东@點云,而且與戶外應用兼容。 超快脈沖檢測不僅可以提高功率,同時還能保持該技術的人眼安全等級。

在量子成像方面,Cambou 提到了 Gigajot Technology 的 Quanta Image Sensors (QIS),這是一款具有光子計數(shù)能力的單光子圖像傳感器。Gigajot是一家總部位于美國加州的初創(chuàng)公司,他們聲稱可以每幀每像素 1個光子的光子級別從一系列幀中重建動態(tài)場景。

文章來源: 電子工程專輯,傳感器專家網

010-82788940

(工作日 9::00-18:00)