VR/AR/腦機接口是集合了微顯示、傳感器、芯片和算法等多項技術在內的下一代人機交互平臺?;仡櫿麄€人機交互發(fā)展歷程,我們看到人機交互的指令輸入形式和反饋輸出形式都在朝著更低的操作門檻和更高的交互效率演變。當前我們正站在智能手機時代和下一個交互形態(tài)的交界處,我們認為盡管 VR/AR 在輸入技術(傳感)和輸出技術(顯示)方面均較上一代交互設備有顯著飛躍,但目前仍處于發(fā)展的早期階段。隨著元宇宙應用的發(fā)展和內容生態(tài)的完善,元宇宙對硬件的需求逐步清晰,將推動 VR/AR/腦機接口設備的逐步升級,最終有望出現可以和 PC、智能手機媲美的下一代硬件。
本期的智能內參,我們推薦華泰證券的報告《人機交互系統(tǒng)是通往元宇宙的入口》,分析VR、AR和腦機接口設備在元宇宙時代的發(fā)展趨勢。
來源 華泰證券
原標題:
《人機交互系統(tǒng)是通往元宇宙的入口》
作者:黃樂平 等
一、元宇宙場景落地,定義下一代 VR/AR/腦機接口升級方向
隨著元宇宙應用場景的清晰化,未來 VR/AR/腦機接口的發(fā)展方向逐漸明確。早期的硬件設備受制于應用場景和內容單一化、用戶對硬件設備的體驗不完善等缺陷,初代VR/AR 并未實現大規(guī)模增長。當前時點,我們看到游戲、電商、協(xié)同辦公、社交、健身、醫(yī)療、視頻和模擬訓練(教育)等元宇宙應用場景正逐漸清晰,這對 VR/AR/腦機接口硬件端提出了更高的需求,有望驅動包括微顯示技術、三維重建、生物傳感器、肌電/腦電處理、全身追蹤、空間定位在內的多項底層技術不斷完善。
元宇宙各大應用場景對沉浸感和交互感的要求
元宇宙時代的應用比移動互聯(lián)網時代更強調沉浸感和交互感,不同應用對兩種效果的側重各有不同。其中,沉浸感可通過更豐富的音畫效果和更多維度的感官交互獲得,例如借助場景渲染、沉浸聲場、溫度模擬、觸覺傳感等技術營造出逼真的虛擬場景,使大腦產生“身臨其境”的感覺;交互感則需借助多樣化的輸入方式來降低人機交互的操作門檻,例如直接通過識別語音或讀取手勢來傳達指令,無需打字或操作鍵鼠/按鈕,增強互動效率。
1、游戲:強調“沉浸感”的元宇宙游戲需要多平臺/VRAR/云原生技術作為底層技術支撐
當前游戲已具備元宇宙所擁有的虛擬身份、朋友、經濟系統(tǒng)等特點,但未能給玩家完全帶來“沉浸感”,硬件方面主要受制于近眼顯示和多維感官傳感技術不夠成熟。未來,元宇宙游戲將朝著更強的沉浸感與更豐富的內容生態(tài)方向發(fā)展,需要借助成熟的場景渲染和沉浸聲場技術增強聲畫效果,借助全身運動追蹤、傳感器、空間定位等技術增強臨場感。我們認為優(yōu)質的游戲內容創(chuàng)新將與 VR/AR 硬件升級互相形成正反饋效應,促進元宇宙游戲生態(tài)的發(fā)展,并為高性能計算芯片、硅基 OLED、Micro LED 以及相關設備組裝企業(yè)帶來增量空間。
元宇宙游戲發(fā)展方向及底層技術
2、電商:虛實交融的沉浸式購物模式為近眼顯示、AI 芯片、傳感器帶來發(fā)展機遇
傳統(tǒng)電商平臺仍主要以圖片和視頻等平面化形式展示商品。盡管近年來電商直播、AR 試妝等形式興起,一定程度上彌補了傳統(tǒng)電商在購物時較為單薄的觀感體驗,然而對于服飾等SKU 豐富的非標品類商品,用戶仍然無法對其進行在線試品。在“在線即在場”的終極需求驅動下,元宇宙時代的電商有望進一步突破物質世界屏障,通過 AR/VR/MR 等新一代人機交互平臺實現視聽甚至觸覺等多感官交互的購物體驗,創(chuàng)造如 3D 虛擬商場、數字展館等消費者購買場景。我們認為這一進程主要依賴于近眼顯示、三維重建、觸覺傳感乃至虛擬人等技術的成熟,將為相關微顯示、傳感器、芯片企業(yè)帶來增長空間。
元宇宙電商有望借助 VR/AR/MR 實現“在線即在場”的沉浸式購物體驗
3、協(xié)同辦公/社交:借助手勢追蹤、語音識別、眼動追蹤、虛擬化身實現互動感
未來元宇宙辦公/社交有望突破物理空間的局限,將帶來最接近實地面對面的工作和交友體 驗,提升辦公生產、溝通、協(xié)作效率。當前移動互聯(lián)網階段的遠程辦公距離理想模式有一定差距,工作效率與溝通效果仍存在局限性。而元宇宙辦公/社交則強調互動感,例如,用戶可以全程通過手勢操作,即可滿足在 VR 虛擬空間中舉手、豎大拇指點贊等功能,顯著降低人機交互平臺操作門檻,同時實現無距離感互動。這一場景的實現將主要借助手勢讀取、眼動追蹤、語音識別、空間定位等 VR/AR 底層技術。
4、醫(yī)療與健康:VR/AR/腦機硬件將搭載先進生物監(jiān)測以及腦電信號處理技術
在 VR/AR 方面,盡管目前已出現了拳擊、攀巖、球類運動等輔助健身的應用,欠佳的硬件佩戴體驗卻限制了用戶使用時長。一方面,VR 設備的眩暈感仍未完全消除,運動健身應用中高速變換的場景將進一步加劇不適感;另一方面,目前主流 VR 頭顯的重量大多在 300g以上,VR 一體機甚至普遍超過 500g,大大增加了佩戴者運動時的負擔。因此,顯示技術和輕薄化是硬件廠商重點攻克的方向,我們看好具有超輕薄、高清晰度、低功耗、低延遲等特點的硅基 OLED(索尼、視涯等),以及具有無感佩戴且不妨礙正常視線優(yōu)勢的入眼式AR 設備(InWith 和 Mojo Vision 等)的發(fā)展機會。
在生物監(jiān)測方面,當前隨著心率監(jiān)測、血氧檢測技術的成熟,已有部分智能手環(huán)和手表產品中引入了醫(yī)療級功能,我們認為向著更專業(yè)的醫(yī)療設備進化將是智能穿戴重要發(fā)展方向。未來,智能穿戴產品有望大規(guī)模搭載 ECG 心電圖以及無創(chuàng)血糖檢測等新功能,針對老年群體、慢病群體提供更專業(yè)的服務,這也對血糖、血氧等生物監(jiān)測技術提出了更高的要求。長期來看,人機交互硬件在醫(yī)療與健康領域有望拓展到服務神經系統(tǒng)和肌肉系統(tǒng)癱瘓的患者(如腦、脊髓疾病、中風、外傷等),這一需求將為腦機接口技術創(chuàng)造可觀的發(fā)展前景。
生物檢測與輔助健身場景
5、視頻:VR/AR 技術帶來高沉浸感的流媒體觀賞體驗
傳統(tǒng)影視作品、長視頻與短視頻仍主要通過電視、影院、視頻平臺等媒介傳播,受制于平面化的表現形式,內容的表現力仍有較大提升空間。元宇宙時代,觀眾有望使用先進 VR/AR設備更沉浸地觀看電影、現場實況、音樂會等內容,娛樂性與體驗感將迎來質的飛躍。目前包括 Netflix 和愛奇藝在內的長視頻平臺已對“元宇宙+視頻”的落地做出了積極探索,例如 Netflix 為美劇《怪奇物語》推出 VR 體驗,愛奇藝推出主打觀影功能的手機盒子。借鑒移動互聯(lián)網時代對短視頻生態(tài)的孵化歷程,元宇宙作為互聯(lián)網的下一站,也為視頻創(chuàng)作提供了新的可能性,例如通過建模、動作捕捉、人工智能制作出的虛擬人物能夠參演影視劇集,影視與視頻內容創(chuàng)作有望迎來新的高光期。
6、模擬訓練/教育:將實現虛擬空間中對實體環(huán)境的仿真映射
模擬訓練是指將現實中的場景復刻到虛擬世界中,應用于軍事訓練、工業(yè)設計、教學訓練、安全應急演練等較為復雜或具有高危險系數的領域。工業(yè)領域中,制造業(yè)企業(yè)將在仿真虛擬空間中充分利用各類數據,優(yōu)化工業(yè)生產環(huán)節(jié)中的設備工藝和作業(yè)流程。軍事和安全應急領域均有進行模擬演練的需求,未來有望在虛擬場景開展更大規(guī)模和更復雜的軍事和應急訓練,實現節(jié)省訓練成本、提高安全性的目的,如曼恒科技研發(fā)出上海浦東機場的 VR 火災應急演練系統(tǒng),使用 VR 和 5G 云渲染技術模擬機場火災突發(fā)事件及機場消防員在危險場景下如何開展消防應急救援,幫助提升機場系統(tǒng)整體應急能力。鑒于模擬訓練用途的特殊性,其對沉浸感和交互感的要求相對而言較低,無需依賴高端硬件設備加成,目前已有曼恒科技、壹傳誠等企業(yè)實現了商業(yè)化。
二、AR/VR:下一代人機交互平臺
VR 是 Virtual Reality(虛擬現實)的縮寫,指計算機圖形技術、計算機仿真技術、傳感器技術、顯示技術等多種科學技術,在多維信息空間上創(chuàng)建一個虛擬信息環(huán)境,提供使用者關于視覺、聽覺、觸覺等感官的模擬,能使用戶具有身臨其境的沉浸感,具有與環(huán)境完善的交互作用能力的一種嶄新的人機交互手段。
目前常見的 VR 由頭戴式顯示設備和手柄組成。其中,頭戴式顯示設備集成了顯示、計算、傳感器等設備,通過將人對外界視覺、聽覺的封閉,并由左右眼屏幕分別顯示左右眼的圖像,引導用戶產生一種身在虛擬環(huán)境中的立體感。而手柄則負責輔助追蹤使用者手的位置、提供交互使用的按鍵,以及簡單的觸覺震動反饋。
VR 頭顯經歷 VR 盒子、VR 頭盔、VR 一體機三階段,爆款產品持續(xù)主導硬件消費市場。 2Q21 全球 VR 產品出貨量達 212.6 萬臺,同比增長 136.4%,其中 Oculus Quest 2 出貨量占 75%,持續(xù)主導市場。從 2014 年開始,行業(yè)銷量由爆款產品主導的特點仍然沒有變化(2015-2017 年三星 VR 盒子、2016-2018 年 PS VR、2019 年至今 Oculus 一體機)。
VR 歷史銷量:VR 盒子、VR 頭盔、VR 一體機持續(xù)迭代
主流 VR 產品比較
2022 年 VR 將迎來一波創(chuàng)新技術潮流, MetaVR 產品迎來升級,蘋果推出高端產品。根據digitimes,推測 Meta 下一代 VR 升級產品將于明年推出,將引入 pancake 光學模組和更多傳感器,以實現產品輕量化,并升級手勢識別、眼動跟蹤等功能;而蘋果也將在 2022年底推出一款高端 VR 方案,這款高端產品能夠會重新定義 VR 這個產品形態(tài)。我們預計這款產品將配備 Micro-OLED 顯示屏,復合菲涅爾透鏡 pancake 方案,全彩影像透視、搭載更多傳感器,為消費者帶來全新混合現實體驗。
Pancake 短焦光學是公認的下一代 VR 升級方向,使 VR 頭顯更加輕薄。在 Meta 較早的pancake 技術專利中,我們可以看見一個顯示組件包括具有四分之一波片和部分反射表面的第一透鏡、具有反射偏振器的第二透鏡和顯示器,實現頭顯的輕薄化。我們認為,蘋果同樣在探索使用三個菲涅爾透鏡堆疊,形成輕薄透鏡組的方案。改進光學透鏡后的 VR 產品將實現輕薄化,頭顯重量或由原來的 500g 降低至 200-300g。
Meta 下一代 VR 產品與蘋果 MR 產品將會增加傳感器,主要是攝像頭的種類與數量。高通在其官網上披露,高通驍龍 XR2 芯片算力最多可支持 7 顆攝像頭(2 顆眼動追蹤,2 顆混合現實,2 顆頭部 6DoF追蹤,1 顆其他),并可以此實現 MR 混合現實功能。我們認為 Meta 下一代或充分利用驍龍 XR2 算力,為產品進行功能升級。
蘋果或將搭載更多傳感器,為各類應用提供豐富數據。根據 digitimes 等雜志 2022 年 1 月中旬的報道,蘋果或將搭載與 M1 芯片相似算力高階處理器和一個負責傳感器的低階處理器,支持 5-8 個外置相機模組,2 個內置眼動追蹤相機模組,1-2 個 ToF 攝像頭,以實現全彩RGB 影像透視和眼動追蹤、手勢追蹤等功能,實現內容與應用邊界的拓展,也為內容生產商提供更多的數據支持。
為 Meta 下一代或沿用 FastLCD 屏幕,與 quest 2 分辨率差別不大,但具有像素級控制的先進背光,可以展示和 OLED 一樣的純黑底色;而蘋果或使用高分辨率、高對比度、寬色域、快速響應的 Micro-OLED 顯示屏,隨之而來的或是高昂的售價,根據Digitimes 等媒體 2022 年 1 月中旬的報道,新一代蘋果 MR 產品售價可能達到 1500-3000美元,高于當前 Oculus quest 2 的最低售價 299 美元。
三、AR:產品處于概念期,Micro-LED + 衍射光波導技術突破被寄予厚望
AR(Augmented Reality,增強現實)是促使真實世界信息和虛擬世界信息內容之間綜合在一起的較新的技術內容,與 VR 不同的是,AR 能夠將真實環(huán)境和虛擬物體之間重疊之后,在同一個畫面以及空間中同時存在。AR 中的關鍵技術包括跟蹤定位技術、虛擬與現實合并技術、顯示技術與交互技術。
目前 AR 眼鏡也可以分為一體式和分體式,從出貨量看當前一體式為主流。分體式指計算單元或電池等結構與頭顯分開,如 Nreal 頭顯支持通過 type-C 接口與智能手機、PC 連接,允許將智能手機中、PC 的內容無縫傳輸到眼鏡中,用戶可以在其中查看內容。而一體式AR 產品則將顯示器、傳感器、計算、人類理解、環(huán)境理解等系統(tǒng)集成在一個頭顯上,提供更便捷體驗。根據 IDC,1H21,AR 一體機出貨量占比達 70%,仍然為市場主流。
根據 IDC,2020-2021 年 AR 年出貨(不含Screenless viewer)在 20-30 萬之間,增速波動大。從品牌來看,除 Epson 和微軟外,其他較多品牌并沒有實現 AR 的持續(xù)大規(guī)模銷售,常常在 1-2 個季度的爆發(fā)后銷聲匿跡,消費端市場上沒能出現標桿性的品牌,我們認為 AR 作為一款消費電子產品仍然處于概念期階段。
長期來看 AR 終端有望替代手機,實現年出貨量超過 10 億臺(對比手機出貨量超過 13 億臺),但目前來看實現這個目標時日尚早。從應用看,AR 產品仍未出現殺手級的應用場景。從技術角度看,雖然OLED+Birdbath 方案已經比較成熟,但因透光性差等原因,形似墨鏡的設計不能支持全環(huán)境的使用。而其他微顯示系統(tǒng)如 LBS/LCoS/DLP 等搭配光波導的方案仍在探索過程中。
一款合格 AR 眼鏡需要怎樣的配置?
顯示:微顯示單元與光機模組決定亮度、對比度、刷新率、分辨率等指標。目前市場上 AR眼鏡的近眼顯示系統(tǒng)即使用微顯示器作為圖像源器件,由其產生圖像后投射到自由曲面/光波導等光學模組中,再進入人眼。由于 AR 像源產生的圖像將與太陽光一起進入人眼,戶外若不加墨鏡,入眼亮度需超過 2,000nits,甚至達到 5,000nits,才能在各種天氣狀況下清楚的顯示圖像。據我們估算,目前一款光波導眼鏡的光效率大約為 3-5%,即像源亮度至少要在10 萬 nits 左右,才能滿足 AR 眼鏡的亮度需求。此外,75Hz 以上的刷新率、25°視場下 720P的分辨率、支持局部刷新及低功耗狀態(tài)下靜態(tài)圖像的維持,是一款 AR 眼鏡的及格線。
人、機、環(huán)境的有效交互:SLAM+傳感器+AI 用于理解環(huán)境、理解使用者、實現虛擬信息和現實世界的結合。為了實現虛擬信息和真實場景的疊加,需要實現使用者的空間定位追蹤和虛擬物體在真實空間中定位。除此之外,為了將虛擬信息與輸入的現實場景無縫結合在一起,增強 AR 使用者的體驗,還需要考慮虛擬事物與真實事物之間的遮擋關系以及實現幾何一致、模型真實、光照一致和色調一致。從上世紀 80 年代發(fā)展到現在,SLAM 傳感器、算法、技術框架等持續(xù)改進,是實現自我姿態(tài)評價以及虛擬圖像反饋,構建人與虛擬內容的有效交互的主要手段。
微顯示技術: MicroLED 有望成為 AR 主流 。當前已提出的微顯示技術包括 OLED(有機發(fā)光二極管)/ LCoS(硅基液晶)/ DLP(數字光處理)/LBS(激光束掃描儀)等待,但這些技術均無法兼顧成熟性、性能、成本等指標。MicroLED 是業(yè)內公認的 AR 顯示最佳解決方案,但存在技術尚不成熟、量產難度大等問題,真正大面積商用可能要到 2025 年左右。
微顯示技術一覽
LCoS —— 限制較多,逐漸淡出 。LCoS 作為微顯示技術存在比較明顯的限制,逐漸淡出微顯示領域。LCoS 的優(yōu)勢在于技術成熟,成本低廉,像素密度高且功耗低,在早期的 AR 設備中應用較多,如靈犀微光靈犀AR(LCoS+幾何光波導),Magic Leap One (LCoS+衍射光波導)。但劣勢也相對明顯,如對比度較低,特別是在大入射角情況下;由于必須和 PBS 配合使用而限制了整體光機的小型化和輕量化進程(目前較小的 digilens 的 LCoS 光機體積為 2.5 立方厘米);低溫狀態(tài)下無法工作,環(huán)境適應性較差等。因此,大量廠商都在積極尋求使用 LBS/DLP 等方案代替 LCoS,2018 年以后搭載 LCoS 的新機型逐漸淡出。
硅基 OLED —— 亮度較低,目前難以應用于戶外 AR 場景。硅基 OLED 的缺點也比較明確,應用局限于 VR 及類似設備。目前市場上主流的硅基 OLED產品亮度均小于 3000nits,與 10 萬 nits 的要求相去甚遠,難以應用于戶外 AR 場景。同時,由于產品的生產工藝更加復雜,其價格比 LCoS 貴 50%以上,但使用壽命在高亮度模式下將低于 3000 小時且極有可能出現燒屏的情況,整體性價比更低。因此,雖已有部分 AR 廠商使用硅基 OLED 替代 LCoS,但其仍不是 AR 像源的最佳解決方案。
LBS —— 激光二極管對溫度敏感、分辨率較差。與 LCoS 等其他顯示技術相比,LBS 技術優(yōu)勢明顯。LBS 系統(tǒng)主要由激光、光學器件和MEMS Mirror 組成由于 LBS 使用激光光源進行逐像素渲染,相較其他非激光、逐幀渲染方案天然具有延遲低(激光納秒 vs 普通光源毫秒)、畫面滯留時間短、亮度高、能耗低、色彩豐富的優(yōu)勢。此外,為獲得更大的視場角和更高的解析度,其他技術必須增加微鏡的數量并放大產品尺寸,而 LBS 方案僅通過改變 MEMS 微鏡的振動頻率和反轉角度即可實現,因而更易實現光機的輕量和小型化。(目前 LBS 光機體積大致在 0.5-1.5 立方厘米)。
當前主流的 LBS 產品分辨率約720P,提高分辨率可能需要較高的成本。AR 硬件/軟件企業(yè) Rave 首席科學家 Karl Guttag將搭載 LBS 光機的 HoloLens 2 代和搭載 LCoS 光機的 HoloLens 1 代進行對比測試后發(fā)現,雖然 HoloLens 2 的垂直視場角較 1 代提升近一倍(30 度 vs 17.5 度),但其在分辨率、色彩均勻性等方面的表現均更差。此外,HoloLens 2 實拍圖色彩飽和度更低,觀感模糊,霧度也更大。
DLP —— 對溫度敏感,難以小型化。DLP 由于成本高、體積大等缺陷,在 AR 場景中的應用有一定限制。DLP(Digital Light Processing)系統(tǒng)的核心是 TI 專利的 DMD 芯片(Digital Micromirror Device),它由數百萬個高反射的鋁制獨立微型鏡片組成,每個鏡片通過數量龐大的超小型數字光開關控制角度。這些開關可以接受電子訊號代表的資料字節(jié),然后產生光學字節(jié)輸出,將輸入 DMD 的視頻或圖形信號轉換成高清晰度的、高灰度等級的圖像。DLP 由于以鏡片為基礎,提高了光通效率,因此 DLP 投影系統(tǒng)比所有其他顯示系統(tǒng)具有更強的亮度。然而,由于其設計難度大、結構復雜、生產成本高、體積大等劣勢,目前在 AR、HUD 等設備中應用并不普及。
MircoLED —— 仍處在早期階段,較多技術問題需要解決。MicroLED 產品性能絕佳,是業(yè)內公認的 AR 顯示最佳解決方案。Micro LED 即 LED 微縮技術,通過將傳統(tǒng) LED 陣列化、微縮化后定址巨量轉移到電路基板上形成超小間距 LED,可將毫米級別的 LED 長度進一步縮小到微米級(50um 左右,原本 LED 的 1%)。相較其它技術,MicroLED 產品性能在亮度、對比度、工作溫度范圍、刷新率、分辨率、色域、功耗、延時、體積、壽命等多方面具備較大優(yōu)勢,被期望為下一代主流顯示技術的重要路徑。
MicroLED 的發(fā)展瓶頸在于微米級的像素尺寸和間距給量產和全彩方案所帶來的巨大挑戰(zhàn)。 MicroLED 的生產包括芯片和背板制造、巨量轉移、接合、驅動和檢測維修等環(huán)節(jié),由于其晶粒尺寸在微米級,生產單個成品即需要處理數百萬甚至數千萬晶粒,對技術的效率和良率提出了極為嚴苛的要求,現有技術水平還無法滿足其量產需求。而MicroLED 晶粒的發(fā) 光效率、波長一致性和良率也尚未達到 MicroLED 彩色化顯示的要求?;诖?,現有MicroLED 屏幕價格高昂,單片售價即大于 1000 美金。2018 年三星演示的采用 microLED技術的 The Wall 電視,146 寸版報價高于 10 萬美元。
光學模組:從幾何光學到納米光學。與 VR 的不同之處在于,AR 眼鏡需要透視(see-through),既要看到真實的外部世界,也要看到虛擬信息,所以成像系統(tǒng)不能擋在實現前方,這就需要多加一個或一組光學組合,通過層疊的方式,將虛擬信息和真實場景融為一體,設計包括自由曲面,光波導等。
傳統(tǒng)的光學透鏡加工方式為切割/注塑/涂層/拋光等等,但隨著光波導等光學模組的復雜化,傳統(tǒng)加工工藝帶來了生產流程復雜、良率低等問題,國內外包括 Digilens,WaveOptics,至格科技,瓏璟光電等廠家開始探索納米壓印、紫外光加工等加工方案。
AR 光學模組梳理
光波導技術是應 AR 需求而生的一個比較有特色的光學組件。因它的輕薄與外界光線的高穿透特性而被認為是消費級 AR 眼鏡的必選光學方案。
AR 眼鏡中光的傳輸關鍵在于“全反射”。其實,波導技術并不是新發(fā)明,光纖就是波導的一種,只不過傳輸的是我們看不見的紅外波段的光。光機完成成像過程后,波導將光耦合進自己的玻璃基底中,通過“全反射”原理將光傳輸到眼睛前方再釋放出來,就完成了圖像的傳輸。
越是大的視場角,就需要越高折射率的玻璃基底來實現。因此傳統(tǒng)玻璃制造商比如康寧和肖特,近年來都在為近眼顯示市場研制專門的高折射率并且輕薄的玻璃基底,還在努力不斷增大晶元尺寸以降低波導生產的單位成本。
具體來看,當前光波導技術可以分為下面三種:
1) 幾何/列陣光波導。該概念和專利一直由以色列公司 Lumus 提出并持續(xù)優(yōu)化迭代,基本原理是耦合光進入波導的一般是一個反射面或者棱鏡。在多輪全反射后光到達眼鏡前方時,會遇到一個“半透半反”鏡面陣列,將光耦合出波導。幾何/列陣光波導目前大都只能實現一維擴瞳。這里的“半透半反”鏡面陣列相當于將出瞳沿水平方向復制了多份,每一個出瞳都輸出相同的圖像,這樣眼睛在橫向移動時都能看到圖像,這就是一維擴瞳技術(1D EPE)。
幾何/列陣光波導工藝流程復雜,良率提升難度極大。“半透半反”鏡面陣列的鍍膜工藝中,由于光在傳播過程中會越來越少,陣列中這五六個鏡面的每一個都需要不同的反射透射比(R/T),以保證整個動眼框范圍內的出光量是均勻的。并且由于幾何波導傳播的光通常是偏振的,每個鏡面的鍍膜層數可能達到十幾甚至幾十層。
這些鏡面是鍍膜后層層摞在一起并用特殊的膠水粘合,然后按照一個角度切割出波導的形狀,這個過程中鏡面之間的平行度和切割的角度都會影響到成像質量。因此,即使每一步工藝都可以達到高良率,這幾十步結合起來的總良率卻是一個挑戰(zhàn)。每一步工藝的失敗都可能導致成像出現瑕疵,常見的有背景黑色條紋、出光亮度不均勻、鬼影等。
2) 浮雕光柵衍射光波導。傳統(tǒng)的光學結構被平面的衍射光柵取代,通過材料表面浮雕出來的高峰和低谷,在材料中形成了一個折射率的周期性變化。通過設計光柵的參數(材料折射率、光柵形狀、厚度、占空比等)可以將某一衍射級(即某一方向)的衍射效率優(yōu)化到最高,從而使大部分光在衍射后主要沿這一方向傳播。
用衍射光柵可以實現二維擴瞳,digilens 和 WaveOptics 分別具有兩種技術方案。 Hololens I, Vuzix Blade, Magic Leap One, Digilens 等使用的方法是,當入射光柵將光耦合入波導后,會進入一個轉折光柵的區(qū)域,這個區(qū)域內的光柵溝壑方向與入射光柵呈一定角度,那么它就像一個鏡子一樣將 X 方向打來的光反射一下變成沿 Y 方向傳播。另外一種實現二維擴瞳的方式是直接使用二維光柵,即光柵在至少兩個方向上都有周期,將單向“溝壑”變?yōu)橹鶢铌嚵?。WaveOptics 就是采用的這種結構,從入射光柵耦合進波導的光直接進入一個具有二維柱狀陣列發(fā)區(qū)域,可以同時將光線在 X 和 Y 兩個方向實現擴束,并且一邊傳播一邊將一部分光耦合出來進入人眼。
3) 布拉格光柵衍射光波導(也叫全息光柵光波導)。利用光全息術在記錄材料薄膜上記錄點光源的干涉條紋,再經過處理制成光柵條紋結構的薄膜光學元件,具有光束準直、聚焦、偏轉等功能。其對光的衍射符合布拉格定律,只有滿足布拉格條件的入射光才會被衍射,不滿足布拉格條件的入射光不被衍射。目前在做全息體光柵(VHG)波導方案的廠家比較少,包括十年前就為美國軍工做 AR 頭盔的 Digilens,曾經出過單色 AR 眼鏡的 Sony,還有由于被蘋果收購的 Akonia。
優(yōu)點顯著,探索持續(xù)進行。這種技術具有體積薄,重量輕,且可同時記錄多個全息圖等優(yōu)點,使它能夠替代許多傳統(tǒng)的光學元件,如棱鏡、立方體分束器和光柵等,進一步減小 AR 頭戴式顯示器體積。由于體光柵由于受到可利用材料的限制,能夠實現的折射率差有限,導致它目前在 FOV、光效率、清晰度等方面都還未達到與表面浮雕光柵同等的水平。但是由于它在設計壁壘、工藝難度和制造成本上都有一定優(yōu)勢,業(yè)內對這個方向的探索從未停歇。
SLAM:理解環(huán)境與使用者,實現虛擬信息和現實世界的結合。SLAM(Simulataneous Localization and Mapping),同步定位與地圖構建,指在運動過程中通過重復觀測到的環(huán)境特征定位自身位置和姿態(tài),再根據自身位置構建周圍環(huán)境的增量式地圖,從而達到同時定位和地圖構建的目的。
現代流行的 SLAM 系統(tǒng)大概可以分為前端和后端。前端通過傳感器實現數據關聯(lián),研究幀與幀之間變換關系,主要完成實時的位姿跟蹤,對輸入的圖像進行處理,計算姿態(tài)變化。后端主要對前端的輸出結果進行優(yōu)化,得到最優(yōu)的位姿估計和地圖。
SLAM 在 ARVR 中有較多應用,AR 中主要是 1)現實物體與虛擬物體的有效交互,2)實 現語義理解,優(yōu)化智能輔助功能:
實現虛擬世界和現實世界之間坐標疊加、實現幾何物理信息交互。與電腦、平板、手機的3D 顯示不同,AR 更注重虛擬信息與真實信息的無縫融合,即圖像出現的平面位置與景深準確、帶來沉浸感的良好體驗。這就需要利用 SLAM 算法,準確疊加虛擬坐標系和真實坐標系。同時,真實環(huán)境中有高低起伏、有障礙物、有遮擋關系,AR 可以讓虛擬信息跟這些真實環(huán)境中的物理信息進行交互。
隨著機器學習和深度學習的發(fā)展,虛擬信息可以“理解”真實世界,讓二者的融合更趨于自然。當前計算機已經可以已經可以認出圖片上的內容,但沒有理解內容之間的關系,當前的一項研究方向是,應用 SLAM+AI 技術,通過特征提取,實現機器的語義理解,優(yōu)化 AR 系統(tǒng)的輔助功能。
傳感器:交互方式與應用場景升級推動傳感器升級。AR 中交互方式的升級,帶來更多樣信息需求。隨著人機交互由 2D 走向 3D,交互方式逐漸多樣化,向人類本能發(fā)展,手勢交互、姿勢交互、眼動交互、語音交互,甚至結合生物信號、周圍環(huán)境交互的方式不斷進化,這對更多種類的信息提出了要求,用戶運動類、生物類信息,以及其他環(huán)境信息都將為人機交互提供底層支持。
大量信息需求為運動類、生物類、環(huán)境類各型傳感器提供增量機會。當前蘋果手機、手表廣泛運用多種運動、生物型傳感器,與之對比,VR 爆款產品 Oculus quest 2 頭顯僅搭載了4 顆黑白攝像頭,手柄配備了兩組陀螺儀加速度計傳感器。未來,為實現更深度沉浸和更便捷交互,測距攝像頭、眼動追蹤攝像頭、精細化壓力傳感器,甚至生物型、環(huán)境型傳感器,都將逐漸配備。
三、腦機接口:離現實還有多遠?
對于大多數人來說,最早接觸腦機接口概念是從科幻電影中。不管是《X-戰(zhàn)警》中博士的意念控物,還是《黑客帝國》中錫安人通過接口與電腦相連,迅速學會各種各樣的知識和技能,并進入 Matrix 的虛擬世界中,再或是《沙丘》中人們通過腦科學的探索,不斷開發(fā)大腦潛能,通過訓練的領航員的大腦能夠媲美大型計算機,這些情節(jié)都讓人印象深刻,也是科學家不斷探索的方向。
使用電子計算機對人腦進行模擬需要 172PFlops 計算量。人的大腦有接近 860 億個神經元,每個神經元有 1 萬個連接點,掌管人類運動、聽覺、語言、嗅覺、記憶、思考、性格、情緒等功能。根據我們估算,如果想要以計算機來模擬人腦的活動需要 172PFlops(對應神威太湖之光 93PFlops,美國 Summit 超算 122.3PFlops)。人腦的潛能或能夠達到一臺超級計算機的運算能力。
腦機接口或支持人腦潛力持續(xù)開發(fā)。馬斯克提出的一個經典論述是“人類不能被 AI 淘汰,要與 AI 融合,在大腦和電腦之間創(chuàng)建一個接口”。隨著我們對腦科學的不斷認識和腦機接口技術下對人類肢體限制的不斷突破,人腦的潛能或得到釋放。
被稱作“腦機接口之父”的尼可萊利斯教授在其《腦機穿越》一書中提到,在腦機接口的幫助下,思想或能轉化為有形的動作、印象或情感,人可以用思想操控電腦、駕駛汽車、與他人進行交流,可以完美的轉化為納米工具的精細化操作,或者是應用了尖端科技的機器人的復雜動作。不用動手輸入一個字,也不用動口說一個詞就可以與人進行交流,即使足不出戶,也能體驗到觸摸遙遠星球表面的感覺。
腦機接口(Brain Computer Interface,BCI)1976 年由加州大學洛杉磯分校的雅克·維達爾(Jacques J. Vidal)提出。一個完整的腦機接口過程包括信號采集、信息解碼處理、信號 輸出/執(zhí)行、反饋四個步驟實現。 腦機接口可以通過電、磁、光、聲進行信號采集與反饋,而腦電技術是目前主流探索方向。 事實上采集中樞神經信號以監(jiān)測大腦活動的方法有很多種,包括腦電、功能近紅外光譜(functional near-infrared spectroscopy, fNIRS)、功能磁共振成像(functional magneticresonance imaging, fMRI)等,反饋技術也同樣包括電、磁、聲、光多種。在這些監(jiān)測技術中,腦電因為時間分辨率高、設備價格低廉且便攜等優(yōu)點,逐漸成為腦機接口研究最主流的探索方向。
1) 腦電采集:腦電采集是 BCI 的關鍵步驟,采集的效果、信號強弱、穩(wěn)定性及帶寬大小直接決定后續(xù)的處理及輸出。由于大腦的中樞神經元膜電位的變化會產生鋒電位(spikes),或動作電位(action potentials),并且神經細胞突觸間傳遞的離子移動會形成場電位(field potentials),通過在大腦皮質的運動神經位置外接或植入微型電極,可以采集并放大這些神經生理信號。
2) 信號解碼處理:信號處理是將轉化為電信號的大腦活動,去除干擾電波以及其他信號,并將目標分類并處理,轉化為可以執(zhí)行輸出的對應信號。
3) 信號輸出及執(zhí)行:信號輸出指將收集并處理后的腦電波信號傳輸至已連接的設備器材,作為數據基礎加工內容,或反饋到終端機器以形成指令,甚至實現直接交互。
4) 反饋:在信號執(zhí)行后,設備將產生動作或顯示內容,參與者將通過視覺、觸覺或聽覺感受到第一步產生的腦電波已被執(zhí)行,并觸發(fā)反饋信號。
根據腦電的采集方式,當前的腦機接口又可以分為侵入式、非侵入式 非侵入式更多用于消費端的腦電監(jiān)測。非侵入式是在人/動物大腦外部佩戴腦機接口設備,通過采集腦電、神經電獲取腦部信息,但信息精度及分辨率較低,可用于簡單的信號判斷與反饋,但較難傳達復雜指令,如幫助肢體殘障人士通過意念操控機械骨骼,或用于 VR/AR游戲應用的基礎手勢控制。非侵入式根據收集信息的不同可以分為 EEG(收集腦電)和MEG(收集磁場)兩種。
1)EEG:通過導電凝膠將 Ag/AgCI 電極固定在頭皮上,以測量頭皮腦電信號,但一般只能監(jiān)測到 0-50Hz 相對較窄頻帶中的信息。
2)MEG:通過測量細胞內離子電流引起的小磁場獲得信號,但由于高昂的成本和操作方法的繁瑣(電磁封鎖環(huán)境,保持絕對靜止),MEG 并不是一個理想的解決方案。
侵入式腦機接口主要應用于醫(yī)療康復領域。侵入式將設備直接植入到人/動物大腦灰質或顱腔內,能夠獲取相對高頻、準確的神經信號,不僅能夠通過讀取腦電信號來控制外部設備,還能夠通過精確的電流刺激讓大腦產生特定感覺。侵入式腦機接口可以分為 ECoG、LFP、SUA 等類型。
1) ECoG:測量大腦皮層電位,與 EEG 技術相似,但能夠監(jiān)測到更大帶寬的信息;
2) LFP、SUA:測量大腦皮層場電位與鋒電位,可以通過 Mircowire array,Michigan array,Utah array,Neurotrophic electrode 等多種傳感器實現。
侵入式采取電信號的方法,具有較高的空間分辨率、良好的信噪比和更寬的頻帶,但目前仍然面臨著有創(chuàng)帶來的安全問題、難以獲得長期穩(wěn)定的記錄、需要醫(yī)護人員長時間連續(xù)的觀察等問題,目前應用仍局限于醫(yī)療康復領域。
侵入式工具也出現了全新不開顱植入方案。2021 年 8 月,來自美國加州伯克利大學的Synchron 公司開發(fā)的微創(chuàng)腦機接口獲得美國食品藥品監(jiān)督管理局(FDA)的人體臨床試驗批文。其腦機裝置微小,可以安全地穿過血管,因此直接利用頸靜脈植入 BCI,使用導管手術將設備輸送到大腦和脊柱中,在兩小時無需開顱手術內即可將設備植入了患者大腦內。
由于不需要開顱手術,因此這種傳感器可以靈活布置在大腦多個位置,從而捕捉各種類型的信號。與傳感器相連的 BrainPort 接收裝置植入病人的胸口,它沒有內置電池,而是通過無線的方式進行供電以及數據傳輸,進一步提升了安全性。通過 Synchron 研發(fā)的 BrainOS操作系統(tǒng),可以將傳感器讀取到的信號轉化為與外界交互的通用信號,從而實現用大腦與外界交流溝通。
醫(yī)療、消費市場應用的持續(xù)拓展或支撐起千億市場規(guī)模。隨著人們對大腦的認知、電極設計、和人工智能算法的精進,腦機接口領域應用也持續(xù)拓展,并向更加精細化發(fā)展。腦機接口相關的研發(fā)已經在仿生學、醫(yī)療診斷與干預、消費電子等多個領域進行持續(xù)探索,我們認為相關產品可能將在未來 20-30 年內陸續(xù)商業(yè)化,支撐起近千億美元的市場規(guī)模。
二十世紀七十年代到九十年代末,腦機接口技術經歷了從概念期到科學論證期的發(fā)展。二十世紀七十年代至八十年代,“腦機接口”專業(yè)術語出現,1977 年 Jacques J. Vidal 開發(fā)了基于視覺事件相關電位的腦機接口系統(tǒng),通過注視同一視覺刺激的不同位置實現了對 4 種控制指令的選擇。1980 年德國學者提出了基于皮層慢電位的腦機接口系統(tǒng)。
二十世紀八十年代后,少數先驅研發(fā)了實時且可執(zhí)行的腦機接口系統(tǒng),并定義了至今仍在使用的幾種范式:
1) 1988 年 L.A. Farewell 和 E.Donchin 提出了著名且廣泛使用的腦機接口范式 P300 拼寫器,表明系統(tǒng)有望幫助嚴重癱瘓患者與環(huán)境進行通信和交互。不久后研究人員都開發(fā)出基于感覺運動節(jié)律的腦機接口系統(tǒng),該系統(tǒng)可以控制一維光標向使用者反饋運動節(jié)律幅度,從而通過訓練實現通過想象控制小球向上或向下移動。
2) 1990 年左右 Gert Pfurtscheller 開發(fā)出另一種基于感覺運動節(jié)律的腦機接口,用戶必須明確地想象左手或右手運動,并通過機器學習將其轉化為計算機命令,這定義了基于運動想象的腦機接口。
3) 1992 年 Erich E. Sutter 提出了一種高效的基于視覺誘發(fā)電位的腦機接口系統(tǒng),在該系統(tǒng)中設計了 8×8 拼寫器,利用從視覺皮層采集的視覺誘發(fā)電位識別用戶眼睛注視方向來確定他選擇拼寫器中的哪一個符號。肌萎縮側索硬化癥患者可以實現 10 個單詞/分鐘的通信速度。
二十一世紀以來腦機接口技術高速成長,新范式、新算法、新設備層出不窮,早期范式性 能明顯提高。新型腦機接口實驗范式相繼涌現,如聽覺腦機接口、言語腦機接口、情感腦機接口以及混合腦機接口。先進的腦電信號處理和機器學習算法被應用于腦機接口,如空間模式算法、xDAWN 算法等,新型的腦信號獲取方法如功能核磁共振成像測量的血氧水平依賴信號以及功能近紅外光譜測量的皮層組織血紅蛋白濃度等被用于構建非侵入式腦機接口。除此之外,早期開發(fā)的基于 P300 和視覺誘發(fā)電位的腦機接口性能得到了明顯提高,并在初步的臨床試驗中證明適用于肌萎縮側索硬化癥、腦卒中以及脊髓損傷患者。
應用場景1:醫(yī)療健康領域是腦機接口當前最接近商業(yè)化的領域。腦機接口可以幫助實時監(jiān)控和測量神經系統(tǒng)狀態(tài),輔助臨床判讀?!氨O(jiān)測”型腦機接口應用方向十分多樣,包括評測陷入深度昏迷患者的意識等級,測量視/聽覺障礙患者神經通路狀態(tài)協(xié)助醫(yī)生定位病因等等。除此之外,通過結合腦電、視頻等多元信息進行診
監(jiān)測到的腦電信息可以用于加工、反饋,針對多動癥、中風、抑郁癥等做對應的恢復訓練。 例如,對于運動皮層相關部位受損的中風病人,腦機接口可以從受損的皮層區(qū)采集信號,然后刺激失能肌肉或控制矯形器,改善手臂運動;運動想象類腦機接口可以用于孤獨癥兒童的康復訓練,提升他們對于感覺運動皮層激活程度的自我控制能力,從而改善孤獨癥的癥狀,也可以通過腦電信號的反饋,訓練使用者的專注力。療,能夠輔助醫(yī)生判讀腦損傷、腦發(fā)育等多種臨床適應癥。
基于電、聲、光、磁刺激進行神經調控的腦機接口已經實現商業(yè)化。相關應用包括:通過電刺激治療進行神經康復,主要針對腦卒中、 帕金森等中樞神經或周圍神經損傷所致的運動功能障礙,如偏癱、肌萎縮、肌力低下、步行障礙、手功能障礙;通過顱磁刺激治療抑郁癥,以及對腦卒中所致的言語功能障礙、吞咽障礙、認知功能障礙進行治療。經顱磁刺激用于抑郁癥治療已在美國、加拿大、新西蘭、以色列等國家明確獲批,與藥物治療相比,經顱磁刺激具有副作用小、安全性高、無痛苦、不易成癮、不會影響認知功能等優(yōu)勢。國內外多家公司包括偉思醫(yī)療(688580 CH,未覆蓋),Neuronetics(STIM US,未覆蓋),Brainsway(BWAY US,未覆蓋)等公司已經推出相關產品。
BrainCo 強腦科技在 2019 年推出世界上第一款可以意識控制每一根手指的非侵入式智能仿生手后,在今年再次推出一款適合不同傷殘等級的仿生腿產品。根據公司介紹,這款產品每秒可提取 2 萬個肌電神經電數據,因此能快速、準確地識別用戶意圖,并根據環(huán)境、肌肉情況調整步態(tài)防止摔倒,實現高仿生體驗,還能夠支持攀巖、涉水等多種復雜操作,為殘障人士創(chuàng)造高品質生活,拓展了腦機接口技術在義肢方向的應用。
應用場景2:消費電子與 AIoT 領域展開消費端應用。腦機接口技術可以與消費產品相結合,提供更直覺交互體驗。早在 2014 年,加難道公司Thalmic Labs 就推出了一款臂帶式控制器 Myo,通過感知肌肉的生物電活動,可以讓使用者只需要動動手指就可以無線控制身邊的計算機和其他數字產品。隨著技術的持續(xù)升級,當前臂帶式控制器可以實現通過識別活動意念帶來的電流進行控制,意念打字、意念操作玩具等已經不是幻想。
在腦機接口的支持下,游戲玩家可以用意念來控制 VR 界面的菜單導航和選項控制,獲得了獨立于傳統(tǒng)游戲控制方式之外的新的操作體驗;同時人們也可以用意念控制開關等,甚至控制家庭服務機器人,實現全新意義上的智能家居。
滲透率或隨 AR 及其他可穿戴產品普及持續(xù)提升。當前更加簡單形式的控制,比如眼動追蹤攝像頭、觸摸控制等或限制腦機接口交互需求。我們認為未來隨著一系列可穿戴設備比如 AR 眼鏡的普及,以及元宇宙的持續(xù)建設,基于腦機接口技術的消費電子產品滲透率將持續(xù)提升。
應用場景3:實現大腦強化,運用于國防軍事領域 2020 年美國蘭德公司發(fā)布了一份名為《腦機接口:美國軍事應用和意義的初步評估》(Brain-Computer Interfaces: U.S. Military Applications and Implications)的報告,指出雖然存在一定風險,“腦機接口”很可能在改進未來作戰(zhàn)中提供相應的支持,腦機接口在軍事 領域用途包括保證更高效和保密的軍事通信、提高決策速度與準確性,允許操作員同時控 制多個平臺等。
進行更高效和更保密的軍事通信。2019 年,DARPA(美國國防部高級研究計劃局)就選擇了6個團隊來開發(fā)N3神經技術研究計劃,旨在為美國軍方提供高精度的雙向腦機接口系統(tǒng),使服役人員能夠與計算機系統(tǒng)進行通信。未來若腦機接口用于軍事通信的技術獲得成功,將顛覆現有通信技術的運轉模式。此前的通信解密都是在得到對方通信信號的基礎上,依據共同、公開的技術知識進行解密。理論上只要有足夠的時間,任何加密算法都可以被破譯。而腦機接口通信可能在雙方的主體意識尚未明確時就已經完成;所以,不僅通信信號難以得到,即使得到信號,也缺乏解密所需的技術知識。
腦機接口或用于處理大量數據來提高決策效率。未來作戰(zhàn)中,智能設備、士兵穿戴式傳感器和無人機可向士兵提供大量的行動數據,大量的信息融合將增加決策的復雜性。通過腦機接口能夠使得機器與人之間連通性增強,促進數據在作戰(zhàn)人員和決策者之間快速而廣泛地流動,使得相互連接的軍事系統(tǒng)能夠順利運行。同時人工智能工具可能融入決策流程,幫助人類作戰(zhàn)人員評估環(huán)境,管理數據,并最終消化更大容量的信息。
全球主要腦機接口公司
智東西認為,人機交互是人類通往元宇宙的入口,借助于自然用戶界面,AR/VR帶來了遠遠高于圖形化展示更自然的交互模式,也是最有希望的實現元宇宙的第一個入口。但長遠來看,腦機接口才是元宇宙入口的真正形態(tài),而其中的非侵入式腦機接口在未來或許成為元宇宙入口的一張“王炸”。
本文經授權發(fā)布,不代表增長黑客立場,如若轉載,請注明出處:http://gptmaths.com/quan/59004.html