CES剛剛落下帷幕,媒體和行業關於AR的討論非常熱烈。作為技術小白,當我們參與討論AR技術和產品的時候,應該關注哪些重點?

Rokid創始人兼CEO Misa寫下了這篇號稱是「0技術含量」的文章,希望每個人都能讀得懂,並形成自己對AR的認識和看法。

以下,相信你能看懂,Enjoy:


毫無疑問,今年AR(增強現實)技術和產品將回歸大家的視野。

說「回歸」是因為幾年前當Google Glass出現的時候,所有人都為之興奮了好一陣,令人失望的是不久這個產品也迅速黯淡了(實際上有一些垂直領域至今還在使用這個產品)。

這個被很多人看作有機會取代手機的方向,到底是一個什麼概念?或者有什麼值得大家思考和關注的?

我打算用這篇小文章來談談我們的看法和實踐。

Project Aurora

首先,今天對AR的描述有很多更細分的說法,比如以光場技術為突破點的,或更注重現實世界物理空間融合的MR(混合現實)等,這裡我們不做細節區分,就都叫AR吧。此外,AR在物理形態上可以是手機/頭盔/眼鏡等不同載體,這裡主要闡述眼鏡形態。

如標題所言,為了便於啟發大家思考,本文不涉及任何技術原理方面的東西,放心閱讀。

從AR誕生之日,就有兩條明顯的路線:信息工具路線和內容娛樂路線。

這個兩條路線本質上和技術無關,主要是基於基本的技術原理,落地到兩類截然不同的方向,當然也必定導致產品形態以及細節技術路線的差別。其實簡單按兩類路線去定義產品依然太粗,幾乎無法落地到具體產品形態,這一點很多人沒有意識到。

AR產品主要有幾個大的指標是無法迴避的,包括:可佩戴性單眼/雙眼是否3D色彩視野大小(一般用FOV/視場角來描述)、虛像成像距離(VID)、光效率分體/一體同步定位和環境重建(SLAM)等主要元素。不用被這些名詞嚇到,接下來會一一解釋,耐心看大家就明白了。

當前AR眼鏡有很多實現技術,比如稜鏡反射、Birdbath、自由曲面、光柵光波導、衍射光波導等等,這篇文章我不深入解釋每個技術,會安排另外一篇叫「一篇關於AR眼鏡高技術含量的文章」的文章給大家詳細闡述。

有一點需要注意,剛才提到的這些技術各自都有自己的優缺點,我們不能離開場景和產品定位來談技術的優缺點,這是Rokid公司思考問題的方式,在經過早期研究階段後,我們一般是先回答場景和產品定位問題,再思考技術選型和突破方向。

現在讓我們一個個來看:

1、雙眼比單眼好?

第一個問題似乎比較簡單,對單眼的否定大部分來自Google Glass第一批用戶的吐槽,當時糟糕的體驗實在太深入人心,實際上受當時技術限制Google Glass談不上真的AR,和物理世界幾乎是不融合的,可以理解為在你的右眼右上角掛了一個小屏幕,來回對焦和左右眼協同非常幸苦。

Google Glass

實際上很多問題和單雙眼無關,主要是由於視線偏離和反覆對焦導致的雙眼協同問題讓人不舒服。

近些年光學成像技術有很多突破,基本上能保證數字圖像展現和現實世界視線一致,成像距離也基本能做到不用反覆對焦,雙眼協同基本沒不舒服,而且人的大腦對這樣的情況其實並不拒絕,如果產品設計到位,有的人甚至分辨不出是單眼還是雙眼。

雙目的優勢明顯,在雙眼都收到信息的情況下,立體空間感更容易展現,視野容易做大,成像距離也比較容易被感知到,尤其是對3D效果必須的場景(比如空間建模/立體遊戲等),雙目是基本配置。

不過是不是都做雙眼就好了呢?

這裡也有一個不被認知的問題:在雙眼模式下,每隻眼睛看到獨立的顯示,其實很難做對齊和焦距自然重合(用過雙筒望遠鏡的朋友就有體會了)。

在無校準對齊的情況下,大腦會發現兩隻眼睛收到的數字圖像,並不在一個自然成像焦距上,然後大腦會大量計算糾錯來適應這樣的情況,這個是很多雙目系統導致暈眩噁心的原因之一(暈眩噁心還有其他原因,比如延時,體態視覺感受不一致等)。

而相反,單眼模式下,另一個眼睛什麼數字圖像信息都沒有,大腦參與工作大大減少,反而不是壞事。

Rokid Glass

這就是為什麼很多高強度、長時間佩戴的AR設備都是單眼,比如飛行員頭盔上的AR系統。所以說根據不同場景需求選擇不同的方案才是明智的,況且還牽涉功耗/發熱/結構複雜度/成本等諸多因素,產品經理和用戶都要認真想想,什麼適合自己。

2、視野越大越好?

似乎也是一個簡單的問題,當然越大越好,這個結論倒是簡單,不過核心是視野大小也和功耗,技術複雜度和成本直接有關,如果用途就是簡單的信息提示,就沒必要太過追求這個(比如最近亞馬遜推出的AR眼鏡,其實視野很小),顏色其實也是一樣的道理。

另外大家也要注意,和VR的沉浸式要求不同,AR場景人的視野天然被現實世界充滿,無需刻意充滿視覺感受,用戶界面上技巧設計,可以模糊視野邊界,這是對設計師特別不一樣的要求,Rokid很多參與眼鏡項目的設計師都感覺進入一個全新的設計模式。

3、成像距離越遠越好?

人眼看事物時,會根據物體的不同距離來調節瞳孔聚集來看清東西,而數字成像往往是設計成相對固定的距離,也就是說,當你看這些數字信息的時候,瞳孔對焦是固定的。

由於AR是和現實世界融合的體驗,所以當你眼睛看不同距離的東西時候,數字圖像就很難保持清晰,這個現象越靠近眼睛越明顯。

理想的設計就是跟隨眼睛真實對焦情況去控制數字成像的距離,這就是大家說的「光場」技術的目的。

大家有興趣可以關注我們這次CES展出的一個技術研究成果,能夠根據肉眼焦距無極調節數字圖像成像距離。

Varyfocal Display變焦顯示技術

但是,目前的方案成本很高,還不成熟,妥協的方案是在遠處/近處各有一個固定距離的成像機構,來盡量適應人眼遠近的調節(比如Magic Leap)。

順便提一下,一般來說MR多指具備這樣調節數字圖像成像距離技術的產品,但是現在很多廠家所謂的MR產品並不具備,仍然是單一固定成像距離,這就是為什麼Rokid並不趕時髦說自己是MR產品的原因。

既然目前大部分產品不具備這樣的能力,那麼如何設計成像距離就很重要,你的主要場景是看遠處(比如開車,要盡量保持聚焦在遠處路面),還是看近處(比如看書/繪本內容疊加)決定了你的產品設計,這沒有絕對的好壞,當然,現在的產品基本還是默認設計成2-6米之間,希望儘可能通用。

3、光效率,一個被大家忽略的重點

我發現身邊大部分人不了解光效率的重要性,光效率包括兩個方面,一個是數字圖像從出發點到達視網膜的效率,一個是外部現實世界到達視網膜的效率,理論上說,兩個都越大越好。

但實際上做不到,不同數字成像光學技術光效率差別很大,由於發光源能量受限(功耗、電池續航、發熱諸多因素決定),還有在光路上的不可避免的損失,一般數字圖像到達人眼視網膜都有比較多的損失,所以往往需要做一些取捨。

到底更強調外部現實世界的效率還是數字圖像效率?

現在很多AR眼鏡都在向用戶展現數字圖像的體驗,為了加強這個,往往把外部鏡片變成深色,遮擋大部分外部世界光,以免太干擾數字圖像(因為亮度不夠)。這個如果用在內容展示,當然沒問題,但是如果用在和外部世界強交互的時候就是災難了,有的甚至無法在傍晚和陰天使用。

光效率還直接影響功耗和電池續航力,這個也是非常重要的決策因素。不同技術的光效率差別,幾乎是由該技術原理決定的,具體是什麼情況,以後在技術性文章里闡述。

4、SLAM需要嗎?

這個問題回答起來也不簡單,很多設計里,數字圖像是在真實物理空間固定位置的,就和真實世界裡的東西一樣,這樣的設計對SLAM(同步定位和環境重建)穩定性要求很高,往往需要多類感測器協作完成。

有的重點只需要做一些頭部運動跟蹤(比如遊戲等),對虛擬物體和現實空間的融合要求不高。還有一些設計乾脆就不做SLAM,任何顯示就是在你視野正前方,比如一些信息提醒工具類的應用。

SLAM定義主要考慮當前器件的體積大小和計算功耗。總之一切回歸場景。

5、一體還是分體?

簡單回答,大家都希望在足夠輕便,佩戴舒服,續航力又強勁的情況下,做一體機,無需連接外部設備。很可惜,當前技術很難做到。

大部分產品會在第一時間,根據場景決定一體式還是分體式。總體來說依照佩戴舒適度定義是最基本的方法,不過也不完全是,比如分體方式往往需要連線,違反一些安全環境要求,同時也多一些操作步驟。

有的場景則可以犧牲一定的舒適度來保證一體獨立計算力,尤其一些專業場景會傾向於一體式(比如美軍最近採購Hololens就是犧牲舒適度的),長時間佩戴場景則往往會用分體設計。

Rokid的兩款產品是針對不同的場景設計,對於快速行動,即拿即用的場景,我們提供一體式(如Rokid Glass),而對於很多消費者場景,我們也會採用分體設計,保證佩戴舒適度(如Project Aurora)。

Project Aurora(左)和Rokid Glass(右)

通過上面描述,大家可以感受到,拋開場景談技術好壞是沒有意義的,產品設計是一個極其複雜而細緻的工作,遠遠不是一個創意,一個技術就可以完成的事情,需要每天進行很多思考。

AR產品是非常新的事物,即使我們團隊潛心研究多年依然有很多問題有待解答,Rokid Lab的科學家和設計師們不斷探索研究,不僅僅是基礎技術上的突破(材料、光學、結構、電子等),更多的是用戶場景和使用體驗的研究,而這些都是AR產品走向千家萬戶的關鍵。


推薦閱讀:
相关文章