熬夜看完 WWDC 之後,除了被 Apple Vision Pro 震撼,一個很奇怪但驚艷我的感想是:Apple 很「誠實」。
幾乎可以說,Apple 從產品研發到市場定位,策略都是「誠實」。誠實不是簡單的事。在發表會上,有幾個瞬間抓住我的注意力,其中一個就是當 Tim Cook 強調,「Vision Pro 是一台電腦。」
我們可以簡單將之理解為「以單價更高的電腦作為參照,合理化 Vision Pro 的高定價」;然而仔細一想,這個定位實際上是一個誠實的定位。
Let's be honest:VR 頭戴式裝置「很困難」
Apple 研究表示,在戴上 VR 裝置時,身體預期與眼睛所視的延遲必須在 12 毫秒以內,否則大腦便會察覺延遲,並令使用者感到不適。
為了達到這樣的速度,晶片的效能非常重要,而不能仰賴手機等外部裝置將影像傳到 VR 裝置。此外,也需要一個特製的作業系統(visionOS),專門提高影像處理的速度。
12 毫秒意味著,從鏡頭捕捉到手勢,軟韌體辨識並作出回應,最終透過顯示器顯示,整個過程必須在 12 毫秒內完成。也因此,Apple 自行研發晶片這項策略顯得更加正確,才得以設計 R1 處理器,配合過去累積的感光元件技術。將 iPadOS 從 iOS 切出來,這項我當初看得一頭霧水的決策,現在也顯得明瞭——其中的研發經驗可以成功轉換上 visionOS。唯有達到極致的軟硬整合,才有機會做到這麼低的延遲。
同時,為了達到更佳的沉浸感,影像的解析度必須高到肉眼幾乎無法察覺。這不是件簡單的事。當我們使用手機,螢幕距離人眼大約是 30 公分;相較之下,電視距離人眼大約是 1~3 公尺。如果我們拿放大鏡去看,便能注意到,手機的 RGB 像素元件比電視小非常多。
而 VR 裝置的顯示器距離人眼,大約是數公分以內,這使得顯示器的 pixel 必須要做到非常小且非常密。也因此,Apple 在 WWDC 上說,Vision Pro 的像素達到了 2300 萬個,密度是 iPhone 的 64 倍。為了讓大眾了解,Tim Cook 的說法是「每隻眼睛前有一台 4K 螢幕」。
——但這個比喻在技術上不精準。因為 Vision Pro 內的顯示器只有郵票大小,要在這麼小的區域塞入這麼多 pixel,工藝難度比 4K 螢幕要高上不知道多少倍。
以上這些溢美之詞,並非要顯示我是果粉(我不是,雖然我每個裝置都是 Apple)——而是要說明,把一台電腦戴在頭上,確實很困難。
誠實接受這一切「很困難」,可能是做出好產品的第一步。為什麼過去的 VR 眼鏡屢屢讓人興奮,最終默默落下,或許就是因為他們誤以為這一切「很簡單」。
當然,誠實是一種特權。有餘裕的公司才有誠實的權利。
誠實的特權,與效率的護城河
Apple 在每個研發階段的成果,都能應用在其他產品線上。例如 Face ID(另一項當初我看不明白的決策)和Memoji(一個卡通版的自己,我從不用這功能),有可能就是為了 Vision Pro 的 Facetime 鋪路。
使用 Vision Pro 打 Facetime 時,因為沒有任何相機可以自拍,所以實際上對方看到的,是一個 3D 掃描後、幾乎擬真的「你」,並根據你的動作與表情即時顯示。
我們也因此對 Apple 的產品策略有了更多想像:Apple 收購 Beats 以及研發 Airpods,是否是為 Vision 的聲音技術鋪路?這次 WWDC 上快速帶過的,Safari 支援 PWA,是否可能是為了未來 visionOS 的 web app 體驗鋪路?
這是 Apple 一條罕見的護城河。許多人認為,Apple 的護城河是品牌——而這當然沒錯。然而一票死忠粉絲與高貴品牌迷思,無法真正有效排除競爭者。
我認為 Apple 真正強大的護城河,在於其產品研發極為高效,幾乎沒有冗餘。一項新技術不僅能在單一產品上使用,還同時是另一項產品的基礎。這使得研發的邊際效益極高。
Apple 不會去追逐摺疊手機、美顏相機或五顆鏡頭等其他手機廠推出的酷炫 feature,因為 Apple 的產品 roadmap 相當清楚:每項技術,都要為其他產品線鋪路。
幾乎可說,Steve Jobs 當年在 Stanford 畢業典禮演講所說的「connecting the dots」成為了某種預言或信條,揭示了 Apple 這 18 年的研發原則。
相較之下,其他 VR / AR 賽道的競爭者,就沒有這種餘裕,自然也就沒有誠實的特權。Meta 缺乏硬體經驗,還有自己亂喊元宇宙的壓力;Microsoft 的硬體業務持續沒有起色,真正的優勢在辦公軟體。因此他們無法——或許並非不願——誠實面對「做 VR 很難,需要很長時間、很多技術」。
後見之明,這使 Meta 的 Quest 和 Microsoft 的 HoloLens,不僅不具備先行者優勢,反而成為替 Apple Vision Pro 教育市場,甚至對比出 Vision Pro 效果之好。根據目前實測者的分享,幾乎無一例外都表示「Vision Pro 是效果最好的 VR」——而這還是在大家對 Apple 期待已經極高的情況下。
誠實的好處,不僅是企業文化或市場期待,而是能更清楚看見並解決問題。Apple 並沒有想著「先做到這樣就好,測試一下市場」,而是選擇一步一步堆積技術門檻。誠實地說「這就是一台頂規電腦」,當然售價也就相當誠實。
長久以來,我一直是一個 VR 的悲觀論者,認為 VR 並不能為人類帶來(許多人鼓吹的)美好價值,其天花板也僅僅是沉浸感更佳的遊戲機。然而這次 WWDC 不僅帶給我從未觸及的想像,甚至 Apple 根本不打算講遊戲。
誠實的定位:主打生活與生產力
與多數我們看到的 VR 不同,Apple 不提遊戲、運動、戶外,一切的場景都是室內與靜態,最常見的畫面是一個人,靜靜坐在沙發或站在桌子前。
這當然也是一種誠實:誠實面對現在的技術,無法配合全部的應用。一旦做出這個決策,接下來的產品設計就變得清晰:由於 Vision Pro 不主打運動、遊戲等需要身體大動作的應用,裝置就可以做得更重也更好。不需要委屈用塑膠,可以採用玻璃和金屬,同時也不用在現階段,處理遊戲反應時間、3D 暈等問題。
另一項 Apple 完全不提的,是虛擬世界(或 buzzword「元宇宙」)。Tim Cook 在 ABC 的專訪中提到,「Vision Pro 不是關於抽離(isolation),而是連結(connection)。」這是常見對於 VR 的質疑:你把自己與外在世界,用一個顯示器隔開,而 Apple 當然要避免這樣的品牌形象。
然而,另一個思路是,Apple 可能把虛擬世界當成「一種 feature」。如同 Steve Jobs 在多年前想收購 Dropbox 時,稱 Dropbox 為一個 feature,而不是一個產品或生意;Tim Cook 很可能也把虛擬世界當成一個 feature。
這對我來說,也是一種誠實:元宇宙按照定義,是由眾多使用者共同建構的,無法由單一巨頭搭建。這類的事情,應該交由開發者去想像;相反地,沉浸感、生產力應用、與 iPhone 和 Mac 的連結,這些才是「只有 Apple 做得到的事」。
Apple 提出室內靜態情境,使他們得以專注在沉浸感。實測者口述中,最讓我驚艷的應用,是坐在 NBA 的場邊觀賞球賽。不必受限於轉播的鏡頭切換,可以近距離隨意觀賞任何角度。這使 Vision Pro 脫離電視與電影的範疇,從而創造出全新的觀賞體驗。
(更別說一般的 NBA 例行賽,場邊座位票價大約就要 $3000~$5000 美金,看一次就能買一台 Vision Pro。)
室內靜態情境也包含生產力應用。這也是 Apple 一次聰明的市場定位。為了一台遊戲機花 $3499,很可能會被伴侶碎念,還要假裝是路由器;可是接近無限大的螢幕、可以自由調整身體姿勢、高速的視線 UI,只要能提高生產力與工作時的愉悅程度,$3499 的辦公設備便不算太過離譜。
這個定位對我來說極為合理,合理到讓我訝異,為什麼其他公司從未給出這種清晰的定位。其他競爭者似乎總在追求更酷、更刺激的應用,事後回頭看,卻落入所謂的「solution finding a problem」:拿著 VR 裝置這把錘子,試著到處去敲釘子。
然而當然不僅如此。科技巨頭們並不傻。這個定位,也高度仰賴 Apple 的技術累積,而成為雞生蛋的問題。如果沒有高解析度與低延遲,以上的沉浸感和工作應用也就不成立——看電影或工作時卡住,可是會很生氣的。
誠實的技術選用
在這次 WWDC 上,同樣讓我印象深刻的一點,是 Apple 自始至終不談 AI。取而代之,他們用了相對精確但不 sexy 的詞,如 Machine Learning 和 Transformer Language Model。
我們同樣可以將之視為「不用 buzzword」的企業文化——然而,比照上述元宇宙相似的思路,AI 對於 Apple 來說,可能也「只是一個 feature」。
37signals 的 CEO Jason Fried 在推特表示,現在出現了兩項設計願景:ChatGPT 是消弭 UI,而 Apple Vision Pro 則是讓 UI 無所不在。我起先同意這項看法,然而後來我反駁了我自己。
對於 Apple 來說,AI 是一項逐年發展的技術。毫無疑問,這項技術會讓 Apple 的產品體驗更好,卻不會改變 Apple 產品的本質,即讓使用者的生活更加輕鬆美好。AI 與 UI 並非對立的,而是融合在產品的細節之中——該用 AI 時就用、該呈現 UI 時就呈現。
AI 對於 Apple 來說只是一個 feature,並且與目前流行的「生成式 AI」不同,Apple 的 Machine Learning 在裝置上運行,運用的是裝置自身的算力,而非聯網使用遠端算力。這也讓「Machine」、「Learning」這個詞顯得更加準確:機器會學習使用者的行為,使體驗更加完善。
這一點也不特殊的觀點,卻深深打動了我。對於 Apple 來說,「有辦法改善使用者體驗」才是唯一重點。這正是 2023 年 WWDC 提到 AI 時的一貫態度。他們使用 Machine Learning 和語言模型,增強視訊、打字、日記的體驗。
然而這種思維,也可能是一把雙面刃,並導致 Apple 多年來在 Siri 上的落後。當其他人(如 Sam Altman)將 AI 視為產品本身,Apple 只把 AI 視為一項附屬技術,自然會導致後者的研發能量遠不如前者。
不那麼誠實:連結與社會影響
在種種令人讚嘆的技術與市場定位之外,Vision Pro 的 Demo 裡,有兩個橋段特別令人哀傷:一個爸爸看著小孩的生日影片,以及當小孩坐在地上玩的時候,按下錄影鍵。
儘管這是合理的應用,卻肯定是孤獨的應用。因為當人按下錄影時,他已經「不在現場」(不論 Vision Pro 的畫面有多逼真)。這就好比 iPhone 帶給人類的影響:當我們到了演唱會或自然美景,第一直覺是拿出手機來拍照。然而這反而讓我們錯過了那個「當下」。更多時候,當我事後看著照片,只覺得自己拍下了平凡無奇的照片,而完全想不起來當時的體驗與感動。
就連 Facetime 也變得「不在當下」:你的朋友,看見的是一個虛擬的「你」。EyeSight(Vision Pro 外模擬臉部的顯示器),儘管我認為是聰明的設計(並且再次思考,為什麼沒有其他人這樣設計?),卻依然讓人「不在當下」。
這也讓上面提到過 Tim Cook 的專訪顯得有那麼一點不真心:「Vision Pro 不是關於抽離(isolation),而是連結(connection)。」如今我們都知道,手機以及其上的社群應用,讓大眾普遍更感到孤獨;而 Vision Pro 幾乎確定,會帶來類似的影響。
這有可能是為什麼,Apple 在今年的 WWDC 上,花了不少篇幅在心理健康(Mental Health)和自我覺察(Self-Caring)上。然而,終究無法相抵。VR 的沉浸感本質,就是會讓人與真實世界產生隔閡。這不需要是一個道德判斷,卻是一個值得長期關注的社會現象。