在 SIGGRAPH 2024 上,黃仁勳邀請祖克柏(Mark Zuckerberg)對談,由黃仁勳訪問祖克柏。整體上,有點像迷你的 Meta 發表會,並談了許多有趣的 AI 趨勢:
- 開放 vs 封閉:為什麼 Meta 選擇開源 AI 模型
- 下一代 Llama:能判斷意圖的模型
- 雷朋眼鏡與 AI device
此外,也有很多好笑的段子:兩人互相吐槽、祖克柏去黃仁勳家切番茄(?)、互換外套迷因。
全場亮點,則應該是祖克柏對蘋果爆粗口。這段黃仁勳問祖克柏,Meta 開源 AI 模型的動機,祖克柏的回答分為兩部分:
- 開源生態系可以降低成本
- 看好(希望?)開放平台勝過封閉平台(蘋果)
以下介紹這場對談中,我的收穫與想法。
開源生態系,帶來的成本優勢
祖克柏提到,當年 Meta 在建立分散式運算的基礎設施時,其實已經落後其他公司,即使做了也不會是競爭優勢。因此乾脆開源,從生態系中獲得好處。
這段暗示:Meta 實際上在 LLM 上落後。於是比照當年經驗,開源後讓其他工程師加入改善,進而有機會成為行業標準、節省 Meta 的成本。
在此之前,我認為開源要勝過 OpenAI 或 Google 等封閉模型,機會微乎其微;然而我最近修正了我的想法。
客觀上,Meta 有資料、有人力、又有錢。祖克柏大力推動的開源,也許真的有機會超車 OpenAI。(我們在 Clarymind 裡用的 LLM 主力就是 Llama,效果也是目前試過最好的。)
但是,開源對於 Meta 究竟有什麼好處?
反過來想,封閉對 Meta 也沒有好處。Meta 的商業模式,和生成式 AI 關聯度不高,跟推薦演算法比較有關(也就是現在已經不酷的 Machine Learning)。
但唯一確定有壞處的,是完全不碰 AI。所以,與其把模型放在自家倉庫,不如先開源出來,讓社群圍繞著 Llama 做配套工具,再慢慢想這些模型該如何產品化。畢竟 Meta 真正的護城河,是累積二十年的海量資料,而非模型本身。
押注開放生態系獲勝,對抗封閉平台
Meta 開源 AI 模型的第二個理由,源自跟蘋果的衝突。
這邊祖克柏開始講古:Facebook 是在完全開放的網路上。後來,蘋果在行動端大獲全勝。
好處是,現在大家口袋裡都有一台電腦了;壞處是,平台現在開始限制你什麼不能做。這段也是祖克柏罵髒話的地方:
「有太多次我想打造些什麼,平台會告訴你:『不,你不能做。』我說,去你的。我們接下來要⋯⋯」
(隨後被黃仁勳打斷,祖克柏尷尬道歉:「抱歉,我們前二十分鐘還好好的,但一提到封閉平台我就有氣。」)
簡介 Meta 和蘋果的恩怨:2021 年開始,iOS app 需要經過同意,才能追蹤使用者行為(即常見的「不要追蹤」的彈出警告)。
這個改變,使得廣告追蹤的精準度大幅下降,Meta 也因此蒙受許多潛在損失。
從蘋果的角度,他們的客戶是買 iPhone 的人,因此蘋果有動機避免使用者產生任何不滿。重視隱私,就是累積使用者的信任。
然而從 Meta 的角度,追蹤愈細,就愈能精準推薦合適的廣告,瀏覽體驗就會更佳。當使用者看到的都是自己想看的廣告,自然也就更舒服順暢。
對於 Meta 的常見批評是:「追蹤使用者,就是出賣使用者資料」。我不認為這個批評可以簡單成立。Meta 與蘋果的衝突,可說是商業模式不同,也可說是對於「什麼才是好的使用者體驗」有不同想像。
當然,Apple 的競爭優勢在於高度垂直整合,封閉就是其護城河。而封閉平台策略,也與許多其他參與者的利益衝突,比如 Epic Games 訴訟案。但祖克柏相信,開放生態系會再度獲勝(儘管沒有深入論述,似乎就只是一個信念)。
能判斷意圖的 AI 模型、雷朋眼鏡、Segment Anything 與 AI Studio
對談中也提到其他與 Meta 相關的 AI 進展,以下一一介紹:
Llama 4:能判斷意圖的 AI 模型
祖克柏提到,下一代 Llama 4 的目標,將不只是聊天機器人,你問一句他答一句;而是能判斷使用者意圖,甚至計算為期數個月,直到發生了某件大事再告訴你結果。
這也是我對於 AI 的想像。我並不欣賞目前主流的聊天機器人 UI。只因為 ChatGPT 出場時是聊天機器人,後續的新產品就全都是聊天或輸入框介面,不管產品究竟是否適合。
我想像中真正好用的 AI 是主動且隱藏的:
- 隨時都在搜集資訊,而非只看使用者的 prompt
- 判斷有必要時,「主動」給出建議,而非被動「等使用者問」
這並不是什麼創新的願景:推薦演算法就是主動且隱藏的。
推薦演算法隨時都在搜集瀏覽資訊,並且主動推給使用者可能有需要的內容或商品。使用者並不需要下 prompt 或問問題。
從某個角度來說,有了更強大的語言與圖片生成模型後,許多 AI 產品的想像力反倒被侷限了。
Meta 雷朋智慧眼鏡
此外,對談上也淺談到 Meta 最近做的雷朋智慧眼鏡。在眼鏡上,由於體積問題,可以做的事情比 AR/VR 顯示器更侷限。祖克柏也談了智慧眼鏡的開發歷程:
- Meta 優先顧及美感,找了雷朋合作,確保這至少會是很好看的眼鏡
- 接著,盡可能在上面放入各種科技:相機、視訊直播、麥克風、喇叭⋯⋯
- 最後發現,這些 sensor 恰巧就是開發 AI device 需要的東西
祖克柏提到,如果五年前問他,他一定說 AR 技術會比 AI 更早,畢竟各項技術都在持續改善中,但沒想到是 AI 率先突破。
他也預測,「無顯示器的眼鏡」會是更流行的產品。我同意這點——我認為 AI device 並不需要螢幕。
接下來幾年,將會有一波 AI device 的推出。Meta 老冤家蘋果自然是做出好用 AI device 的強力選手,並且可以把 AI 模型「外包」給 OpenAI 等廠商,專注於硬體設計與產品體驗上。
關於 AI device,我曾在〈【WWDC 2024】Apple Intelligence:只有蘋果做得到的事,與 AI Device 的序幕〉 中討論過:
想像一個隨時隨地陪在身旁的 AI 助手:可同步看到你眼前的場景,並給予回覆。這樣的 Device 應該盡可能輕巧、沒有顯示器。在戶外時,可以用 Apple Watch、iPhone 作為螢幕;在室內與家中,則可以是 Mac、Vision Pro。
Segment Anything
Meta 也釋出 Segment Anything 2 模型,主要功能是分辨畫面上不同物體,並且詳細畫出邊緣(不只是方形框)。例如,辨識出模特兒身上的外套,或是框出畫面上每一頭牛。
第一代只能辨識靜態圖片,現在則可以辨識動態物體了。這並不容易,因為需要考慮碰撞、交錯等運動中物體會有的行為。
我之前工作曾參與研發「辨識動物細胞」的生技軟體,其中主要的技術挑戰就是:如何知道兩個細胞交叉運動之後,哪一個是哪一個?當時我們在這上面花了不少工夫。
AI Studio
此外在這場對談上,黃仁勳也 cue 到 Meta 新發布的 AI Studio:讓創作者或商家 fine tune、做出能模仿自己的 AI agent。
祖克柏的願景是:好比現在每個商家,都有自己的 email、官網或社群媒體帳號,未來每個商家都會有自己的 AI agent,與顧客對話。
即使我認為這個願景有道理,但連他自己也說,這個產品還非常早期,距離真正落地還要一段時間。
更多彩蛋與段子
除了罵髒話,這場還有很多彩蛋。
黃:如果我知道要這麼久才會成功⋯⋯
祖:你可能就不會創業了。
黃:不,我會像你一樣大學輟學去創業。你可是領先了 12 年。
另一段,黃仁勳提到找祖克柏去他家吃飯,問他有沒有吃飽,祖克柏說:「我還想再吃一個。」
黃:通常客人會說「嗯嗯有飽」。
祖:Jensen,再做個三明治來。
做三明治時,黃仁勳叫祖克柏去切番茄,以為他會把切好的番茄像撲克牌那樣疊好。
沒想到祖克柏不僅每片番茄厚度都一樣,精細到毫米,還跟黃仁勳說需要再拿一個盤子。
黃仁勳一看,發現每片番茄被分開平鋪在盤子上,彼此不互相接觸:「只要番茄被切片,他們就不准彼此碰到。」
祖:我只是副廚,你要把番茄疊起來要先說啊!
另一個彩蛋是,祖克柏突然變帥了。以前只穿灰襯衫、超短髮、面無表情,今天這場不僅明顯變壯超多,還戴金項鍊。
黃仁勳問他發生什麼事,祖克柏說:未來大家都要戴酷炫時尚的 AI 眼鏡,我得以身作則。
「祖克柏變帥」也是今年的一個網路迷因,他似乎突然下定決心要換造型:
最後對談結尾,祖克柏送給黃仁勳一件黑皮衣外套,脖子上有毛茸茸的羊毛(祖克柏:給這人一條金項鍊!);黃仁勳則是現場把皮夾克脫下來送給祖克柏,致敬了網路上兩人互換外套的迷因。
結尾異常歡樂的一場對談,內容對我也有許多啟發,推薦一看。完整對談:
讓 Clarymind 協助你更主動、有意識地使用社群!Clarymind 是 Self Care 自我照護工具箱。包含呼吸練習、冥想計時與 AI 引導、睡眠音樂、自我肯定等功能。
近期推出的螢幕時間管理,可以避免自己無意識滑社群。我自己的體驗是:社群焦慮大幅減輕,也省下很多時間(每天少滑 2 小時,等於一年多出 30 個整天!)▶︎ App Store 下載 Clarymind
更多關於 Clarymind 螢幕使用時間功能的介紹:〈Clarymind 新功能「螢幕使用時間管理」,以及減少無意識滑社群帶來的好處〉
註:Clarymind 是我共同創立的公司