至今這波生成式 AI 熱潮裡,最抖的幾個產業之一,可能就是圖庫素材網站。
以我個人為例,過去做社群圖時大量依賴圖庫,現在幾乎很少用到了。畢竟,總是可以先去 Midjourney 試試看,真的生不出來再去找素材。
前陣子還出現了一個 Chrome 的擴充功能,能直接看一張網路上圖片,然後給你一張全新生成、長得差不多的圖(不過目前似乎不能運作)。「理論上」這樣就沒有版權問題了,因為這張圖是第一次出現在世界上嘛。
當然實際上,等這類 AI 生成工具更加成熟,想必會有一番法律攻防戰。前幾天,Getty Images 就決定對打造 Stable Diffusion 的公司 Stability AI 提起訴訟,認為對方「不合法複製並處理數百萬張版權保護的圖片」。
也因此,我對於素材類網站如何應對這波衝擊,感到非常有興趣。以下會討論 Getty Image、Shutterstock、Adobe Stock,以及也算是素材類服務的 Canva 各自如何反應。同時也會聊一聊,為什麼我認為最適合 AI 的商業模式,其實依然是廣告。
直球對決:Getty Images 狀告 Stability AI
Stability AI 所訓練的 Stable Diffusion 是一個開源模型。除了 DALL-E、Midjourney,大多數在這波生成式藝術 AI 熱潮冒出來的相關產品,應該都是改造或直接使用 Stable Diffusion。
DALL-E、Midjourney 是不可能公開自己的 dataset,但由於 Stable Diffusion 是開源的,便有獨立第三方爬出了他們用的訓練資料集 LAION,發現裡面有大量包含 Getty Images 在內的圖庫資源。不僅如此,有點好笑的是,Stable Diffusion 生成的圖片裡,甚至可能會出現 Getty Image 的浮水印。
除了 Getty Images,也有三位藝術家向 Stability AI、Midjourney 以及藝術家平台 DeviantArt 提告。這兩起訴訟都是近幾日才提出,等到判決結果出來還要一段時間,未來想必也會有更多這類的訴訟。
可以想見,相關的智慧財產權判定將非常複雜。例如,個人將含有浮水印的圖庫載下來,作為參考或 placeholder,這算是合理使用還是侵權?若換成 AI 公司狀況會不一樣,差異是在圖片數量嗎?又例如,Google 也透過圖片搜尋引擎間接獲利,那麼 Google 的爬蟲算是侵權嗎?
而這些訴訟,比較明顯是為了短期利益,且前提是「AI 沒有創造力,創新是來自於人類的工作」。然而不論訴訟結果為何,可以預測,未來生成式 AI 可能會達到「自己訓練自己」的程度。如同 Alpha Go 後來是自己跟自己下棋,而非依賴棋譜,生成式 AI 也不一定需要依賴藝術家的作品。
打不贏就加入:Shutterstock、Adobe Stock 允許販售 AI 生成圖片
對比 Getty Images 一言不合就上法院,同為圖庫服務的 Shutterstock 和 Adobe Stock,則是在去年底就開放販售 AI 生成圖片。(Getty Images 自然是禁止。)
然而,在圖庫網站銷售 AI 生成圖片,是否就能拯救圖庫產業?我的答案是:不行。
這在本質上,其實是「AI 會不會取代搜尋」的問題。如果絕大多數人都掌握了 prompt 詠唱的技能,自然就不會需要到圖庫,使用搜尋功能找到適合的圖片。正如當大家都知道如何直接當伸手牌,跟 AI 要現成答案,自然就不會需要 Google 資料。
然而,與「ChatGPT vs Google」不同,「Midjourney vs 圖庫網站」並非商業模式的差異。同樣都是訂閱服務,只要 Midjourney 可以給出夠靈活、適合多數場景的圖片,使用者轉換的門檻並不高。
岔題:AI 會取代搜尋嗎?
「ChatGPT vs Google」面臨的則是商業模式的問題。Google 提供免費、優質的搜尋結果,並且開放廣告版位,讓商家出現在頁面上方。ChatGPT 的出現,會直接打破這套商業模式,卻沒有明顯銜接的新商業模式。
這邊想岔題講一下,AI 是否會取代搜尋。曼報的 Manny 認為,未來可能出現「付費 AI+免費 Google」並存的模式,也就是免費仔繼續使用 Google,但付費就能當伸手牌。
但是我認為還有另一種思路。只要是付費產品,都會造成嚴重的推廣門檻。我更傾向 AI 產品會是「免費+廣告」模式:叫 AI 生成建議是免費的,但是中間安插了廣告連結。
例如當我問 AI「給我義大利必去的景點」,在 AI 生成的短文內,就安插了義大利的二天一夜套裝行程,或是某間位於佛羅倫斯的餐廳廣告。
甚至我們可以進一步想像,就連置入廣告的推薦文,也都是 AI 撰寫的,廣告主只需提供一些基本資訊。因此,AI 的推薦幾乎與回答本文融為一體,可說是最完美的業配廣宣文。(註:當然實務上,會需要標示是廣宣文,以免引起反感。)
Paul Graham 最近發了一串推特,提到「如果要準確想像未來,不要只想像酷炫的科技,而是要想像酷炫科技加上討人厭的廣告。因為人們喜歡免費的東西。」付費產品幾乎無法與免費產品競爭,廣告模式的勝出機率應該會是最高的。
打不贏就開發:Canva 提供生成式 AI 功能
Canva 可以視為廣義上的圖庫素材商,只不過提供的不是圖片,而是各式模板。2022 年我有機會到台大資工系,跟寺尾哲也給一個職涯對談,當時就用了 Canva 做投影片。我的感想是:這是我這輩子用過最順暢的投影片工具,大概未來再也不會用 Power Point 或 Google Presentation 了。
Canva 的優勢在於很會做產品,並且是做到「剛剛好的好用」。除了介面非常直覺,Canva 也不會把功能做得很齊全、很複雜,卻符合了 80%、90% 的用途。我在使用時,就覺得「對,我只需要這些功能就夠了」,不像使用 Power Point 時,要面對一大堆選單跟按鈕。
在 2022 年底,Canva 推出了自己的生成式 AI 功能。由於是很短時間就發布,我們可以猜測,他們其實也只是串接了 Stable Diffusion 或 Open AI 的 GPT,而非自行訓練模型,因此在技術層面上,並沒有特異之處。
然而,「模板」這門生意,在技術層面本來就沒有特異之處,Canva 卻藉此長成了估值 400 億美元的超肥獨角獸。
AI 並非 Canva 的強項,而 Canva 也不打算踩入,而是認知到自己的優勢,把新技術轉換為好用的產品。我試用後,確實不覺得 Canva 的 Magic Write 給出的結果,跟 Open AI 的 GPT Playground 有什麼差別,但是介面體驗卻好上一截。
當 AI 成為基礎建設,戰場就不再是模型技術本身,而是比誰能推出更好的產品。這時,擅長做產品,且具有高靈活度、反脆弱屬性的公司,將有最好的勝出機率。
附註
- 當 AI 可以取代搜尋引擎,瀏覽器與搜尋引擎的 unbundle 就會更加明顯。雖然不確定現在踩在這個市場的瀏覽器新創,有多少可以撐到搜尋退流行那天,但這也讓我更加期待他們的表現了。
- 我用 Canva 做的投影片,可以見這篇演講紀錄文。一用之下驚為天人,聽說現在的年輕人(等等我也需要用到這個詞了嗎)也都只用 Canva:
✅ 海量字型(而且有中文!)
✅ 海量模板(多到一輩子都用不完)
✅ 拖曳位置輕鬆不跑版
✅ 自動對齊
✅ 元件群組邏輯單純
✅ Color Palette⋯⋯
大家可能會想說,這些 PPT 也有啊,然而 Canva 把各項功能整合起來以後,產品體驗好上不只一個層次。就像我家也有牛肉跟奶油,但顯然我做的跟高級法式料理不會一樣。