最近生成式 AI(Generative AI)發生了兩件有趣的事,分別是 Artstation 上對於 AI 圖片的抗議,以及 ChatGPT 橫空出世,卻被發現數學很爛。看似無關的兩件事,卻讓我對於「生成式 AI 是否會取代人類」這個問題,有了更具體的想像。
Artstation 上針對 AI 生成圖片的抗議
第一件事,是在藝術分享平台 Artstation 上,出現了許多「NO TO AI GENERATED IMAGES」的圖片,用來抗議許多使用者,上傳了大量的 AI 生成作品,但是又不標示清楚。
Artstation 主要的領域是遊戲這類的娛樂領域,恰好 Midjourney 的 v4 最擅長的就是超級寫實跟遊戲風格。這些藝術家主要的異議,並不是反對生成式 AI;相反地,他們多半很愛玩 Midjourney。然而,事情起因在於,平台推薦了一張 AI 生成的圖。這些抗議的藝術家認為,那與花了幾百個小時繪製出來的純手工完全不一樣。
實務上很難區分 AI 生成和純手工製作的圖,等到 AI 學會怎麼畫手之後,想必會更難區分。然而「如何區分」的技術問題,和這次爭議沒有太大關係。這次爭議,主要在於 Artstation 這個平台,更像是個人作品集+藝術家社群網站,業外人士用 AI 生成的圖混進來,自然會讓他們很不開心。
打個比方,在一個手工蛋糕的市集裡,如果有人外帶連鎖蛋糕店過去擺攤,大概大家都會很不爽。這不是連鎖蛋糕店好不好吃的問題,而是場域不對。手工蛋糕主打的是製作者的個人技術,參展者可能也會想彼此認識,互相交流共同興趣。如果有人拿外帶蛋糕擺攤,還變成市集推薦攤位,那事情就嚴重了。
ChatGPT 不會算數學
第二件事,則是有人問 ChatGPT「27 這個數字有什麼特殊之處」,沒想到 AI 回覆「27 是質數」。更有趣的是,最後這位網友是叫 AI 用 Python 把程式寫出來,確定 27 可以被 3 整除,嘴硬的 ChatGPT 才終於認錯。
ChatGPT 數學不好,但是能寫出易讀的程式碼,能解一些 Leetcode 題,還能看 UI 設計稿,就把整個前端刻出來。這或許足以說明,寫程式和數學——更準確來說,高中以前那種算術型(arithmetic)的數學——關聯不大。
寫程式超過十年的經驗裡,我一直覺得寫程式更像是寫文章,而非數學計算。在實際工作裡,寫程式更重要的是如何寫出一篇有邏輯的文章,而非解出某人精心設計的謎題。
然而,在 ChatGPT 出現後,未來大多數工程師,很可能不再需要學習程式。我很期待在十年或二十年後,工程師只需要專注如何解決問題,而將撰寫程式碼都交給 AI。到時候,僅剩的軟體工程師很可能真的是在解決非常困難的數學問題。而我猜測,未來的產品研發職位,會更像是現在的 Technical PM,負責確認技術架構和需求,並透過詠唱來讓 AI 寫出夠好的程式碼。
目前,ChatGPT 的最大問題,在於即使是錯的,它也可以自信爆棚,一本正經說幹話。像是堅持 27 是質數,或是堅持湯瑪斯・霍布斯支持分散權力。然而,這對於開發產品或許不是壞事。我們可以要求 AI 先寫測試,確認需求一致,然後再要它寫產品程式碼,實現全 AI 的 TDD(Test-Driven Development)。
這簡直是開發流程烏托邦,天堂般的理想狀態。畢竟,目前有許多公司,確實是把工程師當成一部程式碼生產機器。
生成式 AI 對人類的意義:首度成為有用的創作輔助工具
這兩件事,卻讓我聯想到:當初 Alpha Go 擊敗各路好手後,有許多棋手紛紛開始向 AI 學習如何下棋,為什麼這件事並沒有在藝術領域發生?
原因在於,圍棋是一項有「規則」和「勝負優劣」的運動,常規習慣以外,又足以致勝的棋路,就是值得研究的「洞見」。然而,由於藝術的規則並不明顯,通常也沒有所謂的輸贏,自然也就很難有這種洞見。而一旦知道是由 AI「無機生產」,背後根本沒有什麼巧思存在,就更不會讓人想學習。
就像我們不會去檢視 AI 產生的程式碼,然後問「這背後有什麼巧思」。繪圖、寫程式,在很多時候是一種「勞動」。這並非指這些工作沒有創造性,而是:畫出線條、來回調整顏色,或是寫一個 function、按下測試,過程裡有很高比例是反覆性的工作,而這可能是 AI 更擅長的。然而,繪畫背後想傳達的意圖,或是產品功能是否符合需求,乃至於客戶究竟在顧慮什麼,這些具有一定創造性的活動,目前依然是人類才能做到。
「幫你把事情都做完的 AI」vs「總會找到事做的人類」
然而,有沒有辦法透過勞動來取代巧思?有可能,譬如叫 AI 產生 100 種廣告文案,每個都投投看,自動選擇比較好的繼續測試。也因此,所謂「你的工作會被 AI 取代」這類預言,會先從「不需要巧思,只需要符合特定規則的行業」開始;接下來則是「容易被大量產製、大量 A/B Test 的行業」,有點快時尚席捲服飾產業的味道。
這也是為什麼,我認為 Midjourney 和 ChatGPT 的出現,和 Alpha Go 的意義不太一樣。後者是用來「超越人類」,前者則是「輔助人類」,證明 AI 可以成為增加生產力的助手,未來,可能會是人類(藉由 AI 的協助)提供想法,而由 AI 執行大多數勞動性的部分。
工業革命至今,用機械取代了一大部分的肉體勞動。現在,AI 則會取代一部份的心智勞動。
然而,有些人會進一步預測樂觀的未來:將來,人們都不需要工作,如果真的要工作,那也是在創造。
我倒是沒有這麼樂觀。自從蒸汽機和電腦發明後,也總會有人認為「未來的人都不需要工作了」,然而這件好事從來沒有實現,甚至「上班八小時」這件事,就是工業革命時代被發明的。雖然起初立意良好,現在卻變成公司租賃個人固定時間的話術。
我對於人類替自己找事做的能力還是頗有信心的。雖然勞動的形式改變,但是本來就不是每個人都擅長或樂於創造。將來,必定會持續有更多事被「發明出來」,讓人類持續勞動。人們得決定要不要做自己不喜歡的勞動,以時間換取金錢,這也跟現況一樣。AI 顛覆產業,卻不太可能改變人性。
馬斯克對 OpenAI 提起訴訟,因此公開了許多與 OpenAI 的往來信件。對此,The Verge 寫了一篇報導,揭露這些信件。而與去年出版的《馬斯克傳》對照,會發現一些有趣的事。以下是簡單的年表
近期 Gemini 發生了兩起事件,分別是發表了反人類宣言,以及對癌症病人進行沒有同理心的說教。對此我有 4 點延伸零碎想法。
最近在研究 Clarymind 的留存率,恰巧 YC 最近一支影片談 Cohort Retention,是我看過最清楚、最好懂也最實用的教學。Cohort Retention 是軟體服務重要的指標,意思是把用戶分群後,看不同群組的留存率。本文大部分內容來自這支影片,也加上一點點自己的經驗。