AI作畫的人機戰爭走向何方?
AI對於人類職業的影響及其引發的輿論波瀾,迅猛到讓人難以想象。還記得2017年,AI還是個標準的新生事物,我們的核心工作之一就是向讀者們解釋,同聲傳譯、漫畫作家、主持人等人類工作短期內仍是無法被AI取代的。而到了今年,一場因AI作畫而引發的人類畫家危機大討論卻在國內外社交媒體上演。
DALL-E 2, Stable Diffusion, Midjourney, DreamBooth AI, Wombo Dream, Make-A-Video, Novel AI……這些從文本生成圖像的AI作畫工具大量出現,越來越受歡迎,市面上由AI生成的畫作越來越多,不斷刷新着大眾對AI能力邊界的認知,大量圍繞AI作畫的爭議、AI取代人類畫手的憂慮,噴涌而出。
在AIGC的激變時刻,關於AI作畫的法律、倫理等問題也變得愈發重要,這場人機戰爭究竟走向何方?我們嘗試用一文說清整個事件的起承轉合。
起:引發眾怒的科技與狠活
AI生成的藝術畫作已經存在了很長時間,2017年,AI繪畫就成為佳士得、蘇富比等高端拍賣場所的座上賓,拍出過數百萬美元的高價,除了引發行業內人士的一些分析和唏噓之外,大眾輿論場並沒有掀起什麼波瀾。
然而,對AI作畫的聲討,卻在近幾個月來,在社交媒體中發展到了一個高峰。
其一,大量畫師宣布抵制AI。今年8月29日,一個名叫mimic的AI繪畫網站上線了測試版,允許用戶上傳15至100張圖像讓AI進行學習,然後輸出相同畫風的AI畫作。然而一些未經授權的畫作也被上傳學習,把AI生成的畫作當做自己的創作進行售賣。隨後又出現了有人將剛剛去世的畫家尚在版權保護期間的作品上傳給AI學習,這些動作相繼引發了大批原創作者的不滿,從而抵制「AI學習」。
其二,輿論危機波及幾乎所有主流AI繪圖工具。mimic事件直接激發了大量畫師和讀者對AI的不滿情緒,有人刪除了自己的公開畫作,有人開始訴諸法律條文,一時間針對數據版權、技術倫理等的爭議,也開始波及DALL-E 2、Midjourney和Stable Diffusion等知名AI生成工具。人們發現,一些很火的工具如NovelAI,訓練學習所使用的數據來源網站也存在上傳無授權圖片的情況。
網站Danbooru發布的聲明顯示,像NovelAI這樣的生成器是在數千個網站的數十億張圖片上進行訓練的,包括Pixiv、Twitter、DeviantArt和Tumblr等藝術家網站,以及Reddit、Pinterest等網站,所以從Danbooru平台上刪除作品並不會阻止AI繼續使用畫家在其他網站的作品。也就是說,只要是網絡上開放的,就有可能成為學習數據,除了詢問模型的開發者之外,沒有其他方法可以阻止自己的作品被AI學習,除非畫家把自己的畫全網都刪完,否則也很難一一查清楚是否被用來學習了。
其三,個人使用AI作畫出現了大量爭議現象。隨着開發門檻的降低,大量個人AI開發者使用開源工具也出現了大量意料之外的情況,比如有人使用AI生成yhsq等違規內容。9月6日,用AI繪圖工具Midjourney生成的《太空歌劇院》在美國科羅拉多州舉辦的博覽會藝術比賽上獲得數字類別中的頭獎,也引發了不小的爭議,因為作者所付出的勞動就是輸入描述文字,AI就會將畫作按需求創作出來,被網友認為是「見證了藝術的死亡」「沒有意義,沒有靈魂」,藝術家Genel Jumalon更直言,「用一幅AI畫作在藝術領域獲得一等獎,真是該死的事」。
擔心AI取代人類畫師,將AI作畫視為對人類能力的貶低,成為一種正在傳染的情緒。
如前所說,AI生成繪畫並不是什麼新鮮事物,為什麼偏偏近期突然在大眾群體中掀起了水花,引發眾怒?人當然不是只靠最後一根稻草壓垮的。
承接:AI作畫的內卷之路
有必要先來簡單了解一下,AI作畫是如何在幾年間從拍賣行、收藏家們關注的小眾藝術,成長為大眾創作的主流標配。
計算機視覺一直是深度學習的主要任務方向之一,包括目標識別、目標跟蹤、圖像分割、圖形處理等,有着大量成熟且廣泛的應用。具體到圖像生成領域,2015年左右,AI藝術創作主要是通過基於卷積神經網絡的遷移學習,來進行圖像風格轉換,先對圖像內容進行語義分割,再將內容和場景通過線條彎曲、風格遷移等手法,轉換成指定藝術風格,類似美顏軟件的「濾鏡」功能。顯然,這種生成方法的藝術價值並不高,能一鍵p圖的人也並不因此就自認是大藝術家,而且經常出現很鬼畜的作品,谷歌深度學習繪畫系統DeepDream加工過的圖片就十分詭異。
AI生成真正開始展現出藝術價值和媲美人類的水平,是從2016年生成對抗網絡GAN(Generative Adversarial Nets)的走紅開始的,GAN模型的原理就是讓生成器網絡和判別器網絡相互對抗,從而創作出真實度和準確度都更高的全新圖像。這一時期,各種XXGAN的圖像生成器出現,誕生了大量「以假亂真」的藝術作品。2018年10月佳士得以43.25 萬美元的價格拍賣了由AI創作的《愛德蒙·貝拉米肖像》,成為人類歷史上首次AI藝術品拍賣。
但是,GAN也不能擺脫傳統AI深度模型的問題:無法理解「邏輯」和「常識」,比如AI能夠根據文本關鍵詞把元素堆疊在一起,但因為無法理解隱藏在自然語言背後的邏輯關係,所以經常會畫出非常「克蘇魯」的反常識作品。而改變,來自預訓練大模型的興起。
通過大規模數據和暴力計算而訓練出來的大模型,展現出了強大的魯棒性,不僅在機器視覺領域表現優異,而且還不斷迭代出了跨模態生成的能力,推動AI生成從語言走向視覺。這一波 「文本轉圖像」繪畫工具能夠產生以假亂真的畫作,背後的「腦力」普遍來自大模型基礎技術的支撐。在AI繪畫工具上展開技術競賽的谷歌、OpenAI、百度等都是大模型技術的佼佼者和AIGC的推動者。
讀懂了AI作畫的技術傳承之路,也就不難理解,為什麼AI創作的爭議會在此時此刻被發酵。
首先, 巨頭雲集,技術進展超乎想象。AI作畫匯聚了大量科技巨頭「亮肌肉」,包括谷歌、OpenAI、Meta、微軟、百度、騰訊等AI能力者,使得技術突飛猛進,工具數量以前所未有的速度爆發性增長,AI作畫(圖像生成)能力也因內卷而達到令人震驚的水平。2021年1月,OpenAI推出了DALL-E一年後,又推出了最新的DALL·E 2,分辨率提高4倍,可以從自然語言的描述中創建逼真的圖像。谷歌內部就卷出了多個AI繪圖工具,包括Imagen、Parti等,微軟推出的AI繪圖平台則起名為NUWA女媧,足見野心不小。
大模型優秀的生成效果,使得AI作畫具備了一定的實用性和商用潛力,包括結合文本生成插畫、創意工作的初樣展示、自動完成勾線等重複機械勞動等,AIGC在走向產業的同時自然面臨傳統從業者的懷疑。
其次,大模型的積極開源,讓AI作畫門檻一降再降。
這一輪主流的AI繪圖工具都選擇了開源,繁榮大模型的開發生態,降低技術的使用門檻,任何人都可以使用這些工具進行創作,有的甚至是免費的。比如英國初創公司Stability AI打造的StableDIffusion就完全開放,OpenAI在9月28日開放了Dall-E 2 並提供免費試用,NovelAI在10月3號開放,都吸引了大量用戶前去使用。
相比此前AIGC只作為小眾藝術品和收藏投資對象,基於大模型的AIGC讓更多人參與到訓練、開發和使用中來。儘管各個開源社區都明確公布了知識產權相關規定,包括不得用於成人內容、仇恨或暴力圖像,避免使用受版權保護的材料。但隨着用戶的增多和門檻的下降,一旦有人不了解並遵守開源社區的知識產權規範和協議,違規情況就難免發生。
另外,法律空白與滯後,令原創者對維權感到無能為力。
依靠開源社區的約束是很難避免AI濫用,那麼能不能依靠數字作品的專項法規來保護原創者的知識產權呢?現狀顯然是令人失望的,立法作為一件非常嚴肅的事情,往往具有一定的滯後性。與飛速發展的AI技術相比,對於AI生成的作品是否具有知識產權/著作權,利用AI生成違規圖像如何處理,相關法律法規在全球範圍內都還在空白和討論階段,目前只有個案作為參考。2019年斯蒂芬·泰勒(Stephen Thaler)希望將他發明的DABUS人工智能系統命名為「發明者」,並獲得相關發明專利,但在美國、英國、歐洲、澳大利亞、德國等地的法院都遭到了拒絕。目前看來,在全球範圍內,知識產權制度更注重人類創造,使用AI並點擊「go」並不被認為是創造性行為。比如深圳市南山法院就曾判定在一起案件中,AI輔助協作系統生成的文章,受到著作權法保護,擅自複製傳播需要承擔相應的民事責任。
知識產權本身就存在的判定難、維權難的特點,而AI生成內容法律保護的「缺位」,更加劇了維權的難度,很難約束違規使用,這也使得人類原創畫師面對AI繪畫工具,其知識產權也處於「真空」地帶。
技術、文化、倫理與法律等各種因素交織在一起,構成了開篇中AI作畫的種種爭議和風波的緣起,這是一個環環相扣的故事。
轉與合:創作者的激變與新機
那麼,有爭議是不是意味着AI作畫就此停滯了呢?還真不是!
事實上,經過頻繁的討論,大量原創畫師對於AI繪畫工具都有了一定的嘗試和了解,從一些知名畫師的反饋來看,對於AI作畫這樣的AIGC應用,普遍表現出了三種態度。
1.AI想取代人類畫師,還早。
某博主測試過後發現,「搞出來的能看的圖多少有一些,但符合描述意圖的圖基本可以說沒有」;「AI畫畫其實在我這個修圖師眼裡其實跟ps里那個填充功能差不多」。原因在於,AIGC的內容質量還有提升的空間。一方面,AI大模型的自然語言理解能力與人類還有很大的差距,GPT-3所生成的文本也就相當於小學生水平,這種情況下要讓AI繪圖工具理解複雜的文本,並準確用圖像表達出內容思想,還是有點困難的。另一方面,在商業上,藝術品市場推崇的都是極富獨特性的作品,稀缺性一直是藝術品重要的定價標準,工業化、批量產出的東西對收藏家來說沒有價值,隨着AI繪畫工具的開源,手工製作的獨特產品或許才會成為人們追求的藝術。這種趨勢其實已經出現了,有網友就認為未來約稿很可能「純手工」「零AI」反而會成為賣點。
一位創作博主直言:標榜自己的圖是手工繪圖的畫師,今後想要過得富足,或許需要儘量為自己的作品附加額外的價值——這種生活方式早已有人在運營,那就是藝術家們。
所以至少目前為止,AI繪畫工具能提供很多幫助,但還是無法取代人類畫師的。
2.AI作畫,確實有點用。
需要注意的是,藝術創作、藝術品收藏是一種相對小眾的活動,能夠成為藝術家的是極少數極小眾的一批人。不過,日常生產生活中存在大量視覺和設計工作。在這些領域中,AI已經能夠扮演非常有用的「作圖助理」角色,成為大勢所趨。
一種是減少重複性/風險性工作。比如視覺創意中,與客戶溝通耗費大量時間和精力,存在大量不確定性,經常畫完即使版後客戶說「還是第一版好」,遇到這種讓美工自閉的情況,AI就可以扮演起一個任勞任怨的乙方,快速生成多樣化的AI創意圖片,避免了過重的前期投入乃至返工。另外,每逢節日大促活動,美工難免就會遇到大量重複枯燥的工作,比如製作高度同質化的海報,也可以由高水準的AI能力來完成。因此有設計師將DALL·E命名為「傻逼甲方終結者」。
另一種是AI作為輔助工具,提高設計師的工作效率。許多基於AI繪圖工具都已經被開發為Figma、Photoshop、Blender等工具的插件,幫助創作者渲染細節、一鍵填色、提供靈感……而對於沒有受過系統性繪畫訓練的普通人來說,藝術創作的門檻也大大降低了,有網友用Midjourney合成了去世祖母在花叢里的照片,有網友用它為自己寫的同人小說製作插畫,這些在大模型和AIGC出現之前,都只能委託給專業畫家,歷經漫長的等待來完成,而現在用AI繪圖只需一鍵即可完成。
普通人也能低成本甚至零成本地實現腦洞,AI大模型支撐下的創作自由才剛剛開始,因此也有創作者直言,「AI繪畫是在造福人類」。
3.AI知識產權保護,需要加速。
對於創作者來說,AI繪畫工具無疑是絕佳輔助,與此同時,避免AIGC的野蠻生長,因一些違規作畫的操作而陷入爭議和負面,也成為藝術界、AI界、法律界在一起共同討論、加速立法的當務之急。
目前來看,AI作畫的知識產權爭論焦點主要集中在三個方面:1.數據版權。AI模型訓練對於樣本數據的數量和覆蓋廣度有要求,如何確保數據版權的來源並予以保護;2.創作版權。數據只是侵權的第一步,「畫風抄襲」是畫師們非常苦惱的一種侵權,AI生成畫作的元素、風格相似度要判定是否抄襲,比判定人類抄襲作品的難度更大;3.利益保護。目前大量AI繪畫工具都提供付費服務,而一旦AI生成技術商用以後,作為數據源頭或創作者的人如何獲得合理回報和收益,目前也沒有有效的解決方案和保護手段。所以DALL-E 2直接規定,其使用者無法出售用它創作的任何藝術品。但如果能有一種措施,準確判斷貢獻度並將收益分配給貢獻者,比如聯邦學習技術、區塊鏈技術等的支持下,相信許多原創者也樂於參與到AIGC的產業化進程中。
有了法律與技術的保障,AI作畫才能在邊界內加速人機合作,而非割裂與衝突。
總而言之,現代文明的演進,是一個世界的祛魅過程。工業化的過程,就是用蒸汽機、電氣化等科學技術的系統運用,去取代那些能工巧匠們的奧秘,而這個祛魅過程,也帶來了生產的大批量、高效率和低成本,普羅大眾的生活比傳統時代的任何時候都要便利和富足。
從這個意義來看,AIGC何嘗不是一個藝術祛魅的過程。就像Midjourney主創所說:美麗的石頭來自河流,但河流不是創作者。這套AI系統並無創造的能力,但美可以來自其中。(Every beautiful stone comes from the river, but is the river creative? No, I don’t think so. Is the system creative? No. Can beauty come out from it? Yes. )
沒有什麼能瓦解人的靈魂和創造力,就像攝影術不會瓦解梵高和莫奈。智能時代,擁抱AI已成定局,這個進程中,人如何尋找到人的價值與意義,將是我們每個人所共同面臨的一個課題。-(鈦媒體/文:腦極體)