當AI入侵藝術創作的操作系統
"人工智能已入侵人類文明的操作系統。"這是《人類簡史》作者尤瓦爾·赫拉利對於AI疊代之迅猛而發出的感嘆及憂慮。
赫氏素來以演化生物學的角度闡釋人類歷史,當過往的"AI威脅論"集中於智慧機器奴役或滅絕人類,赫氏則認為今天的AI具備了操縱及生成語言的非凡能力,出現"會講故事的計算機"無疑將成為人類史的一個拐點。
考察AI藝術創作領域,這種"入侵操作系統"的狀態已初現端倪且迅速蔓延,那麼機器語言將如何影響人類的創作思維及美學表達?在人機交互的系統框架中,各自又將扮演怎樣的角色?
* 詞元生萬物是語言的進化還是退化
赫拉利認為語言是人類文明的基本要素,而正是通過改變語言表達的習慣與構成,AI得以"操縱"人類觀察及思考的方式。換言之,"矽基生命"正嘗試從根本上瓦解並重塑最頂端碳基生命的文明累積系統。
赫氏的一系列觀點顯然將AI視為入侵物種而懷有"敵意",但由語言這個極為重要的符號系統出發,思考AI與人類文明的現時及未來關系,確是一條新穎而有效的路徑。不妨由"提示詞"開始我們的討論。
但凡對AIGC稍有接觸,便不會對文生圖、文生視頻感到陌生。
想象一下在文本框內輸入蒙娜麗莎、立體主義兩則提示,AI送出的極大可能是畢加索版的神秘微笑,你當然還能額外獲得波普版、水墨版乃至黏土版。
文本驅動是AI創作的最基本形式,由此看來,AI對人類最直觀的"操縱"在於那些連續的、高度依賴上下文的語義表達,由斷裂、跳躍的語素、詞、熟語等語言單位直接完成了,且完成的形式在情境的邏輯性、完整性上日趨合理,並越來越清晰地展現出一種機器創意。
這就導致一個悲喜難辨的結果:當我們將語義表達的概念拓展至藝術創作,過往那些引以為豪的豐富經驗、刻苦訓練、入微觀察、情緒峰值,都在體量盡可能縮小的音義結合體面前,顯得性價比很低。
隨著提示詞工程師成為職場新寵、9塊9的AIGC課程充斥網絡,人工智能顯然帶來了"6·18"般的創作狂歡。
那麼回到語言的討論範疇,基於提示詞的"操作系統"究竟是一種進化還是退化?
在AIGC的語言模型中,"詞元"這一翻譯代表著機器以數字形式來讀懂人類詞句的最小語義單位。
提示詞中的長文本經由"分詞"步驟拆解為詞元,並通過嵌入、位置編碼等一系列處理,由物理世界的非結構化數據轉為機器可理解的結構化向量,圖片、視頻等多模態輸入的最終目的地也便是多維向量。
暫不展開複雜的技術機理,而用螞蟻搬家的故事來理解一下詞元的無窮力量。
一只螞蟻承載負重、兜兜轉轉大半天回到蟻穴,而當成千上百集體遷移時,卻能驚人地依據地形選擇出最便捷、最合理的行進路線,路遇急流亦會抱作一團滾入河中,通過犧牲少數邊緣個體而獲得蟻群的勝利。
這種整體大於部分之和的智能爆發被理論生物學家貝塔朗菲稱為"湧現",而一旦突破聚合的奇點,宇宙起源與生命演化都在湧現之列。
詞元就像一只螞蟻,當我們投餵足夠多的語料給大語言模型後,由表及裏湧現而出的是AI對於提示詞中潛藏的藝術風格及情感傾向,產生了識別、理解以及"想象"——假設我們意欲為"一鍵生成"添加一些擬人的色彩。
同時於規模法則之下,隨著模型尺度急劇增大,其計算精準度呈現出昂然上揚的冪律曲線。
正如OpenAI從未將Sora簡單地等同於視頻模型,而是野心勃勃地稱其為"世界模擬器",當你察覺到墨鏡女郎鏡片上的反光時,囈境與現實間的界線似乎並不那麼重要了。
表面上看,多模態提示詞代表著創作界面的全然改頭換面,而背後的詞元生萬物,體現出機器對藝術世界新一階段的理解與掌握,更是人類在新一階段對藝術思維的形成與表達、創作工藝的更新與再造產生了顛覆舊知的認識與行動。
一個有趣的例子是前不久全球首部AI長片《我們的終結者2重製版》上映,故事背景設定為ChatGPT一統天下的未來世界,OpenAI派遣機器人穿越時空刺殺人類反抗軍領袖山姆·奧特曼,也即是現實中OpenAI的創始人,整體情節與經典科幻片《終結者2》形成了呼應。
撇開影片中部分影像細節的不到位,其製作本身便掀開了電影工業的新篇章。
項目啟動於好萊塢編劇大罷工之際,在傳統電影技術崗位缺失的前提下,50名AI藝術家利用ChatGPT、Midjourney、Runway等五花八門的AI工具,完成了50個彰顯個人風格及工具特性的影像片段,整部長片由此"拼湊"而成。
這樣的"草臺班子"在3個月內完成了編劇、導演、場記、美術、配樂等所有標準工業流程,證明了AI在降低使用門檻的同時,帶來了跨學科、跨門類的通用智慧。
若將語言範疇由藝術創作的技法與規律,再度拓展至認識宇宙世界的運行真理,這種通用智慧則更令人驚嘆。
Deep Mind旗下的AlphaFold於數年前,已預測出100萬個物種超過2億個蛋白質的結構,幾近涵蓋地球上所有的已知蛋白質,而今天的AlphaFold 3已將預測範圍擴展到了更為廣泛的生物分子。
顯然AI在各個領域對於幫助人類認識自身,發揮著日益積極的作用,那麼人類又該如何可持續性地與AI相處?
* 從逆向圖靈測試到人文的勝利
近日一位AI獨立開發者設計了一項別出心裁的遊戲,將亞里士多德、莫扎特、達·芬奇、克利奧帕特拉、成吉思汗五位"角色"設置於AI世界的一節車廂中,其中只有一位是人類,其它幾位均為GPT、Claude、Gemini等頭部引擎驅動的AI玩家,五人間通過互相問答,並以投票形式決出誰是混入的異類。
人類扮演的角色最終被四位AI玩家中的三位以缺乏領導力與戰略思維為由,判定為非我族類。
若熟知70多年前的圖靈測試,此次由機器檢驗人類的反向實驗便顯得格外有趣且有深意。
在愈來愈緊密的人機系統中,如何與AI相處,便成了一個需要回答的問題。
在現時的答案中,過往的"工具論"顯然不合時宜,AI不再是輔助導演完成分鏡、幫設計師生成草圖的簡單機器,一種相互補充與激勵的"友伴論"是良好的起點,正如跳躍的提示詞,將由AI填補創作的空間。
又一個值得一提的案例是由商湯科技、上海人工智能實驗室參與研發的首個人體動捕大模型SMPLer-X。
得益於450萬個實例的數據訓練,樣本視頻中人體姿態的多樣性、局部動作的復雜性,都能被快速且高質量地識別並提取出來,這意味著CG製作展現出了一種嶄新的未來。
由1937年《白雪公主和七個小矮人》、1941年《鐵扇公主》啟用轉描技術算起,逐幀摹繪、慣性測量、光學動捕等一系列方法都離不開巨大的人力物力,而AI生成式動捕擺脫一切傳感器,由攝像頭、手機乃至網絡視頻中直接采集獲取動作數據,在大幅削減成本的同時,著實降低了製作人員的工作難度與強度。
在這樣的創作友伴關系中,藝術家們理應受到鼓舞,去嘗試過往不曾有過的想象、去攀登過往不曾達到的峰頂。
頂尖AI科學家李飛飛宣稱AI的勝利不能僅僅是科學的勝利,而必須是人文的勝利,這意味著AI需要成為"遵循優良的學術傳統,願意協作,尊重他人的意見與專業的機器",這亦為人類文明的操作系統築起了一道倚重AI革新且可持續發展的防火墻。
---[文:花暉(上海交通大學媒體與傳播學院副教授)*圖:均由AI作圖,作者提供*編輯:周敏嫻*責任編輯:邵嶺/來源: 文匯報]