2022,AIGC元年?
AIGC,進入爆發期。
2022年12月16日,Science雜誌發布了2022年度科學十大突破,韋伯望遠鏡當選為年度最大科學突破,可謂實至名歸。而在其他入選的科學突破中,AIGC也赫然在列。
這或許是當下最炙手可熱的概念了。無論是火遍全網的AI繪畫,還是震驚世人的ChatGPT,都屬於AIGC這一概念,即生成式AI。憑藉着諸多明星技術、產品的問世,誰也沒有想到,在元宇宙、web3等概念叱咤風雲的2022年裡,AI憑藉「創作」強勢崛起了。
有人認為,AIGC將會改變內容領域的生產方式,帶來整個行業的變革,也有人認為AIGC將會取代大多數創作者,帶來災難性的影響。在各種言論甚囂塵上之時,一個共識似乎悄然達成了,從2022年開始,AIGC將迎來完全不同的發展時期。
2022年,真的是AIGC的元年嗎?
*AIGC編年史
首先明確一個定義,何為AIGC?
跟PGC、UGC、PUGC等概念一樣,AIGC即是指利用人工智能技術生成內容,也就是說內容的製作者從實打實的人或機構變成了AI。
AI繪畫最早要追溯2014年,GAN(生成式對抗網絡)的誕生。據說人工智能專家Ian Goodfellow在一次酒後想到了這一深度模型概念,基於CNN(深度卷積神經網絡),GAN創造性地將兩個神經網絡進行對抗,即生成器與鑑別器。生成器用於生成「造假數據」,鑑別器用於判斷數據的真偽,在兩者的對抗中,逐漸演化出強大的「造假能力」,而這種造假能力則用於圖像的合成。
GAN之父Ian Goodfellow,圖源網絡
GAN被稱為21世紀最強大的算法模型之一,Ian Goodfellow也一躍成為AI領域最知名的專家之一。2015年開始,GAN開始被投入實際運用中,相關的論文也爆發式增長,也成為AI生成圖像、處理圖像任務里最常見的存在。
在GAN大放異彩的2015年,一家公司在美國硅谷成立,其背後站着「鋼鐵俠」埃隆·馬斯克、Y Combinator總裁阿爾特曼、天使投資人彼得·泰爾等一眾硅谷大佬,這家公司就是ChatGPT的締造者——OpenAI。
OpenAI創立的初衷是預防人工智能帶來的災難性影響,推動人工智能發揮積極作用,雖為公司,但OpenAI是一家非營利機構,是馬斯克等大佬用愛發電的產物,在創立之初,大佬們投入了10億美元用於AI的開發。2016年,OpenAI進一步明確了自己的目標,即向AGI(通用人工智能)研究發力,致力於讓AI成為改變人類生活的新技術。
OpenAI最大的特點即是「Open」,即開放AI能力,全球研發者都可以通過其提供的開發與研究框架投入AI開發中,共同促進AI技術的發展。也是從2016年開始,OpenAI推出了自己的AI平台Universe。故事轟轟烈烈地開始了。
時間來到2018年,Transformer 架構的發展改變了NLP(自然語言處理)技術的發展,預訓練模型的引入改變了一切。GPT系列正是OpenAI在NLP(自然語言處理)領域打造的模型,其第一款產品GPT-1也是在2018年正式推出。GPT-1的獨特之處在於「半監督」,在此前的NLP模型中,AI需要基於特定任務對大規模數據集進行學習,而這些數據是需要「監督」的,即人為地對數據進行標註。
GPT-1則可以在開始進行無監督學習的預訓練,通過對數據的學習增強語言能力,最後進行部分有監督的微調。簡單來說,GPT-1可以用更少的資源和數據進行更具效率的學習,但GPT-1仍舊是青澀的,一方面礙於訓練數據的有限,AI的「世界觀」很有限,另一方面其性能仍舊不夠好,遠遠達不到對話的能力。
自2018年開始NLP領域迎來了飛速發展,也從某種程度上改變了AI生成圖像的未來,也就是AI繪畫。
2020年是翻天覆地的一年。彼時,OpenAI推出了GPT-3,相比前兩代,這一次GPT實現了進化,GPT-3的參數超過1750億個,是人腦神經連結的十分之一,與此同時GPT-3的性能也更強,它能夠識別更深層次的文本含義,並進行反饋。GPT-3的推出是一場革新。
與此同時,在圖像生成領域,一場革命也在發生。儘管GAN已經能生成較高質量的圖片及內容,但相較來說,其效率較低,同時生成的圖像始終難以令人滿意。而Transformer架構的出現改變了一切,自此開始,圖像合成領域告別了GAN時代,NLP與計算機視覺技術搭配的新時代來臨了。
隨後便是我們熟知的故事了。2022年9月,AI繪畫爆火,11月30日,ChatGPT橫空出世,正式讓全世界看到了AIGC的「強大」。
*AIGC國內玩家
在OpenAI等行業巨頭的帶領下,海外AIGC產業正處於一個高速發展時期,那麼在國內,AIGC發展到哪一步了?
首先我們需要認識到一個現實,相較於美國,國內AIGC領域的發展是相對滯後的,但近幾年來,阿里巴巴、百度、騰訊等互聯網巨頭都注意到了AIGC這一未來的產業富礦。
國內AI領域,繞不開的一家公司即是百度。
在五個月前的百度世界大會上,百度CEO李彥宏就着重強調了AIGC,他認為,AIGC不僅能夠提升內容生產小籠包,還能創造出有獨特價值的獨立視角的內容。在世界大會上,百度AI也展示出了自己的實力:在十分鐘內復原了《富春山居圖》的殘卷,其背後依賴的深度學習模型,即是百度的當家模型——文心大模型。
百度AI復原的《富春山居圖》,圖源網絡
文心大模型起源於2019年,是百度深耕預訓練模型的產物,其核心特色在於「知識增強」,能夠對海量數據進行深度學習,並為多種AIGC應用提供支持。目前為止文心大模型已經發布了超過十多個大模型,形成了一個大模型家族。
在世界大會兩個月後的萬象大會上,百度還發布了AI助理,根本上是多種AIGC應用的集合,包括文本生成、圖片生成,圖片轉換視頻等多種功能,最值得關注的一點是,其直接面向用戶與內容創作者,也就是說,AIGC技術的C端應用化正在實現。
AIGC也不止圖像生成、文本生成等領域,AI創作同樣是多元的,音樂、編程等領域同樣在飛速發展。
就在不久前,崑崙萬維高調宣布入局AIGC領域,並發布了「崑崙天工」模型。這一成立於2008年的公司早期以遊戲代理起家,自2016年起,崑崙萬維在海外建立起龐大業務,成為國內知名的出海巨頭之一,近年來,崑崙萬維更是發力元宇宙社交等領域,而這一進軍AIGC,也是早有準備。
自2020年起,崑崙萬維便組建了超過200人的AIGC團隊,訓練集群200張卡,投入數千萬元,並在2021年4月研發出了百億參數的中文GPT-3模型。值得關注的是,在很多人忽略的音樂領域,崑崙萬維也取得了不錯的進展,於2022年1月啟動的SkyMusic已經可以實現生成商用級別的音樂。
值得注意的是,崑崙天工選擇開源,與百度一樣,崑崙萬維堅信開源能夠給AIGC帶來更長效的發展力,並致力於降低AIGC技術的使用門檻,讓AI能夠幫助更多內容創作者。
除了以上提到的這兩家公司外,在國內AIGC領域,垂直賽道的初創公司也勢頭正勁,覆蓋AI音樂、虛擬人、AI音頻語音、AI遊戲等領域。
但另一個事實也同時存在,相較於OpenAI等海外巨頭,國內AIGC領域公司仍存在較大的差距,一方面在組織架構方面,國內基本都基於公司自身的科研團隊,而OpenAI等組織更類似一個研究院,能夠通過開放共享的模式吸納全球頂尖科研人才。
另一方面,國內AIGC相關公司面對的營收壓力客觀存在,很難像OpenAI等平台不計成本的進行投入。但伴隨着AIGC逐漸成熟的商業化以及更廣泛的應用,或許國內AIGC領域即將迎來春天。
*為何元年?
回到最開始的那個問題,2022年為何會被看作AIGC的元年?
其實深入了解AI繪畫與ChatGPT就能理解這一說法:
2022年8月,人工智能公司Stability AI推出了AI文生圖模型Stable Diffusion(擴散模型),將AI圖像生成的效率與精度提升到了前所未有的量級,在最基礎的終端設備上,只需輸入關鍵詞,就能生成高質量的AI圖像,幾乎讓整個世界為之瘋狂。AI繪畫的爆發式發展也第一次讓C端感受到了AIGC的強大魅力。
而ChatGPT的到來更令人震驚。作為基於GPT-3.5的對話式AI,ChatGPT最大的特點即是能夠「理解」對話者的語義,能夠進行更有效的反饋,並進行連續對話。基於對超大規模數據的深度學習,ChatGPT在文本生成領域幾乎能「以假亂真」,讓你認為其真的擁有了意識。此外,ChatGPT不僅能答疑解惑,還能寫故事、作詩,甚至編程,生成內容的能力空前提高。
AIGC元年的秘密就藏在這兩個模型里。
第一,在性能上,AI已經實現了「進化。相比以前的GAN圖像生成模型,Stable Diffusion最大的特點就在於精準,只要輸入對關鍵詞,其就能產生較為接近的圖像結果,這是此前的圖像生成很難做到的。ChatGPT也同樣是高性能的,有人幾乎把它當做了谷歌一樣的搜索引擎,正是在於其對於文本的深度分析並能夠生成較為精確的反饋。而各種生成內容則進一步顯示了其性能的強大。
第二則在於「理解」。這點在ChatGPT上體現的更加明顯,相比此前的對話AI,人們驚奇的發現,ChatGPT似乎能夠理解文本更深層次的含義,無論是連續流暢的對話,還是對於錯誤想法的糾正,都讓人感覺到對面的AI似乎是有思想的,儘管其只是類似「中文屋」的深度學習的產物,但強化學習模型的加入會讓其不斷進化,對話任務也完成的更加出色。
最後則在於更大範圍的應用。相比於此前的「圈內狂歡」,2022年的AIGC真正做到了全民關注,這是技術飛速發展下的產物,以Stable Diffusion為例,其最大的特點即是低門檻,不需要多強大的顯卡與服務器,最普通的PC就能完成任務。同時平台的封裝也讓AIGC更加「平易近人」,AI繪畫僅需要輸入關鍵詞,ChatGPT也只需要網頁和提問欄就能實現對話,這讓普通人接觸AIGC的機會大大增加了。
AIGC在2022年的火爆,是技術積累與發展策略雙重變革的產物,從某種角度來看,稱之為元年也並不為過,只不過2022年更應該是AIGC的「應用元年」。
AIGC也還有很長的路要走。一方面,在「創造」這一概念面前,基於深度學習的AI的創作是否真正是創造還難以定論,另一方面知識產權問題也像一把達摩克利斯之劍始終懸在AIGC頭上,如何解決AI學習背後的倫理問題也是一大難題。
但在AI技術的發展問題面前,以上問題可能都是細枝末節了。正如OpenAI等平台所期望的那樣,AIGC並不是最終目的,真正實現通用人工智能才是最核心的目標。-(文:世昕*編:石燦/來源:刺蝟公社)