Sora製造AI焦慮?或引發內容行業變革,算力、芯片之爭
春節期間,OpenAI又放大招,旗下視頻生成模型Sora連登熱搜。在文生視頻的浪潮下,大衆關心的話題也從科技的發展延伸到了自身,AI會搶走哪些人的工作?還有哪些新職業會因此出現? 在此背景下,南方都市報“上崗了!AI”課題組邀請到矽基智能創始人、董事長、CEO司馬華鵬,一覽科技創始人兼CEO羅江春,浙江大學計算機科學與技術學院副教授金小剛,以及英國謝菲爾德大學博士彭煦潭參加線上沙龍,針對Sora沖擊波可能造成哪些影響,以及中外大模型産品的差距是否拉大、文生圖領域面臨的職業新機遇和新挑戰等問題進行了研討。
本期嘉賓 : 司馬華鵬:矽基智能創始人、董事長、CEO*羅江春:一覽科技創始人兼CEO*金小剛:浙江大學計算機科學與技術學院副教授*彭煦潭:英國謝菲爾德大學博士
Sora是“世界模擬器”?專家各執一詞
相較于去年的ChatGPT,Sora帶來的震撼和沖擊似乎更爲劇烈,這主要在于其模擬逼真場景的強大能力,被視爲“顛覆性”的存在。OpenAI甚至將Sora稱爲“世界模擬器”(world simulators),“視頻生成模型是構建通用物理世界模擬器的一條有前景的道路,這種能力將成爲實現人工通用智能(AGI)的重要裏程碑。”OpenAI想強調,Sora不是單純的視頻生成模型,不只是視頻行業顛覆者,而是打開了一條通往模擬物理世界的有效路徑。
但對于這一觀點,有不少AI領域的專家提出了反對意見。首先就是圖靈獎獲得者、Meta首席AI科學家楊立昆,他在社交媒體上發文稱,通過生成像素來對世界進行建模是一種浪費,並且注定會失敗,就像基本上被放棄的“綜合分析”的想法一樣。
楊立昆指出,根據提示生成看起來最真實的視頻並不表明系統理解物理世界,生成與世界模型的因果預測有很大不同。真實視頻的合理連續空間要小得多,生成其中的代表性塊是一項更加困難的任務,特別是在以動作爲條件時。此外,生成這些延續不僅成本高昂,而且完全沒有意義。
Sora到底算不算“世界模擬器”?在南都的線上沙龍中,與會專家也各執一詞,進行了激烈的觀點交鋒。金小剛認同楊立昆的觀點,認爲並不足以稱之爲“世界模擬器”,“Sora本質上是一個用數據喂出來的産品,用自回歸的方式獲得的統計意義上的結果,是 ‘大數據、大模型、大算力’的暴力計算得出的。這樣的大模型不可能真正理解真實的世界。因爲統計歸納方法本身是有很大缺點的。真實世界的複雜性遠遠高于模型的複雜性,用現有的知識歸納出來的東西,是遠遠不足以對付複雜世界的。所以這個‘世界模型’的說法顯然是有問題的。”
金小剛認爲,“對于打造通用系統,從研究的角度需要鼓勵探索,但是不要放大了說這一個系統可以解決所有問題。目前這樣的系統,並不能理解真實世界,在一些對精度、可信度要求不高的場景無疑是有價值的,因爲作爲建模工具獲得了效率的提升,這樣的場景如遊戲、電影視頻中的場景打造,但在一些需要精確推理的場景未必有效了。”
浙江大學計算機科學與技術學院副教授金小剛。
專注自然語言處理研究的彭煦潭博士從另一個角度解釋了這一觀點。彭煦潭向南都記者解釋稱,論文和技術報告比較大的區別在于,論文更偏學術,而技術報告類似商業白皮書,在用詞、陳述上可能存在噱頭。
英國謝菲爾德大學博士彭煦潭。
“所謂的‘世界模擬器’,可以理解爲物理引擎。它在解決‘已知的已知’和‘已知的未知’這兩個類型的問題上,處理是非常精准和可靠的,因爲這些東西有預定義。從目前Sora生成的視頻可以看到,它在生成一些特定場景時,會出現非常差的輸出。因爲輸入分布與之前訓練過程當中見過的分布有比較大的差異,正好打到了它的盲區。但是其實這樣的事情對于真正的可靠的物理引擎來說,是不會出現的。所以大家也不能依賴它,把它真正當成一個物理引擎,或者世界模擬器來用。它還是有很多的缺陷的。”彭煦潭進一步解釋稱。
從AI視頻行業創業者的角度,羅江春則是提出了不同的看法。他認爲,Sora提出的“世界模擬器”核心指的是如何在視頻場景裏模擬真實的世界,而Sora展現出的技術已經解決了其他同行仍在困擾的問題,“其他大模型生成視頻,是通過一秒鍾24張圖片連貫播放做到的,但是Sora發布的視頻有鏡頭概念。我認爲它的核心是建了一個虛擬的視頻素材的世界模型,然後用這裏面的東西去推導,比如高速的轉彎,小狗往前跑怎麽轉換場景,它模擬的狗的眼睛也好,人的眼睛也好,視覺攝像頭也好,怎麽來進行事物的轉換。”
一覽科技創始人兼CEO羅江春。
對于Sora體現的技術,羅江春指出,文生視頻一定要還原最關鍵的三個環節,分別是腳本、素材和剪輯。腳本包括創意、情節和場景,這些都需要通過大模型描述清楚,而且要拆成鏡頭;接著通過這些鏡頭,進行畫圖、建模,形成素材;第三步則是根據素材庫進行後期剪輯、特效,“這都是在Sora整個模型裏完成的,它肯定沒有使用圖片,肯定有鏡頭才會看起來這麽真實,這後面實際上算力的使用是很龐大的”。
司馬華鵬也認爲,Sora呈現的視頻達到了“世界模型”的程度,“從各個角度來看,它的一致性,它的仿真,對物理、流體力學等定律的遵守,包括鏡頭的切換等都是非常好的。所以它一定是一個世界模型,而且這個世界模型是目前所有的公司和組織都難望其項背的,當然也是我們奮起直追的目標。”
矽基智能創始人、董事長、CEO司馬華鵬。
正視差距,國內企業需要有追趕的信心
在AI視頻領域,除了國外的競爭者外,國內也有不少企業已經入局。360創始人周鴻祎在其社交平台表示,國內企業跟OpenAI之間的差距,“表面看起來是離3.5比較近了。但實際上跟4.0比有一年半的差距……我覺得奧特曼是一個營銷大師,知道怎麽樣掌握節奏,就從這兒來看,中國跟美國的AI的差距在加大。”
在沙龍中,羅江春也認爲國內和國際頭部企業的差距在加大,“之前ChatGPT剛出來的時候很多國內公司說很快就能趕上3.5,結果OpenAI很快就推出了4.0、GPTs、再到現在的Sora。就感覺好像人家研究一天,我們又搞了一年,速度完全跟不上。關鍵還得有天才的團隊、天才的idea以及有大量的資金投入,實實在在去做才會有一個像樣的東西來。我是學AI出身的,1997-2000年在美國萊斯大學計算機系讀Artificial Intelligence。我覺得面對(國內外)差距越拉越大,我們得奮起直追,需要不計成本、不計代價,要不然的話又會像芯片一樣被人卡住。”
對于國內外的差距,彭煦潭認爲,並不是國內企業和國外企業存在差距,而是世界上全部的其他企業都和OpenAI存在差距,“去年矽谷有很多人以大模型爲框架做創業,包括多模態的或者純視覺的大模型,但大家的性能其實相對于OpenAI來說都有很大的差距”。彭煦潭指出,差距主要在于技術和資源,OpenAI在資源上同時擁有最好的數據和最強的算力,這都是其他企業很難擁有的優勢。
司馬華鵬則認爲,在正視差距的同時,也要有追趕的信心,“我們在海外的團隊也在追蹤這件事,大家都在不斷地探索這塊的原理和對應的實現方法。如果國內大廠、很多創業公司都參與的話,我覺得在半年裏也應該會有一些能達到他們大概七八成的産品出來。”
矽基智能在數字人領域深耕了六年,司馬華鵬表示在這一細分賽道上矽基智能已經領先很多國外同行,“我們肯定要正視差距,但有一線的機會我們都會做。我們也都在各自領域找到了一些彎道超車的賽道在做”。
引發內容行業變革、算力之爭、芯片之爭
隨著Sora的爆火,其可能對行業、對內容創作者帶來的影響也引發關注。羅江春引用了克萊頓·克裏斯坦森的《創新者的窘境》理論,“一個革命性的新技術出現的時候,先被取代的是不被注意的低端産品。”
羅江春認爲,先被顛覆的是圖文行業,隨後是短視頻、短劇,接下來則是影視行業。“我相信很快就會有AI驅動的影視劇公司出現了。一到三年之內,出現一個純AI的爆款電影,這是有可能的。沒有明星,沒有導演,就是一幫人想了一個idea,拍攝方式完全就顛覆了。”
羅江春透露,現在有很多創作者,使用一覽科技的AIGC全域工作流,生産大量的圖文,“很多時候你在頭條上看到的文章,都不知道是人寫的還是AI寫的,很難判斷。然後侵蝕到短視頻、短劇、影視劇。我覺得它會從低端到高端,逐漸重塑整個産業。”
司馬華鵬也認爲,影視企業必然會受到沖擊,傳統的內容平台也會被顛覆,“如果生成一個優質視頻的成本降到了幾毛錢,那這些平台上的人怎麽辦?”
除了對應的內容産業外,司馬華鵬還指出,能源和芯片行業都會受到巨大影響,Sora可能會吞噬掉世界上九成以上的顯卡,“這是很可怕的,大家表面上看到沖擊的是這些視頻生成所影響的産業,但如果它生成的視頻大規模地充斥世界,它背後所能夠聚攏的顯卡資源會越來越多。今天在所有的創業公司裏,訓練大模型對應的顯卡的資源已經是非常的不均衡分布了。”
據了解,此前,有媒體報道稱,OpenAI創始人山姆·奧特曼 (Sam Altman)正從中東地區籌集總計高達7萬億美元的資金,以支持OpenAI的一項半導體計劃,並與英偉達展開競爭。山姆·奧特曼並未就這一爆料回應,但他在近日公開表示,“我們認爲世界需要在AI計算(芯片)領域投入大量資金。”
對此,司馬華鵬認爲,“我們最終會因爲沒有芯片可用,沒有這樣的算力可用(而輸掉競爭)。AI競爭的背後,本質上是顯卡的競爭,算力的競爭,芯片的競爭。”司馬華鵬強調稱,在前端的算法上,國內企業可能半年到一年就能追上,但在算力上的追趕則是很難的,“當你達到同等的效果的時候,對方的市場規模,以及對方在市場上的品牌認知、用戶量都鎖死之後,再追上是非常難的了。”
有媒體曾報導稱,OpenAI現在每天生成大約1000億個單詞,而地球上所有人每天總共産生大約100萬億個單詞,也就是說OpenAI 生成的單詞數量占據地球總數的千分之一。“這家公司每天生産的單詞數超過了人類大部分的組織個體和企業,當它生産的視頻也達到這樣的量的時候,這個沖擊是非常大的。可能全世界的電量及算力的部分百分比,都被它占據了。”司馬華鵬指出。
對于算力之爭,羅江春表示,國內已經有企業在顯卡上布局,在算力上也可能有所突破。但羅江春也對OpenAI目前吸引的大量資源表達了憂慮,“它已經虹吸了很多內容創作者、資金、算力在這個平台上。要追趕的話,只可能demo跟它差不多,但是實際産品的水平會越差越遠。很多時候我們在做AI、做大模型的時候,不知道哪條路是對的。最可怕的是時間,當它(OpenAI)吸引了太多能量的時候,再追趕就很難。”
哪些工作崗位會被AI替代?
Sora問世以來,對于其是否會搶走內容創作者的工作這一爭議,始終引發各方關注,還有主播借助AI焦慮售賣人工智能線上課程。
金小剛表示,需要從教育的角度來思考,“我們的教育不能滿足于對于已有知識的背誦與綜合,要著眼于好奇心的培養,激發學生對于未知探索。教育不是去培養一個跟ChatGPT競爭的人,而是培養培養打造ChatGPT的人,根本上來說要培養創新者。”
羅江春認爲,可能每個行業都會受到沖擊,但速度有所區別,“設計師我想還是依然會存在的,因爲他有審美,AI會讓他的效率提升,我們現在在繪圖産品上加了很多功能,包括怎麽擴展、擦除、局部修改,都是爲了設計師去做的;導演可能還是需要的,因爲他有很多鏡頭、轉場的技巧,基本的審美。但是可能不需要在某個方面特別專業的人才,因爲越專業的工作,越能用程序描述清楚的東西,矽基超越碳基是越有機會的。但如果是一些要發揮創造力、想象力的工作,這些職業改變應該會慢一點。”
司馬華鵬則從更爲積極的一面看待這個問題,“AI對于所有的産業而言,都能帶來非常大的進步。今天有非常多的科學發現,都已經開始借助AI在做了。科學發展到這個階段,有一些焦慮和憂慮很正常,當然我們也要奮起直追。”
金小剛和彭煦潭都提到了Sora可能帶來的風險。金小剛認爲,這類工具對于普通公衆來說會帶來巨大的信息和能力的不對稱性,如果用于詐騙,將帶來不可估量的影響,所以在科技探索的同時,在監管需要跟上。
彭煦潭指出,不僅是監管者,所有社會大衆,都需要重新思考AI帶來的問題,並且要擁有一定的鑒別能力, “大家都需要思考,在未來AI有可能會帶來很大危險的情況下,如何去適應這種新的形式,保護好自己的錢包,保護好自己的認知。” 彭煦潭強調稱,AI鑒定是在模型時代,大家需要自發去培養的技能。
(出品:南都政商數據新聞部*統籌:甄芹 馬甯甯 田愛麗*執行/采寫:南都、N視頻記者 汪陳晨 林文琪)
---[直播統籌:N視頻記者 陳蓓蕾*設計:甘丹/來源: 南方都市報]