Sora製造AI焦慮？或引發內容行業變革，算力、芯片之爭

2024022916:29

春節期間，OpenAI又放大招，旗下視頻生成模型Sora連登熱搜。在文生視頻的浪潮下，大衆關心的話題也從科技的發展延伸到了自身，AI會搶走哪些人的工作？還有哪些新職業會因此出現？在此背景下，南方都市報“上崗了！AI”課題組邀請到矽基智能創始人、董事長、CEO司馬華鵬，一覽科技創始人兼CEO羅江春，浙江大學計算機科學與技術學院副教授金小剛，以及英國謝菲爾德大學博士彭煦潭參加線上沙龍，針對Sora沖擊波可能造成哪些影響，以及中外大模型産品的差距是否拉大、文生圖領域面臨的職業新機遇和新挑戰等問題進行了研討。

本期嘉賓 : 司馬華鵬：矽基智能創始人、董事長、CEO*羅江春：一覽科技創始人兼CEO*金小剛：浙江大學計算機科學與技術學院副教授*彭煦潭：英國謝菲爾德大學博士

Sora是“世界模擬器”？專家各執一詞

相較于去年的ChatGPT，Sora帶來的震撼和沖擊似乎更爲劇烈，這主要在于其模擬逼真場景的強大能力，被視爲“顛覆性”的存在。OpenAI甚至將Sora稱爲“世界模擬器”（world simulators）,“視頻生成模型是構建通用物理世界模擬器的一條有前景的道路，這種能力將成爲實現人工通用智能（AGI）的重要裏程碑。”OpenAI想強調，Sora不是單純的視頻生成模型，不只是視頻行業顛覆者，而是打開了一條通往模擬物理世界的有效路徑。

但對于這一觀點，有不少AI領域的專家提出了反對意見。首先就是圖靈獎獲得者、Meta首席AI科學家楊立昆，他在社交媒體上發文稱，通過生成像素來對世界進行建模是一種浪費，並且注定會失敗，就像基本上被放棄的“綜合分析”的想法一樣。

楊立昆指出，根據提示生成看起來最真實的視頻並不表明系統理解物理世界，生成與世界模型的因果預測有很大不同。真實視頻的合理連續空間要小得多，生成其中的代表性塊是一項更加困難的任務，特別是在以動作爲條件時。此外，生成這些延續不僅成本高昂，而且完全沒有意義。

Sora到底算不算“世界模擬器”？在南都的線上沙龍中，與會專家也各執一詞，進行了激烈的觀點交鋒。金小剛認同楊立昆的觀點，認爲並不足以稱之爲“世界模擬器”，“Sora本質上是一個用數據喂出來的産品，用自回歸的方式獲得的統計意義上的結果，是 ‘大數據、大模型、大算力’的暴力計算得出的。這樣的大模型不可能真正理解真實的世界。因爲統計歸納方法本身是有很大缺點的。真實世界的複雜性遠遠高于模型的複雜性，用現有的知識歸納出來的東西，是遠遠不足以對付複雜世界的。所以這個‘世界模型’的說法顯然是有問題的。”

金小剛認爲，“對于打造通用系統，從研究的角度需要鼓勵探索，但是不要放大了說這一個系統可以解決所有問題。目前這樣的系統，並不能理解真實世界，在一些對精度、可信度要求不高的場景無疑是有價值的，因爲作爲建模工具獲得了效率的提升，這樣的場景如遊戲、電影視頻中的場景打造，但在一些需要精確推理的場景未必有效了。”

浙江大學計算機科學與技術學院副教授金小剛。

專注自然語言處理研究的彭煦潭博士從另一個角度解釋了這一觀點。彭煦潭向南都記者解釋稱，論文和技術報告比較大的區別在于，論文更偏學術，而技術報告類似商業白皮書，在用詞、陳述上可能存在噱頭。

英國謝菲爾德大學博士彭煦潭。

“所謂的‘世界模擬器’，可以理解爲物理引擎。它在解決‘已知的已知’和‘已知的未知’這兩個類型的問題上，處理是非常精准和可靠的，因爲這些東西有預定義。從目前Sora生成的視頻可以看到，它在生成一些特定場景時，會出現非常差的輸出。因爲輸入分布與之前訓練過程當中見過的分布有比較大的差異，正好打到了它的盲區。但是其實這樣的事情對于真正的可靠的物理引擎來說，是不會出現的。所以大家也不能依賴它，把它真正當成一個物理引擎，或者世界模擬器來用。它還是有很多的缺陷的。”彭煦潭進一步解釋稱。

從AI視頻行業創業者的角度，羅江春則是提出了不同的看法。他認爲，Sora提出的“世界模擬器”核心指的是如何在視頻場景裏模擬真實的世界，而Sora展現出的技術已經解決了其他同行仍在困擾的問題，“其他大模型生成視頻，是通過一秒鍾24張圖片連貫播放做到的，但是Sora發布的視頻有鏡頭概念。我認爲它的核心是建了一個虛擬的視頻素材的世界模型，然後用這裏面的東西去推導，比如高速的轉彎，小狗往前跑怎麽轉換場景，它模擬的狗的眼睛也好，人的眼睛也好，視覺攝像頭也好，怎麽來進行事物的轉換。”

一覽科技創始人兼CEO羅江春。

對于Sora體現的技術，羅江春指出，文生視頻一定要還原最關鍵的三個環節，分別是腳本、素材和剪輯。腳本包括創意、情節和場景，這些都需要通過大模型描述清楚，而且要拆成鏡頭；接著通過這些鏡頭，進行畫圖、建模，形成素材；第三步則是根據素材庫進行後期剪輯、特效，“這都是在Sora整個模型裏完成的，它肯定沒有使用圖片，肯定有鏡頭才會看起來這麽真實，這後面實際上算力的使用是很龐大的”。

司馬華鵬也認爲，Sora呈現的視頻達到了“世界模型”的程度，“從各個角度來看，它的一致性，它的仿真，對物理、流體力學等定律的遵守，包括鏡頭的切換等都是非常好的。所以它一定是一個世界模型，而且這個世界模型是目前所有的公司和組織都難望其項背的，當然也是我們奮起直追的目標。”

矽基智能創始人、董事長、CEO司馬華鵬。

正視差距，國內企業需要有追趕的信心

在AI視頻領域，除了國外的競爭者外，國內也有不少企業已經入局。360創始人周鴻祎在其社交平台表示，國內企業跟OpenAI之間的差距，“表面看起來是離3.5比較近了。但實際上跟4.0比有一年半的差距……我覺得奧特曼是一個營銷大師，知道怎麽樣掌握節奏，就從這兒來看，中國跟美國的AI的差距在加大。”

在沙龍中，羅江春也認爲國內和國際頭部企業的差距在加大，“之前ChatGPT剛出來的時候很多國內公司說很快就能趕上3.5，結果OpenAI很快就推出了4.0、GPTs、再到現在的Sora。就感覺好像人家研究一天，我們又搞了一年，速度完全跟不上。關鍵還得有天才的團隊、天才的idea以及有大量的資金投入，實實在在去做才會有一個像樣的東西來。我是學AI出身的，1997-2000年在美國萊斯大學計算機系讀Artificial Intelligence。我覺得面對（國內外）差距越拉越大，我們得奮起直追，需要不計成本、不計代價，要不然的話又會像芯片一樣被人卡住。”

對于國內外的差距，彭煦潭認爲，並不是國內企業和國外企業存在差距，而是世界上全部的其他企業都和OpenAI存在差距，“去年矽谷有很多人以大模型爲框架做創業，包括多模態的或者純視覺的大模型，但大家的性能其實相對于OpenAI來說都有很大的差距”。彭煦潭指出，差距主要在于技術和資源，OpenAI在資源上同時擁有最好的數據和最強的算力，這都是其他企業很難擁有的優勢。

司馬華鵬則認爲，在正視差距的同時，也要有追趕的信心，“我們在海外的團隊也在追蹤這件事，大家都在不斷地探索這塊的原理和對應的實現方法。如果國內大廠、很多創業公司都參與的話，我覺得在半年裏也應該會有一些能達到他們大概七八成的産品出來。”

矽基智能在數字人領域深耕了六年，司馬華鵬表示在這一細分賽道上矽基智能已經領先很多國外同行，“我們肯定要正視差距，但有一線的機會我們都會做。我們也都在各自領域找到了一些彎道超車的賽道在做”。

引發內容行業變革、算力之爭、芯片之爭

隨著Sora的爆火，其可能對行業、對內容創作者帶來的影響也引發關注。羅江春引用了克萊頓·克裏斯坦森的《創新者的窘境》理論，“一個革命性的新技術出現的時候，先被取代的是不被注意的低端産品。”

羅江春認爲，先被顛覆的是圖文行業，隨後是短視頻、短劇，接下來則是影視行業。“我相信很快就會有AI驅動的影視劇公司出現了。一到三年之內，出現一個純AI的爆款電影，這是有可能的。沒有明星，沒有導演，就是一幫人想了一個idea，拍攝方式完全就顛覆了。”

羅江春透露，現在有很多創作者，使用一覽科技的AIGC全域工作流，生産大量的圖文，“很多時候你在頭條上看到的文章，都不知道是人寫的還是AI寫的，很難判斷。然後侵蝕到短視頻、短劇、影視劇。我覺得它會從低端到高端，逐漸重塑整個産業。”

司馬華鵬也認爲，影視企業必然會受到沖擊，傳統的內容平台也會被顛覆，“如果生成一個優質視頻的成本降到了幾毛錢，那這些平台上的人怎麽辦？”

除了對應的內容産業外，司馬華鵬還指出，能源和芯片行業都會受到巨大影響，Sora可能會吞噬掉世界上九成以上的顯卡，“這是很可怕的，大家表面上看到沖擊的是這些視頻生成所影響的産業，但如果它生成的視頻大規模地充斥世界，它背後所能夠聚攏的顯卡資源會越來越多。今天在所有的創業公司裏，訓練大模型對應的顯卡的資源已經是非常的不均衡分布了。”

據了解，此前，有媒體報道稱，OpenAI創始人山姆·奧特曼 (Sam Altman)正從中東地區籌集總計高達7萬億美元的資金，以支持OpenAI的一項半導體計劃，並與英偉達展開競爭。山姆·奧特曼並未就這一爆料回應，但他在近日公開表示，“我們認爲世界需要在AI計算（芯片）領域投入大量資金。”

對此，司馬華鵬認爲，“我們最終會因爲沒有芯片可用，沒有這樣的算力可用（而輸掉競爭）。AI競爭的背後，本質上是顯卡的競爭，算力的競爭，芯片的競爭。”司馬華鵬強調稱，在前端的算法上，國內企業可能半年到一年就能追上，但在算力上的追趕則是很難的，“當你達到同等的效果的時候，對方的市場規模，以及對方在市場上的品牌認知、用戶量都鎖死之後，再追上是非常難的了。”

有媒體曾報導稱，OpenAI現在每天生成大約1000億個單詞，而地球上所有人每天總共産生大約100萬億個單詞，也就是說OpenAI 生成的單詞數量占據地球總數的千分之一。“這家公司每天生産的單詞數超過了人類大部分的組織個體和企業，當它生産的視頻也達到這樣的量的時候，這個沖擊是非常大的。可能全世界的電量及算力的部分百分比，都被它占據了。”司馬華鵬指出。

對于算力之爭，羅江春表示，國內已經有企業在顯卡上布局，在算力上也可能有所突破。但羅江春也對OpenAI目前吸引的大量資源表達了憂慮，“它已經虹吸了很多內容創作者、資金、算力在這個平台上。要追趕的話，只可能demo跟它差不多，但是實際産品的水平會越差越遠。很多時候我們在做AI、做大模型的時候，不知道哪條路是對的。最可怕的是時間，當它（OpenAI）吸引了太多能量的時候，再追趕就很難。”

哪些工作崗位會被AI替代？

Sora問世以來，對于其是否會搶走內容創作者的工作這一爭議，始終引發各方關注，還有主播借助AI焦慮售賣人工智能線上課程。

金小剛表示，需要從教育的角度來思考，“我們的教育不能滿足于對于已有知識的背誦與綜合，要著眼于好奇心的培養，激發學生對于未知探索。教育不是去培養一個跟ChatGPT競爭的人，而是培養培養打造ChatGPT的人，根本上來說要培養創新者。”

羅江春認爲，可能每個行業都會受到沖擊，但速度有所區別，“設計師我想還是依然會存在的，因爲他有審美，AI會讓他的效率提升，我們現在在繪圖産品上加了很多功能，包括怎麽擴展、擦除、局部修改，都是爲了設計師去做的；導演可能還是需要的，因爲他有很多鏡頭、轉場的技巧，基本的審美。但是可能不需要在某個方面特別專業的人才，因爲越專業的工作，越能用程序描述清楚的東西，矽基超越碳基是越有機會的。但如果是一些要發揮創造力、想象力的工作，這些職業改變應該會慢一點。”

司馬華鵬則從更爲積極的一面看待這個問題，“AI對于所有的産業而言，都能帶來非常大的進步。今天有非常多的科學發現，都已經開始借助AI在做了。科學發展到這個階段，有一些焦慮和憂慮很正常，當然我們也要奮起直追。”

金小剛和彭煦潭都提到了Sora可能帶來的風險。金小剛認爲，這類工具對于普通公衆來說會帶來巨大的信息和能力的不對稱性，如果用于詐騙，將帶來不可估量的影響，所以在科技探索的同時，在監管需要跟上。

彭煦潭指出，不僅是監管者，所有社會大衆，都需要重新思考AI帶來的問題，並且要擁有一定的鑒別能力, “大家都需要思考，在未來AI有可能會帶來很大危險的情況下，如何去適應這種新的形式，保護好自己的錢包，保護好自己的認知。” 彭煦潭強調稱，AI鑒定是在模型時代，大家需要自發去培養的技能。

(出品：南都政商數據新聞部*統籌：甄芹馬甯甯田愛麗*執行/采寫：南都、N視頻記者汪陳晨林文琪)

---[直播統籌：N視頻記者陳蓓蕾*設計：甘丹/來源: 南方都市報]

我要留言

Sora製造AI焦慮？或引發內容行業變革，算力、芯片之爭

Sora分裂了科技圈：它是比ChatGPT更重要的里程碑？

爲啥太陽能在太空中燃燒50億年？科學家：眼前所見，並非是真的

Sora分裂了科技圈：它是比ChatGPT更重要的里程碑？

爲啥太陽能在太空中燃燒50億年？科學家：眼前所見，並非是真的