Sora:又一次GPT式創業?
Sora讓整個行業又興奮起來。字節辟謠中國版Sora,周鴻祎火速“追星”,李一舟趁熱賣課,一衆上市公司夾雜著“顛覆性、裏程碑、加速器”等關鍵詞舞動資本市場。又一次創業機會,還是新一輪趕超焦慮,是看待Sora撥雲見日的兩條線索。
在人們驚歎其高超能力的同時,一種有關羨慕與追趕的技術焦慮也隨之産生。正如字節回應“中文版Sora”,目前無法作爲完善産品落地,與國外有很大差距。但也有人認爲,Sora的出圈是AIGC深入人心的新契機,有助于更好地推動國內AIGC産業的發展。
從ChatGPT到Sora,相同的問題又一次擺到AI廠商面前:如何追趕?如何找准落地場景?如何實現數據飛輪?
新“AI行情”?
熱點最容易在資本市場掀起巨浪。連續爆發兩日後,2月21日,Sora題材股表現分化。截至當日收盤,因賽集團、當虹科技等漲超10%,新易盛、中際旭創跌超5%,萬興科技、東方國信等跌超4%。
其中因賽集團已獲3連板,近4個交易日累計大漲超88%。
股市的起伏和公司的回應,是市場狂熱的一面,一如一年前ChatGPT的橫空出世,再次掀起一股熟悉的“AI行情”。
不過,Sora雖然複刻了ChatGPT所帶來的轟動,卻沒能在市場上複刻出同樣的創業風。取而代之的是,一種有關技術的焦慮正逐漸蔓延。
文生視頻並不是個新鮮事,但與Sora相比,時長是以往文生視頻最大的“硬傷”。
一位大廠的業內人士對北京商報記者提到,國內公司的文生視頻産品,都是基于大型語言模型(LLM)和傳統的視頻生成AI集成的結果,生成的視頻長度都是秒級,且簡單場景。
據了解,在Sora發布之前,Runway和Pika普遍被認爲是視頻生成賽道的佼佼者,但前者僅能生成4秒的視頻,後者則只能提供3秒的視頻。Runway的用戶可以將生成的視頻最長延長至16秒,而這已經是AI生成視頻在2023年所能達到的最長時長紀錄。
“三四秒和一分鍾,是天差地別的。”在接受北京商報記者采訪時,無界AI聯合創始人馬千裏提到,對于AI生成視頻來說,隨著生成時長增長難度指數級上升,更長的視頻意味著更高的一致性要求、更詳細的畫面描述,對算力的消耗也是遠超此前水平的。
“沒錢,沒卡,沒人才,差距在拉大。”談及當下的真實感受,上述業內人士做了這樣一句概括,在他看來,前兩者的客觀環境也在一定程度上限制著人才的回流。
此外,萬億級別公司的玩家才能持續的事情,國內雲計算大廠跟起來也很吃力,而且大廠也要考慮投入産出,“總之挺難的”。
在人才角度,伽利略資本合夥人鄭譞也對北京商報記者提到,目前國內真正具有大模型經驗、了解大模型的技術專家還太少。
而通過與其身邊少數從業者的交流來看,壓力也是顯而易見的。鄭譞稱,除技術外,焦慮還普遍存在于包括算力等方面資源的充沛程度上,“相比于原來的大模型,文生視頻的計算量是一個‘天文數字’,而國內具備這樣算力基礎的AIDC(人工智能數據中心)數量屈指可數”。
不過馬千裏認爲,Sora破圈最重要的意義其實在于教育了客戶,讓外界重視了AIGC産業,從而進一步推動國內AIGC産業的發展。“雖然有壓力,但總歸是一件好事,這不僅是輿論層面的判斷,從技術上看,Sora跑通了這條路,其他人也會更有信心投入這條技術路線,而這對于技術的發展通常也是至關重要的。”
顛覆與祛魅
Sora所引發的焦慮,一部分來源于技術本身,另一部分來源于“顛覆性”的營銷。
Sora的顛覆究竟是技術層面的徹底革新,還是原有路線的進一步成熟?這或許是于狂熱的市場氛圍中,理性看待Sora“沖擊波”的一個關鍵起點。
廣發證券認爲,在底層基礎技術原理上,Sora並未有實質性的突破,或應更多理解爲類似于ChatGPT,基于同樣的技術原理,在暴力美學下的又一次重要“量變”。
香頌資本董事沈萌也提到,從技術架構來看,Sora其實並沒有脫離大語言模型本質,仍是基于深度學習的框架。
馬千裏解釋稱,從底層架構級技術角度看,Sora的確沒有很多創新,DIT技術中Diffusion和Transformer都是幾年前的技術了。但Sora的特殊之處在于,它率先實現了大規模的工程化,也就是說把原本應用于文本領域的Transformer技術大規模、成熟地應用在了文生視頻模型當中。此外,它還進行了很多工程層面的創新,比如視頻時空塊Patch技術等。
鄭譞也提到,雖然Sora的效果非常驚豔,但還不能稱爲理論基礎上從無到有的顛覆,但這並不意味著工程上的顛覆就不是顛覆。“當工程量呈現指數級的上升時,一定會出現各種見都沒見過的問題,解決這些問題本身可能就是一種顛覆。”
Sora另一種層面的“顛覆”,集中體現在外界對Sora取代影視行業從業人員的擔心上,一如當年ChatGPT所引發的行業替代焦慮。
不過在沈萌看來,目前Sora只是公開了一些官方視頻,很少有人實際應用,所以其效果到底如何是沒有定論的。而OpenAI CEO阿爾特曼又是一個極度擅長營銷的人,他一定想通過這樣的方式最大程度地放大OpenAI的估值。
由此,Sora也同步進入了被“祛魅”的過程。廣發證券分析稱,Sora的主題意義更爲顯著,商業化進程仍需觀察,一方面,技術文檔提到的當前局限性需逐步解決;另一方面,版權合規、內容倫理等課題仍是AIGC類應用需要克服的挑戰,文生視頻也不例外。
上述業內人士也提到,Sora生成效果堪稱驚豔,開啓了世界模擬器的進步,但還說不上顛覆性。
Sora不是AI的終點
判斷一件事情火不火,一個關鍵的“指標”就是有沒有人賣課。
Sora發布不到一周,尚未對公衆開放測試權限,賣課視頻就已經先一步泛濫于閑魚、小紅書等平台。北京商報記者以“Sora文生視頻”爲關鍵詞在閑魚上搜索,共呈現59條相關內容,價格從9.9元到169元不等。
這些“教程”廣告中,一張以“Sora一鍵文生視頻”爲標題的海報被廣泛使用。海報內容顯示,資料包包含“你的Sora專屬提示詞庫”“Sora專屬提示詞教程”和“30個Sora專用提示詞技巧”三方面。
而透過賣課的“割韭菜”,或許不難摸索國內科技産業發展的亂象和虛火。沈萌稱,國內産業的生命周期,大多以抄概念爲起點,然後大舉跟上,進而衍生一些淺層的應用,進行融資、套項目,最後上市或進行各種程度的資本變現,至此這股風就算過去了。
“整個環節認真、踏實做事的比例很小,這反映出的問題,其實就是不知道自己在幹什麽。”沈萌說,越是可替代,越是價值低,這就是國內AI産業的現狀。
沈萌總結稱,投資者或者機構都覺得AI是風口,瘋狂砸錢,但沒有人去分析砸錢的最後能砸出什麽東西,“如果最後的結果是要進行價格的紅海競爭,這種項目是鐵虧無疑的”。
有消息稱,2023年12月至今三個月內,已有包括萬興科技、博彙科技、易點天下、數碼視訊、漢王科技、當虹科技、東方國信等在內的十余家A股公司,在投資者互動平台上披露過視頻生成模型領域的業務情況。
鄭譞認爲,大模型裏面到底能裝多少現實世界的知識,目前還沒有特別明確的判斷,也就是說Sora並不是AI的終點,未來還有很大的發展空間,最後是誰領先都還不好說。
“所以面對Sora帶來的挑戰,不妨讓子彈再飛一會兒”。鄭譞說。---[北京商報記者 : 楊月涵/來源: 北京商報]