01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

抖音、優酷的“Sora”在哪裏?

2024022212:18

OpenAI又一次震撼了科技圈。

當地時間 2 月 15 日,OpenAI 推出旗下首款視頻生成模型Sora。官方介紹寫道:“我們打造了一種名爲Sora的文本到視頻模型。Sora能夠生成長達一分鍾的視頻,同時保持視覺質量和對用戶提示的遵循。”

Sora是日語“天空”的羅馬音字母,在英語裏則有小鳥在空中詠唱的意思。它像是OpenAI此前推出的圖像生産系統DALL·E與AI聊天機器人ChatGPT的混合升級視頻版本。

過去一年,生成式AI視頻創業已是一條熱門創業賽道,湧現出了一批備受矚目的獨角獸,也給出了不少有創意的作品。但外界普遍仍抱有AI生成視頻和實拍差距明顯,全面推廣商用並不會在短期內實現的想法,然而Sora的演示樣片徹底顛覆了大衆的認知。

通過OpenAI給出的案例演示來看,用戶只需要輸入簡短的文字描述,Sora就可以將文本內容轉化爲一分鍾的高清視頻。

年輕的東亞女性走在充滿霓虹燈的東京街頭、兩艘戰船在咖啡杯裏斡旋、黑人小夥在雲端聽歌、古鎮巷子裏迎接龍燈的男女老少……畫面不僅包含高度詳細的場景、神態動作機器逼真的人物形象,更是呈現出如同電影效果的攝影機運動曲線和同一場景多景別取景。

不僅如此,Sora還可以根據靜態圖像制作動畫,立體平面多種風格都可以實現,說是動畫工作室出品的最新短片也不爲過。

如果不仔細觀察,視頻畫面基本沒有AI制作的違和感,甚至可以抵得上好萊塢娴熟的現場實拍和龐大的後期團隊合在一起數月的工作量。

Sora的進化速度,連《流浪地球》的導演郭帆都發朋友圈感慨,“太快了”,並配上了“哭泣”的表情。



不止大佬郭帆,整個影視行業都在密切關注Sora。“Sora大幅提高了影視工業的生産力。”資深影視從業者老邱對《最話》說,“人人都可以成爲導演的時代快來了。”

01. 視頻行業的iPhone時刻?

從樣片來看,Sora呈現的效果遠超Pika、Runway。之前的文生視頻模型基本上是生成單鏡頭,一旦輸入新的提示語,畫面主體會出現明顯變化。Sora生成的視頻在視角轉換、鏡頭景別切換後,可以保持主體的一致性,這讓一個人足不出戶制作獨立完整的視頻作品變爲可能。

Sora正式上線後,專業短視頻制作成本或將大幅度降低。

“用AI工具開發一個小說IP,前期開發的文字和圖片成本可能是以前的十分之一,做一條30秒預告片demo的成本,成本可能是以前的二十分之一。”老邱認爲,“有好多故事和題材,一個人用Sora就能做一條片子。”

但Sora的高效率會不會沖擊到影視行業從業者的飯碗?

以短視頻團隊爲例,短視頻平台上1秒種長度的專業內容基本就對應著1個小時的專業工作量,一個賬號基礎配置包括出境博主、攝影師、剪輯師的3人團隊。一個日更30秒視頻的賬號需要小團隊每日的高頻産出來維持更新頻率。

使用AI生成視頻後,不僅可以省去實地拍攝的所有成本,攝影師和剪輯師可有可無,甚至連博主都不需要了。只需一個人闡述文本內容就能運作多個賬號,且每個賬號的主角還能不一樣。

據美媒報導,好萊塢正在擔心AI將導致舞美、後期、特效等崗位出現大面積失業。有統計稱,美國的創意行業未來三年將有近20.4萬個崗位受到AI的沖擊。

去年5月2日,美國編劇工會(WGA)宣布罷工。7月13日,代表16萬演藝人員的美國演員工會及廣播電視藝人聯合工會(SAG-AFTRA)也宣布與制片公司的談判破裂,從即日起進行罷工。兩次大罷工,原因除了演員、編劇與資方的薪資矛盾外,人工智能可能取代演員和編劇的威脅成爲主要原因。

據中國僑網消息,參與談判的人表示,通貨膨脹和流媒體生態系統、福利以及不受監管地使用人工智能的威脅削弱了他們的基本工資。

但也有業內人士對此抱有不一樣的態度。樂觀主義者將Sora視作是“視頻行業的iPhone時刻”,將它視作輔助創意執行的工具。“Sora的魅力在于能夠培養創造力。導演可以嘗試不同的美學或場景,而無需承擔與傳統制作相關的財務風險,爲以前僅限于想象力的敘事和視覺風格打開了大門。”

老邱也是類似的觀點,“AI將大幅提升影視作品的産量,更多元的品類和商業玩法,從而抵消專業從業者被AI替崗的沖擊。”

AI生成工具需要大量內容進行訓練,而這些內容都是此前創意行業從業者辛勤工作得出的成果,所以有創意工作者在質疑大模型訓練是否侵權,AI生成的內容是否可以商用,甚至一些編劇拒絕將其作品用于AI訓練和創作素材。

客觀來說,版權保護、就業崗位與生成式AI發展存在相互制約的。目前,各國司法機構都沒有給出明確的界定,短期內相關方還會處于博弈狀態。

而相比起國外創意工作者擔憂版權被侵權,國內從業者則看淡許多。目前,影視行業在研究如何引導AI制作電影短片。老邱認爲,“在摸索如何用好AI工具方面,中國影視人非常卷,國外的影視人遠遠沒有中國同行瘋狂。”

02.“中國版的Sora”在哪?

受Sora影響的不止影視、創意、廣告等行業。“Sora生成的視頻質量之高,會讓現有視頻生成公司立即感受到威脅。”

Sora發布後,此前宣布全面擁抱AI的圖片軟件公司Adobe股價應聲下跌7%,哪怕其去年推出的主打文生圖的FireflyImage2、矢量圖模型FireflyVectorModel以及設計模版生成模型FireflyDesignModel已經令人驚豔。

讓人驚訝的是,Sora背後團隊的核心成員僅有13人, 2位負責人也不過剛博士畢業。Tim Brooks是DALL-E 3作者之一,在英偉達實習時負責過視頻生成研究項目;William Peebles則與CV行業大神級人物謝賽甯合作發表了DiT模型,首次將Transformer與擴散模型結合到了一起。

從時間線來看,Sora並非是醞釀多年的項目,就是這支年輕的團隊在一年內搞出來的成果。Tim Brooks稱:“我們認爲建立能夠理解視頻的模型,並理解我們世界中所有這些非常複雜的交互,對于人工智能系統而言是非常重要的一步。”

Sora一出,OpenAI在生成式AI領域的領軍地位再次得到了鞏固,市場立刻給出了積極反饋。早已和奧爾特曼分道揚镳的馬斯克在個人賬號發出了“gg humans(人類服輸)”的感歎。

從Meta離職加入紐約大學的謝賽甯盛贊Sora將改變行業,並在社交賬號拆解起OpenAI構建大模型的邏輯。他分析稱,Sora應該是建立在帶有Transformer主幹的擴散模型DiT之上的。Sora可能不需要龐大的GPU來訓練,目前大約30億個參數,仍有快速叠代空間。

面對外界的驚歎,OpenAI一如既往以退爲進,用謙虛的言辭炫耀著實力。

OpenAI稱,Sora存在難以准確模擬複雜場景的物理特性、無法理解因果關系的具體實例和混淆提示空間細節的缺陷,目前還處在測試階段。公司將會給視覺藝術家、創意工作者提供訪問權限,以便收集專業人士的改進建議,進一步完善模型。



如果說國內影視圈、創意圈是在研究如何用Sora降本增效,自媒體圈是在研究如何以Sora爲噱頭賣課,那麽Sora的驚豔亮相無疑讓科技公司重燃激情,文本生成視頻賽道成爲新戰場。

今年2月7日,抖音集團CEO張楠宣布已辭去集團CEO一職,未來將把精力聚焦在剪映的發展上。據媒體報導,過去一年,張楠把絕大多數精力傾斜到剪映相關業務上,並親自帶隊尋求在AI輔助創作上有所突破,即將推出一個AI生圖和視頻的産品。

八天後,Sora的火爆讓外界猜測張楠的調崗是否是字節在做更深的布局。近日更是有傳言稱,字節跳動已經在研發一款名爲Boximator的創新性視頻模型,有人因此認爲“中國版的Sora”即將來了。

對此,字節跳動相關人士也向《最話》回應稱,“Boximator是視頻生成領域控制對象運動的技術方法研究項目,目前還無法作爲完善的産品落地,距離國外領先的視頻生成模型在畫面質量、保真率、視頻時長等方面還有很大差距。”

根據公開信息顯示,截至2021年,剪映的月活用戶已經突破1億,是國內最大的移動視頻編輯産品,其已內置了多項 AI 功能。

而從字節對媒體的回應來看,Boximator模型仍然處于研發階段,預計將在2-3個月內發布測試網站。到時才能獲悉其對視頻創作的影響,以及是否會與剪映進行融合。

除了字節的剪映,還有不少互聯網公司都推出了自家剪輯工具産品,例如快手推出的快影,B站交出的必剪,但均未公開是否有類Sora産品的計劃。

視頻制作成本高,而各大影視平台自制劇越來越多,以愛奇藝爲例,每年的內容成本就需要上百億。使用AI生成視頻技術將極大降低成本,提高特效。據介紹, 愛奇藝已率先開始在內容策劃、開發、制作、宣發等核心環節落地生成式AI的應用,並在文本、圖片、聲音、視頻四大應用場景形成了一定生産力。

而另一個視頻平台優酷最近上線的《大唐狄公案》是其首部AI輔助生成特效畫面的劇集。相比傳統特效方式,阿里大文娛的AI技術,可以用更短時間完成各類虛擬場景的搭建,生成超高精度的特效畫面。據《最話》了解,優酷目前正在研究Open AI的産品,而此前火爆一時的AI生成寫真應用“妙鴨相機”就是優酷內部創業項目。

除了視頻平台,還有不少AI企業正密切關注著Sora,今年或推出類似的應用。“Sora給中國科技公司們趟出了條路,指出了方向。”一位科技企業技術人員對《最話》說,“當然,我們的人才、算法比人家還是差得遠。”

03. 進擊的巨頭

接連不斷的顛覆性産品讓OpenAI的影響力與日俱增。盡管還保持著獨特的股權結構,但OpenAI確實越來越商業化了。據報導,OpenAI與風險投資公司Thrive capital達成最新股票出售協議,公司估值突破800億美元,是僅次于字節跳動和SpaceX的第三大獨角獸。

有起就必然有落。

一夜之間,Sora成爲行業投資人議論的焦點。OpenAI的每一次突破都會讓資本對它的想象空間進一步擴大,同行競爭者能夠拿到的資源也會變少。

不少小型初創公司創始人在看到Sora呈現的效果不得不思考新的發展方向。有分析人士甚至悲觀地表示,ChatGPT終結了AI文本生成創業,Sora要終結AI視頻生成創業了。

前阿里技術副總裁,正在進行AI創業的賈揚清認爲:“從算法小廠的角度,要不就算法上媲美OpenAI,要不就垂直領域深耕應用,要不就選擇開源。”

OpenAI的遙遙領先使得其越發向著壟斷巨頭的趨勢進化,讓諸多AI領域的創業公司如坐針氈。

除了AI創業者,作爲大模型的根基,芯片制造領域和OpenAI的關系也在變得微妙。

ChatGPT爆火後,從絕對數值來看,英偉達顯然是比OpenAI更大的受益者。2月,英偉達市值飙升至1.8萬億美元,趕超谷歌、亞馬遜,成爲美股第三大上市公司。

如果能擁有算力芯片的研發、制造和生産能力,OpenAI就可以串聯起整個産業鏈,奧爾特曼越發想介入上遊。

2月,OpenAI創始人奧爾特曼被爆在跟中東投資人兜售旨在提高全球芯片制造能力的大項目。知情人士透露,奧爾特曼認爲現有的AI芯片供應量跟不上AI的高速發展,芯片會成爲實現通用人工智能障礙,他希望籌集5至7萬億美元來建立新的AI芯片企業。

奧爾特曼的表述顯然言過其實。根據市場調研機構IC Insights報告,2023年全球整體芯片市場的收入預計提高24%,史上首次突破5000億美元。按現在的增長速度,2030年芯片業收入才有望突破1萬億美元。

“如果你只是假設計算機不會變得更快,你可能會得出這樣的結論:我們需要 14 個行星、三個星系和四個太陽來爲這一切提供燃料,但計算機架構仍在不斷進步。”

同爲輿論焦點人物,英偉達首席執行官黃仁勳雖然認爲各國都需要建設獨立的AI基礎設施,但是並不認可奧爾特曼的誇張性表達。他認爲,芯片業的擴張並不意味著數量爆發,而是要提升AI計算的效率,過去十年算力成本已經下降了100萬倍。一味地擴大産能將導致供需失衡,沖擊芯片的價值。

OpenAI展現出的實力越大,外界對它的擔憂和爭議也會越多。自ChatGPT爆火,輿論對AI的邊界應該設在哪裏的爭議就沒有停下來。從文字到圖片、從圖片到視頻……AI以假亂真變得越來越難以識別。按照現在的進度,AI生成從二維進入三維世界大概率只是時間上的早晚問題。

新的一片天空已然拉開大幕,AI行業思考如何在激烈的市場競爭中占據一席之地固然重要,但更重要的是得處理好人類和AI的倫理規範。

AI可以生成虛幻的數字影像世界,但監管它的規則,還是由人類來制定的。---來源: 钛媒體-