獨家對話矽谷投資人張璐:90%生成式AI創新屬于科技巨頭,創投應聚焦應用層
Fusion Fund創始管理合夥人張璐,圖片由其本人提供
2024年開年,美國科技公司先後抛出AI王炸,AGI賽道新一輪大亂鬥已經開啓。
這只是巨頭之間的遊戲,還是新一代AI創業公司也能參與共建的遊樂場?Sora、Gemini等模型的爆火,會徹底顛覆AI創業和投資的邏輯嗎?
近期,“钛媒體AGI”系列對話,邀請到了矽谷知名科技投資人,Fusion Fund創始管理合夥人張璐做客直播間。
駐紮在矽谷,張璐團隊與OpenAI和英偉達團隊都保有密切聯系。因而,在很早就看到了當前這一波AGI浪潮的萌芽。2017年起,張璐所管理的基金Fusion Fund就開始投資人工智能,2021年底,Fusion Fund出手了生成式人工智能的項目。而去年,Fusion Fund投資生成式AI的項目和資金規模,大于前幾年的總和。
在張璐看來,矽谷早期投資生態非常活躍,優質項目會很快拿到超募,馬太效應明顯。同時,很多初創公司不需要融很多錢了,因爲AI應用後,開發成本沒有那麽高、效率也提上來了,不需招那麽多工程師。
今年以來,Sora的出現,依舊使張璐感到驚豔。她認爲,Sora已經絕對領跑市面上其他的文生視頻模型,並且,已經對物理世界的結構和規律的理解有了一定的深度。
AI基礎創新階段已經過去,現在已進入到應用創新大趨勢。張璐表示,90%的C端的人工智能創新機會都將屬于大型科技公司,剩下10%可能是初創企業的機會。
對于創投來說,機會的確不如以往那般豐富了。去年,大部分投資AI的資金湧向了C端的人工智能應用,但是今年將會急速萎縮。
但值得關注的是,由于AI的革命性顛覆,張璐認爲,這次AI趨勢帶給整個産業升級和創新的量級比互聯網時代還要大十倍,即便是只有30%-40%的機會屬于創業公司,整個市場的體量和潛力也非常可觀。
除了對技術變革和創投邏輯的理解之外,張璐還觀察到,在生成式AI驅動行業變革的情況之下,現代公司的組織架構也會變化。
在她看來,以前科技公司的架構屬于金字塔型,頂端是相對資深的創始人、CEO,下層是很多負責做産品的初級工程師。但現在,因爲AI的發展,公司結構極有可能變成倒金字塔型,上層的創始團隊是相對資深的人員,負責優化模型和産品,但下層就不需要太多初級工程師了。
以下是钛媒體AGI對話張璐實錄,經钛媒體APP編輯:
華楠:OpenAI發布的文生視頻大模型Sora,確實給世界帶來了一場關于人工智能的震撼,也點燃了科技圈。您當時看到Sora的時候,第一反應是什麽?之後采取了什麽樣的行動?您的團隊又如何看待這一次的技術進階革命?
張璐:事實上,我們和OpenAI的團隊內部成員保持著緊密的聯系,經常進行內部交流,所以也有一定的預期和期待。但是即使這樣,Sora正式發布的時候,我們看了各種各樣的視頻,感到非常驚豔。在我看來,與市面上其他的一些文生視頻相比,Sora無論是從效果、技術、連貫度、完整度、複雜度以及技術潛力,都不在一個量級上。很多視頻都體現了,它的模型已經在某種程度上對物理世界的結構、規律有了一定的深度理解。
接下來我考慮的一個問題是,他到底花了多少資金和資源來開發這個模型?從科技和商業投資的角度來看,技術成本是很關鍵的一點。如果說它的技術成本是可控的,那麽它本身對整個産業和內容視頻行業的顛覆性影響,在近期可能都會顯現出來。
這只是它的第一個版本,我們期待它的持續升級。因爲現在你會看到一些視頻內容並不是完全正確,就像被Meta攻擊的一個視頻中的螞蟻有四條腿。因此,目前它是否有能力理解我們的物理世界,是討論的核心點。
我覺得它已經具備了初步的理解能力。我們人類認知這個世界的過程,也是通過觀察、學習和推理逐漸形成的。通過觀察更多的信息和現象,歸納出物理的模型和物理的定律,然後再用這些物理模型和定律,更深入和直接地了解這個世界。所以這也是一個過程。從這個角度來看,基于Sora目前發布的視頻,我還是覺得模型已經對物理世界有一定認知。
當然,我們也能看到,Sora發布的視頻還是相對較短。從幾十秒、到幾分鍾、到幾個小時,其實時長的延伸,它背後需要的算力、資源、模型的優化,並非單純的線性增長,而是指數型的增長。所以,現在能生成分鍾級別的視頻,不代表我們很快就能看到更長的視頻。
從日常的文生視頻或者說視頻産業需求來看,短視頻是一個巨大的市場,但並不是全部的市場。還是有很多的空間可以讓我們期待技術下一步的發展。
我們一直非常看好開源領域,並在開源模型層面有所布局。從科技投資的角度,這種投入成本、算力成本、數據量成本要求極高的模型的基礎設施投資,最適合由大公司來完成。在這個基礎之上,大公司可以爲初創企業提供一個很好的平台,讓他們以更少的資源和更快的速度進行應用層的創新。
所以,現在我們可以看到前幾年相對安逸的大型科技公司在互相卷,快速推出各種模型。我們又被打了一次雞血,對于未來幾個月整個産業的發展又有了更高的期待。
華楠:這一輪AI浪潮,對美國的創投圈又會産生哪些影響?
張璐:我們從2017年就開始投資人工智能,投資的第一個生成式人工智能是在2021年底,我們對這個産業也有比較深入的了解了,你不會看到我像別人一樣超級興奮,但其實我非常看好它。所有事情現在都是剛剛開始,無論是Sora,還是其他的各種各樣的模型、開源社區的建設。
當然,從投資角度,我們從來不投C端,我們投的都是B端。有兩類,一類是垂直領域的to B的人工智能應用,另一類是跨行業的AI基礎設施的投資,從芯片層到邊緣計算,再到數據隱私網絡技術。
但是矽谷確實有很多的VC、創業者,核心是在做to C人工智能應用,特別是文生視頻領域的公司有很多。Sora可以說是給大家帶來一個激勵,同時也會讓很多公司思考自己未來發展的方向,以及競爭力所在。
一個重要的觀點是,模型叠代的速度很大程度上依賴于數據。誰有海量的、高質量的數據,誰就可以更好地優化它的模型。而且,數據質量越高,可能需要的訓練數據量就會越少。訓練數據量少,也就意味著你的算力成本更低,耗電量更低,效能更高。
從這個角度看,大型科技公司,無論是在算力還是在C端用戶數據的質量上,優勢都是巨大的。所以,C端的人工智能應用面臨的一個巨大挑戰是,核心競爭力取決于誰手裏掌握海量的、高質量的用戶數據。但是高質量的用戶數據,都在大的科技公司手中,這對于初創企業是一個很大的挑戰。去年,大部分投資人工智能的資金湧向了C端的人工智能應用,但是今年這種情況會急速縮減。
Sora的出現,不僅對那些文生視頻初創企業是一個警示,對那些專注于C端人工智能應用的VC來說也是一個警示。如果他們持續投資這個方向,還可能會持續面臨大公司的叠代和挑戰。這可能會對C端的人工智能應用的資本活躍度造成較大打擊,因爲可以看到大型科技公司及初創企業在量級和技術叠代層面上的差異。
華楠:您認爲2024年它會是一個文生視頻的元年嗎?在這個領域,您比較看好哪些技術方向和創業公司?
張璐:我覺得去年其實從文生圖開始,就開始有些文生視頻的探索,甚至可以說去年是一個元年。今年,大家可以看到文生視頻的質量以及複雜度有了顯著提升。我記得有一個視頻,是一艘船在一個流動的液體中航行,這已經相當于是一個非常複雜的視頻生成了。如果說繼續延展下去的話,可能會有更加複雜的視頻生成,包括物理世界的理解和物理世界的構建。
對于初創企業,美國的C端市場還是比較難做的。我去年提過一句話,90%的C端的人工智能的創新機會都將屬于科技大公司,剩下10%可能是初創企業的機會。對于初創企業和早期投資人,可能要非常明確和精細地去挑選到合適的機會然後投資。
當然,有一些公司做得很好或者做得比較早的話,會有一些並購的機會。但有足夠的現金和資源去收並購的這些大公司已經有了模型,那它繼續收並購的動力在哪裏呢?因爲做一個很好的demo很簡單,但若想把它做成大規模的應用,首先,技術的成本要足夠低;第二,不能有一些延遲;第三,技術本身要有很強的擴展性,可以大規模應用,而不只是在特定的最小範圍的應用,這對技術的要求還是比較高的。
華楠:Sora這類文生視頻工具的出現,您認爲會對普通人的生活帶來哪些影響?
張璐:還是回到最初的問題:人工智能的理念是什麽?就是零代碼人工智能平台。相當于,你想使用人工智能,不需要寫一行代碼,不需要懂一行代碼。比如說,你要是做電影和視頻的生成,原本需要一幀一幀把故事線切下來,這個工作可能要花幾百萬美金,但現在不需要了,只要寫一段話,視頻就可以出來。
這是技術最大的一個優勢,它可以解放我們的創造力,降低大家成爲創作者的准入門檻。你不需要有技術背景,只需要有一個好的想法,准確把它表達出來,就有平台和工具幫助你生成。
舉一個簡單的例子,在沒有照相機之前,你需要有非常好的繪畫技巧,才可以把眼前的美景畫下來。有了照相機,你需要有特定的攝影技術去拍照。到後面,有“傻瓜相機”,摁一下就可以了。再到現在,每個人都有手機,自帶相機質量非常好,拍攝非常簡單。
但是,我們並沒有消滅藝術家,反而促成了更多攝影藝術家的産生。如果你有一雙發現美的眼睛,就可以通過簡單的方式去捕捉美,創造美,成爲一個藝術家,創造一些藝術的瞬間和藝術的作品。人工智能,尤其像Sora這樣的工具,會賦能更多的人成爲內容生成方面的藝術家和創造者。
可能大家想到文生視頻,第一個想到的是對電影行業的影響。電影行業的核心是什麽呢?是導演和編劇和觀衆的溝通,通過講一個故事,影響別人的人生或者自我表達。但是,電影門檻是很高的。我們每個人身上可能都藏了一個好故事,現在是不是有一個很好的工具幫我們將它展現出來?
華楠:這一批AI相關的創業群體當中,您發現他們呈現出與以往哪些不同的特征呢?
張璐:確實能夠看到比較大的轉變。以我們投的項目來舉例,去年我們在矽谷一共大約投了十個項目,去年可能是近幾年我們投資最多的一年。然後,我們發現幾個特點,我們投的2/3的項目,都來自于連續成功創業者,或者說非常有經驗的創始人。
一方面,因爲我自己也是連續成功創業者,本身的資源就比較強。另一方面,我們發現,很多很優質的、財富自由的連續成功創業者,在看到市場的機會和時機時,即使他們已經建立過一些非常優秀的企業,他們仍然願意在當下抓住機會,再次下場創立一家新的公司。
同時,很多應用層的公司,哪怕是做to B的企業,核心的競爭力已經不再是算法或者模型了。因爲大部分公司都在使用OpenAI的API或者開源模型,通過優化模型表現或使用高質量的數據,讓模型更加快捷、高效。
比如說,一家媒體有海量的高質量的數據。這時有兩個創業者來找你,一個是有經驗的連續成功創業者,另一個是剛畢業的斯坦福學生,聰明又能幹,非常年輕。他們都希望可以用你的數據去優化它的模型,從而創造一個爲你服務的産品。這時公司大概率會把數據給誰?答案顯而易見。所以,連續成功創業者,或者有經驗的創始人,更容易拿到海量的高質量的行業數據。
另一方面,應用層面上的創新,相對來說年輕的創業者可能機會更多一點。因爲需要有創新的想法,去改變現有的基礎設施的設計。
第二個特點是,以前的公司架構通常是金字塔型,頂層是相對資深的創始人、CEO,下層需要招聘很多初級工程師把産品做出來。但現在,我們發現,去年有一家公司,團隊只有7個人,卻在一年收入實現了25倍增長,這家公司有一百多個客戶,正式負責銷售的VP都是去年底才剛招到。
未來,公司會逐漸形成一個倒金字塔架構。上層無論是創始人還是資深的人員,他們主要負責優化模型、訓練産品應用,而下面那些相對簡單和初級的工作,將不再需要那麽多初級工程師了。可能以前你需要五個工程師,現在只需要一個,再加copilot就足夠了。這意味著,創業成本會越來越低,變現周期也會越來越快。這對于創新生態,是一個非常大的優勢和機會。
華楠:剛剛你也提到了一些年輕的團隊,钛媒體也關注到了,現在矽谷年輕的華人引領了一波AI創業的風潮。不知道您怎麽看這種現象?
張璐:我去年也投了好幾個有華人背景的公司。其實在過去這十幾年,在矽谷的人工智能領域,華裔是非常重要的有生力量。這一波生成人工智能浪潮,門檻還是比較高的,真正懂怎麽去優化訓練模型的人還是少數。這些人主要來自小的圈子,或者說,在矽谷這一個圈子裏,正巧有很多中堅力量又是華人。這對華人創業者來講是一個很好的機會。
華楠:驅動AI創業公司能夠走更遠的因素之中,算法、芯片和數據,您認爲哪一個是相對最關鍵的?
張璐:這三個都很關鍵。但如果說短期內可能遇到的瓶頸,我覺得是算力的缺乏。英偉達的股票和財報爲什麽這麽好?因爲我們現在全球都缺算力。包括我在OpenAI的朋友,內部會半開玩笑地跟自己的老板說,不要給我升職,用這個錢去買多一些GPU吧,因爲我們的GPU遠遠不夠用。即使是谷歌,盡管他們自己有TPU,也有很多成員會去競爭使用TPU的機會。無論是英偉達、AMD還是TSMC都在擴建新的工廠,基本上這些工廠的竣工時間也是在2026年到2028年之間。
短期內,算力需求是巨大的。
在芯片層面上我們有很多探討,包括是不是有一些新的芯片設計可優化,去幫助我們度過這一段的瓶頸期。但是根本上,我們還是需要更多的GPU,更多的芯片。
從長期來看,數據的需求也在不斷叠代和演變。剛開始當然是海量的數據,但是在GPT3.5之後,你就會發現數據的質量比數據的量更重要,包括數據質量本身和數據的相關性。如果你的數據質量足夠好,相關性足夠強,那麽在現有的模型基礎上進行優化所需要的數據量就更少,這樣算力成本更低、耗電量更低、效率更高。此外,數據的多樣性,包括視頻、音頻、圖片數據,也非常重要。
一些輕量級的語言模型的探索,可能是一個方向。這種小的模型不一定能覆蓋所有場景,但是,如果說它能夠服務某個行業和特定應用,也足夠了。人工智能不應該僅僅追求更好表現,同時也要去優化它的成本和效能,才能可持續地發展。
目前大家看到的很多模型公司是不賺錢的,因爲算力成本太高了。他們背後通常站著一個大型雲服務公司,通過雲服務來獲得更多收入,進而支持模型的發展。但這是一個可持續的商業模式嗎?
華楠:現階段人工智能成本確實太高了。一些大公司還可以承受,一些中小的創業公司,是不是就沒有什麽機會了呢?
張璐:機會是存在的。我們看好的是垂直領域的應用機會。尤其,醫療行業是人工智能非常大的機會。在美國,醫療行業占GDP的20%,數據量很大,質量很高,應用場景非常多樣。更重要的是,醫院或者藥廠通常不會把醫療數據分享給谷歌、Meta或者微軟等大公司。醫療行業也需要數字戰略和人工智能的整合和升級,往往他們會更願意和初創企業合作。
凡是監管要求比較高的行業,企業都會比較謹慎,不願意把自己的數據分享給大型科技公司,這包括醫療、保險、金融、物流、供應鏈等領域。
我們投資的好幾家公司都是做這樣的應用。其中,有一個針對制藥行業的生成式人工智能的平台。一個大型藥廠的科學家,可以直接問AI新藥的臨床試驗怎麽設計,AI會直接把答案生成出來,高度精准、高度專業、高度快捷。
還有另外一家公司做醫療影像。之前,病人可以做五分鍾的低精度CT掃描,也可以做兩小時的高精度CT掃描。現在,病人只需要通過五分鍾的低精度掃描,生成式AI直接把它升級成高精度掃描,更快、更好、更便宜。
這樣的應用很多,壁壘相對較高,初創企業在其中有非常強的競爭力。這次的人工智能趨勢,是全産業數字化轉型。整個産業升級和創新量級、創新的機會,比互聯網時代還要大十倍。它的升級速度是非常快速的。所以它的量級如果比互聯網時代大十倍,哪怕初創企業只有30%、40%的機會,也是非常大的市場量級和機會。所以還是有遍地開花的創新企業成長。
華楠:Sora的發布,國內是熱情高漲的。甚至有人說,AGI的時代就要到來了。之前可能說要十年,現在有人認爲,一年就可以實現了。您怎麽看待這個觀點?此外,AGI時代如果真的到來了,會不會出現類似微信或者是TikTok這樣的超級應用呢?
張璐:首先,如果嚴格定義AGI,我們離實現還有相當的距離。當然也有人說學術界和産品界對于AGI的定義是不一樣的。
人工智能現在訓練的所有文本是人類提供給他的,是由我們人類生成的。比如說,你看一部電影或者聽一首歌,心裏可能會有很多很複雜的感受。對于這些複雜感受,你可以非常完整地寫一段話或者畫一幅畫表達出來嗎?這其實是一個很高的要求。鑒于我們對內心感受和信息的表達存在局限,提供給人工智能的信息自然也不會是完整的。
AI還是有很大的提升空間,我們在加速朝AGI的方向前進,這確實令人興奮。但是由于我們對技術有深入的了解,也會更加客觀地看到現階段與真正的AGI之間的距離。所以,大家既不要神化AI,也不要神化技術。
未來會不會出現平台型公司?人工智能本質上是工具,把工具使用好,還要選對産業和應用。全産業都應該使用AI,但是不代表每個運用AI的産業和應用都會創造出十億、百億級別的公司和機會。有些只是驅動一下,有些可能會帶來根本性的變革。
TikTok這樣的科技公司,將會被AI第一個賦能,速度和效果比初創企業更好。某種程度上,人工智能加劇了現有的大型科技公司的壟斷或者是絕對的領先地位,只要這些公司擁有合理的戰略和快速叠代的執行效率,它們還會雄霸科技行業好多年。
華楠:我們一個用戶,是一個高三的美術生,本來想學動畫專業,結果AI崛起,想著就業可能難,就往戲劇美術設計專業上學,那時候覺得,做電影特效也不錯。如今Sora來了,他對未來又迷茫了。您怎麽看這樣的現象?
張璐:近一段時間,Sora生成的視頻的質量,與渲染的精品視頻的成品來比,還是有一定的距離的。當然如果那位同學才高中的話,他的擔憂其實是有道理的。因爲AI替代一些工作,可能不會在短短一兩年時間內發生,但在三到五年的時間裏發生的可能性我們無法預知,技術的發展速度是未知的。
想成爲一個內容創作者,核心是有好的想法、洞見和見解,創造故事的能力。人工智能現在的作用還是一個工具,工具替代掉的不是Job(工作),它替代的是Task(任務)。就比如,護士是一個工作,但一天可能有100個不同的小任務。
我們用人工智能的工具替代掉一些任務,而不是把工作完全替代掉。未來哪怕說你還是學美術,如果有一天Sora可以生成高質量的長視頻,還是需要有人去審閱、編輯和進一步優化,所以人的價值是不可替代的。有危機感很好,但同時也不需要把技術過度神化。
華楠:是的,技術的進步確實可以爲每個人所用,就看自己如何把握這個機會。最後一個問題,我們留給钛媒體直播間的用戶。有一位用戶在我們直播間評論說,AI的底層基礎邏輯才是關鍵因素,需要大量的數學家和科學家,純粹砸錢在這個領域已經失效了。作爲投資人,您怎麽看這個觀點?
張璐:確實如此。單純的資金投入帶來最大的優勢是算力優勢。當然,無論你有多好的模型,都離不開算力,這是當下非常現實的一個問題。學術界現在最大的一個困境就是無法和工業界競爭算力。一個科技公司可以投入十億美金、百億美金去保證自己有足夠的算力。但是一個學校,一個教授,一個實驗室,不可能有這麽強的資金得到足夠的算力。
然而,正如該用戶所說的,核心還是在于探索新型算法,使用更少的算力成本和能源成本,進行人工智能的優化。那個時候,對GPU層面上的需求可能會減少。對于這些新型模型而言,這將開啓許多創新的機會。但在那之前,資金投入仍然是關鍵。---(钛媒體/作者 : 李程程*編輯 : 馬金男)