01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

ChatGPT能否成為互聯網後下一個系統性機會?-(3)

2023022217:52



ChatGPT 能讓TMT投資人「再干15年」嗎?

險峰:ChatGPT下一步會往何處去?會不會被下一個transformer顛覆?

陶芳波:個人觀點,我們可以從底層視角來看,比如今天OpenAI做出了ChatGPT,未來或許還會有GPT4,我們先假設OpenAI的技術是最領先的,現在後面有一堆大廠巨頭和創業公司,正在或者將要做大模型,那如果我是OpenAI,我接下來會做什麼?

我覺得第一個方向,還是怎樣用好手上的現有數據,把模型的潛力全部挖掘出來。下一代GPT的參數量也許還能再大個10倍,但估計也就是這個規模了,不可能再擴大1000倍,因為參數要有足夠的數據來匹配,全世界的優質數據就這麼多,參數量搞得再大效果也不有太大提升。

另一個方向,也是Anthropic提出的,叫做「憲法AI」。就是我們能不能讓AI在一套憲法,或者說一套規則下,實現自我進化,最終變得符合這套規則。舉個例子,每個國家都有自己的監管體系,比如中東地區,只有符合當地監管的AI才能進入該國,我覺得這會是一個非常好的方向,可以大大降低AI吸收信息的成本,提高它的效率。

第三個方向是多模態,讓OpenAI變成一個思考引擎。我們知道人類的感知不是單一的,而是許多模塊組成的,不是說用戶說了一段話,我能感受到這段話就夠了,最簡單的,比如看漫畫書,人能夠把感知圖像和感知文字結合在一起,而不是兩個單獨的東西。

所以我覺得,接下來大模型會在這些方向上繼續發展,這是一個底座,這種狀態會維持相當長一段時間,而接下來才是更巨大的挑戰,無論是投資人,還是創業者,我們到底應該怎樣去迎接ChatGPT的革命性變化,在它上面重構一個巨大的新體系?

舉個例子,2007年iPhone誕生,10年之後你會發現整個互聯網生態都變了,iPhone上面長出了各種各樣的應用,這10年間,全球誕生了多少獨角獸,誕生了多少千億、萬億美金級的公司,這些公司在iPhone出現之前都是不存在的,都是從一個很小的作坊開始做起來的。

我覺得今天大量的機會其實是這裡面,首先是中間層的機會,就像在大模型外面搭一個腳手架,讓它有1000隻手1000隻腳,可以做更複雜的事情,比如基於如何使用大模型構建一個社區,這是一種最輕量級的創業思路。再比如教會大模型怎麼去使用外部工具,怎麼樣更好的去理解對面的用戶,而不只是從文字輸入來理解他——這也是我們正在做的事情。

在中間層上面,還會有各種應用層,剛才費老師也講到,AI在SaaS端已經被驗證了,但我個人認為這一波AI浪潮席捲的範圍會遠大於SaaS。因為SaaS更多還是服務於企業的效率工具,但ChatGPT肯定會拓展到C端,比如說健身、醫療,都有機會可以重做出一個交互式的軟件,把用戶界面完全拋棄掉,和移動互聯網時代相比,我認為這會是一種全新體驗的產品。

黃東旭:我也有類似的觀點,其實軟件的進步一直都是交互方式的進步,以前是字符界面,到後來是UI,沿着這條線往下走,未來最重要的軟件交互形態其實就是自然語言。過去我們一直在嘗試,讓軟件的使用變得更加貼近人類自然語言,但是今天我們終於有了這樣一個新工具,能重新去塑造我們跟軟件的溝通方式。

以前我們用軟件,比如說Linux,輸入一堆命令,機器才能去完成一件事情,相當於我們要去學習機器的語言。但現在有了ChatGPT,你可以直接去跟他說,我想要到達到某某結果,我不管你怎麼幹,最後能給我結果就好,這其實是一個非常顛覆性的東西,所以我們現在正在做的,不斷跟GPT磨合的,也是類似的思路。

陶芳波:我記得ChatGPT剛出來的時候,就有投資人提出一個觀點,說TMT可以重新再干15年,我覺得這個邏輯是對的,因為上個時代我們基於移動互聯網,做出了各種各樣的APP,而今天新的交互形式出現了,每一個細分的賽道上可能都會成長出一個全新的獨角獸,或者全新的商業模式,我覺得是一個完全的大洗牌。

今天ChatGPT的潛力大概只發揮了百分之幾,就已經創造出超過了萬億的市場,未來這個規模可能是幾十萬億。

ChatGPT 正在對哪些工作崗位造成影響?

險峰:這個問題是幫別人問的,他是個很早期的NLP從業者,想問大模型出來以後,其他的模型可能就成為歷史了,他們這些人未來應該怎麼辦?

龍波:這個問題的答案還是比較清晰的,以前那些傳統的NLP的手段,在這個時代肯定是不會再有用了,比如大量的語法樹之類,非常繁瑣,過去開發過程很痛苦,要一支很大的團隊才能做出一個很小的東西,我們肯定不會再回到那個年代,老的技術基本都可以用大型語言模型(LLM,large language model)替代。

對於ChatGPT的未來,我非常同意陶博士剛才說的,如果只是一味地增加數據或增加參數,不一定還能得到好的ROI,因為你給了更多的數據,就意味着有更多的噪音,最後信噪比可能反而更差,這也是為什麼我們有時覺得ChatGPT會回答錯的原因,所以還是要關注如何提高數據的質量。

與數據質量同樣重要的,可能是跟大模型的互動。舉個例子,如果我們真的要讓ChatGPT變成某個領域的專家,不再犯什麼錯誤,可以想想我們培養一個PHD的過程是什麼樣的?他需要和他的導師、行業大牛反覆地交互討論學習,才能最終成為專家,而不是說簡單的篩選高質量數據餵給他就完了。

如果再進一步,我們要讓ChatGPT成為真正的通用人工智能,在每個領域都很精深,也需要有一個方法能夠讓AI迭代高質量數據,所以我覺得未來在算法層面可能會有一些突破,比如說讓RL和大語言模型更完美的結合,能夠更好地篩選出高質量數據,甚至是自動採集這種數據,這些都會跟人學習的過程越來越像。

到那時,我不知道是不是只靠現在的統計模型或者大型語言模型就夠了,還是會跟其他新技術綁定在一起,比如現在也有人在研究,怎麼把真正的推理能力和神經網絡相結合,這是我看到一些未來可能發生的事情。

險峰:接下來可能是很多CEO比較感興趣的問題,創業公司應該如何使用ChatGPT ?它將可以替代哪些崗位?

黃東旭:個人認為可以從兩個方面來看,對內和對外,我先說對外。

首先在AI爆發的大背景下,我們做數據庫的還是一個挺安全的生意,因為不管怎麼樣你還是要存數據。在過去沒有AI的時候,我要從數據庫里提取數據,學過計算機的朋友可能都知道要用到SQL,或者其他語言,總之是需要敲代碼才能去跟數據庫做交互。

舉個例子,之前我曾經把我自己所有看過的電影、所有看過的書,全都導到了我的數據庫里,我就可以直接去問我的數據庫說,在我去年看過所有的電影裡,哪個導演的片子最多?他會直接幫我生成SQL,SQL再去數據庫里進行查詢,非常快速且準確,但是前提是你必須會敲代碼,懂得機器的語言。

沿着我剛才的理論——自然語言會變成下一個軟件交互的UI,大家想象一下,如果你是個CEO,你公司裡面有很多運營數據,每次你去找財務,或者數據分析師,說我需要一個某某數據,他可能過好幾天才能返過來,但現在如果有這樣的一個很神奇的數據庫,CEO可以直接開口問AI,比如今年公司花錢最多的部門是哪個,馬上就可以得到答案。

那如果再推一步,我們把背後的數據集換成了區塊鏈,換成了房地產信息,換成了股市信息,你會發現一下子人人都是數據分析師,這對於各個行業都會是一個巨大的顛覆。

至於對內部,我覺得CEO一定要放棄ChatGPT可以完全取代人的觀念,現階段肯定是取代不了,但是它能提高人的效率。

如果大家寫過程序就會知道,一個工程師可能有80%的時間都是做重複勞動,未來這80%的工作其實都可以讓ChatGPT來做,比如說寫文檔、寫單元測試,生成一些腳手架之類,它不會完全取代程序員,但是確實能帶來很大的提升效率。

大家如果看過《鋼鐵俠1》,裡面有一個AI助手叫做賈維斯,現在我跟ChatGPT的工作模式與它很像,我會告訴它我要做什麼東西,你先做一個原型出來,然後一步步跟它交互,告訴它可以這樣這樣搞。

所以至少目前,我並不會把ChatGPT當做是一個可以取代人工的東西,而是給所有的工程師都配了一個賬號,告訴他們遇事不決先問一下ChatGPT,搞不好效率就提升了,這是我大概的經驗分享。

陶芳波:我稍微插一句,我覺得東旭他們公司很厲害,已經開始使用ChatGPT來提高效率了,其實很多國內的公司都可以學一下。

另外他講的第一點我感觸很深,數據庫公司未來一定會存在,但也一定還會很多有提供其他互聯網信息服務的公司,我覺得他們可能都要去思考,是不是今天我暫時是安全的,ChatGPT跟我就沒有關係?

我覺得可以換一種視角,現在的現實是,這個超級大腦已經在那裡了,他未來一定是會跟各種各樣的東西連接在一起,這裡面有一個很重要的點,以前我們說信息服務的連接端口是API,還有一大堆代碼之類的,但今天這個端口很可能會變掉,變成一個更加接近於人類語言的東西。

所以我覺得每一個服務提供商,如果覺得你的信息服務很有價值,我覺得都可以嘗試去擁抱ChatGPT,看看怎麼跟他建立起對話通道,越早擁抱,就越早可以讓ChatGPT把你的服務分發到更多的場景、更多的用戶。我覺得這件事情誰做得快,誰就可能成為自己賽道里的下一代巨頭企業。

ChatGPT廣泛使用後,人類的認知能力會下降嗎?

險峰:ChatGPT出來以後,主流聲音認為以後可能就不再需要搜索引擎了,但也有一些悲觀者認為,我們將來接觸的大部分信息都會由機器生成,裡面會有大量的假信息,這將威脅人類的認知和判斷能力,如果我們從小就依賴這樣的產品,可能會是一個災難性,對此各位怎麼看?

費良宏:這不是一個新問題,其實互聯網從誕生之日起,就一直在改變我們使用和消費信息的習慣。

比如,最開始出現的是瀏覽器,它讓網頁信息變成了一種規範的、可以被瀏覽的形式;之後,隨着信息總量的不斷增長,大量垃圾信息開始影響我們的用戶體驗,這時出現了雅虎的黃頁,它通過人工方式去維護目錄,給每個網頁設置優先級。

再往後,當信息量繼續爆炸,黃頁的維護開始跟不上數據的生產速度,人們慢慢意識到,使用搜索可能會比使用黃頁更有效率,這時誕生了最早期的搜索引擎,比如AltaVista和Infoseek,但是它們的能力受限於當時的技術,還只能在一個很小的範圍內能進行搜索。

後來的故事大家都知道了,1998年,谷歌的兩個合伙人開始創業,他們希望用計算機構建一個更廣義的集群,通過大量廉價的硬件設備來滿足整個互聯網的搜索需求。在當時,大家認為這是不可能實現的,但後來的事實證明,技術的進步遠超我們的想象,於是人類進入了關鍵字搜索時代,開始通過搜索引擎來使用和消費互聯網信息。

到了今天,互聯網上的信息總量已經是一個天文數字,你的每一次搜索,結果可能有成百上千頁,裡面存在大量無用或者重複的信息,那我們應該如何應對這樣的局面?這時ChatGPT出現了,它可以幫助我們去做總結歸納,如果從信息消費的歷史來看,這是一個巨大的進步,這點無可否認。

而從歷史來看,一旦我們養成了新的信息消費習慣,就沒有辦法再回到之前的時代,我們不可能用黃頁去替代今天的搜索引擎,同樣的,未來當我們適應了ChatGPT,我們也回不到關鍵字搜索時代。

因此,人類下一階段的信息使用習慣一定是更高級別的,當然這裡還有成本問題,比如像ChatGPT的每一次搜索大概需要1.3美分,成本還是比較高的,如果再能降低10倍的話,我覺得整個搜索市場會被完全顛覆。

從這個角度說,ChatGPT的歷史地位可以等價於瀏覽器的出現,或者是谷歌搜索引擎的出現,人類每一個信息消費習慣的進步都意味着一個里程碑式。

龍波:非常贊同良宏的觀點,ChatGPT的交互方式讓我們獲取信息更加高效,它帶來的影響是不可逆的,肯定會對搜索引擎,甚至推薦引擎都帶來衝擊,而且我認為衝擊會很大。儘管短時間內會有些技術上的挑戰,比如如何把ChatGPT融入到搜索引擎中去,但我認為這些都不是問題,很快都會被解決。

那麼ChatGPT的挑戰是什麼?第一個挑戰是商業化,任何2C的技術應用背後一定要有商業支撐。

剛才良宏談到谷歌的巨大成功,但是其實在1999年,布林和拉里佩奇是準備以100萬美元的價格把谷歌賣掉的,據說最後已經談到了75萬,如果當時交易達成,也就沒有後面的故事了;到了2002年,雅虎打算收購谷歌時,開出的價格是100億美金,等於說4年翻了一萬倍。

為什麼形勢會逆轉呢?因為商業模式走通了,從display as到search as,搜索廣告的收入開始有了巨大的增長,當時所有人都看到了谷歌的商業潛力,所以價值一下就不一樣了。也正因為如此,谷歌才能有資源雇最好的員工,創造最好的企業文化。

未來ChatGPT也會面臨同樣的問題,比如現在的搜索引擎是靠點擊量來收費,本質上賣的是用戶的注意力,而如果AI一秒鐘就完成了答案交付,那賣廣告的模式肯定就不再work了,一定還需要尋找新的商業模式來支撐它,當然,我相信最後肯定也會找到。

第二個挑戰是人文方面的,剛才問題中也提到了,ChatGPT會極大影響人的認知模式。

在搜索引擎時代,我們每完成一次信息收集,其實都是完成一次學習的過程。舉個例子,比如我們發論文,每篇文章後面一定要有一個reference(參考文獻),你要先把前人做出的研究成果講清楚,再說你在這個基礎上取得什麼成果,這是一種知識的傳接,如果沒有reference就不可以被稱為學術論文。

谷歌的搜索引擎,也是把它認為最相關、最高質量的鏈接排在最上面,最後還是需要你自己去做判斷,這是人類學習的方法,你一定要有出處,要有reference,這是我們作為研究者對人類知識積累的一個基本態度。而如果AI就只給一個答案,會讓信息繭房變得更嚴重。

傳統來說,我們在互聯網獲取信息有兩種基本方式,一個是搜索,一個是推薦。搜索是說用戶知道自己想找什麼,我就給他什麼,推薦是用戶不知道自己想要什麼,那我就猜你想要什麼。而當ChatGPT出來以後,因為它每天都會和你有交互,它會猜得更準確,更嚴重的是,它還會主動創造出一些讓你喜歡的答案或信息,你聽了會覺得那就是真實的,而且又沒有reference。

到那時,我們要面對的信息繭房會比推薦引擎時代大得多,每個人可能只聽到自己想聽到的,只理解自己能理解的,我不知道這會對人類產生什麼影響,但這個影響一定是世界範圍的。