AI的進展不是太快,而是太慢
從Altman辭職引發了出了Q*算法,然後好像引申出了一個結論:強人工智能要來了,但現實可能正相反,人工智能確實是有進展,也有巨大的潛力和顛覆性力量,但整體上的進展不是太快,而是太慢。
圖靈測試2.0:抛棄它但又要回到它
1950年的圖靈測試說的是當一個人同不能看見的人與機器進行問答,又不能區分那個是人那個是機器的時候,那麽機器就算通過了圖靈測試。
現在在某些場景裏,大模型確實可以通過圖靈測試,所以這版的圖靈測試是一個過期的測試方式,意義不大了。
但圖靈測試的基礎內核是有價值的。它圈定一個場景,讓人工智能完成它,通過外部對此能否感知來判斷智能是不是足夠這點並未過時,實際上是變的更加關鍵。
對圖靈測試進行擴展的話,我們可以在經濟活動中圈定一個職位或者場景,然後考察人工智能是否可以完成它,同時體驗服務的一方並不知道這是人提供的服務還是機器提供的服務。如果人工智能可以做到了,那就是通過圖靈測試2.0,否則就不是。
爲什麽這是有意義的呢?
因爲初代圖靈測試更像是測驗一個活在虛擬空間的智能體,它不需要區分真實還是虛假,只要確保邏輯自洽,那就可以達成通過測試的目標,在這個過程中胡說八道是沒關系的。這是一個技術視角。
有個沒場面但其實很經典的科幻電影叫《這個男人來自地球》,電影裏面一個男人聲稱他是一個活了一萬四千年的穴居人,他見證了人類的曆史和文明的變遷,甚至與佛陀和耶稣有過交流。和他在一個屋子裏的各位科學家嘗試用邏輯去驗證他是不是扯淡,但結果發現純粹的坐在屋子裏,這事是整不出真假的。在屋子裏淩空來說,只要人知識足夠豐富,並且能保證邏輯自洽,你根本沒法分辨。而走出屋子立刻就不一樣了,其它的事實、反饋可以迅速的判斷真假。
類似的,人工智能是否真的智能是學術、技術問題,也是個商業問題,所以它必然要走出來禁受更大場景的考驗,不能是一個只能唠嗑的語言模型。這時候就很有必要按同樣的思路,回到圖靈測試智能對比的內核,對它進行一下升級。
《AI能賺到錢了麽?》中展開過這個問題,管它叫全場景覆蓋法,隨著人工智能關注度的提高,似乎越來越需要強調這個視角。因爲我們整個文明就是基于智能構建的,所以看人工智能總是可以有無數多個視角,比如:一種是無錨點的幻想,這就什麽都能幹,類似一個想象中的超人,寫小說用的上;一種是純粹技術的視角,這種就大喜大悲,要麽就是覺得這東西怎麽可能有用(別看現在很火,其實過去十年AI的研究者大多是悲觀態度),要麽就是每天看到各種進展,覺得世界要被威脅了。
無錨點和尺度就很容易這麽忽左忽右,但恰恰尺度本身才是本質。
爲什麽說人工智能進展其實是慢的
如果在技術圈子裏面自己和自己比,其實進步還是很大的,不管是過去的識別率還是這次的內容生成,大模型都有了相當的進步,但如果換到上面說的圖靈測試2.0的視角,你就會發現即使到今天,還是通過不了。很像一條無限接近的曲線,但就是沒有突破。
可以拿企業內的分工進一步舉列子,企業的典型崗位是:
職能:HR、財務、IT、行政、知識産權
産研:産品、研發、供應鏈、測試、運維
業務:市場、銷售、售前、售後
每個崗位會橫縱進一步細分,縱是指層級也就是我們常說的彙報路線,橫是指前端、後端、APP這類職責切分。
一個100~200人的産品公司裏面差不多要有各種類似的崗位,這時候我們回到圖靈測試2.0的視角,哪部分現在的人工智能可以通過呢?
恐怕都通過不了,即使是進展最大的編程。
編程的時候現在的人工智能完成不了需求模型向開發模型的映射,(現在確實可以讓1個人幹2人的活),也就是說還是需要有人抽象出需求模型,把它變成prompt;其次是一旦出問題,修正就挑戰更大,因爲這時候必須有整個程序的整體性認識,對此的認識則大概率是不准的,這就導致改老的程序反倒是更吃力,需要一個有整體性認識的人進行協助,否則就改不對。
所以說基于大模型的人工智能通過不了圖靈測試2.0,通過不了商業價值的實現就有問題(通過了不一定沒問題)
所以結合場景視角,我們可以說雖然忙活了10幾年,但進展遠沒有想的那麽快。現在OpenAI差不多調集了可能調集的所有資金來對此進行沖刺,我們應該真的希望他們能沖過去,而不是反過來。
能不能通過正是兩種局面:通過不了就像水庫一樣偶爾當供水池用用,通過了蓄積的勢能就奔湧而下。
這類行業重構第一步更可能是一種大折疊,內卷到極致的折疊,然後才是新生。
大折疊
突然說折疊可能不好理解,我們拿過去的電商舉個例子:
電商肯定磕掉了傳統百貨,並且激發了外賣、直播帶貨等一系列新行業。但首先是折疊掉傳統百貨,後面才逐漸有現在大家集體帶貨的局面。
人工智能如果通過圖靈測試2.0,那會和這個類似,比如如果日常文案寫作全是人工智能,那在API上能創造的商業價值估計只有原來的幾千分之一,但會讓這個職位徹底走入曆史,此後才能創造新的角色和職位。
在這個折疊的過程中其實蘊含著第二重挑戰:可以折疊掉很多現有職位,但自己未必能成爲一個良性的模式,並且持續發展。(如果真停在這兒就損人不利己的意思)
在Altman被逼走的短暫日子裏順道出了一條消息:每一次對OpenAI的調用都會導致虧損。也就是說OpenAI是在一種脆弱平衡下在運作,具體來說就是:全球的注意力吸引海量資本的模式,這中注意力和興奮點的走勢從反面解讀其實和龐氏騙局是一樣的(不是說AI是騙局,而是這種模式的特征很類似,包括數字貨幣)。這種趨勢下,關鍵的關鍵就是最後能不能兌現出真正的商業價值,然後才可能拉動下一個循環。所有的龐氏騙局不是中間沒收益而是最終交待不上,預期值徹底踏空,然後迅速跌的什麽也不是,並崩盤。
從這個角度看,AI要想構建良性循環:第一步需要通過圖靈測試,第二步需要激發新的正反饋模式。然後才是2000年的互聯網,AI原生應用的崛起,否則就都是前奏。從這個角度,就會覺得在這個時間點認爲AI發展太快是滑稽的。
當然,這不單是是OpenAI幾個公司的問題,還牽涉到這次大量的創業項目。
扮演引擎角色的通用大模型如果過不了圖靈測試2.0,那基于它的各種嘗試結果就沒那麽美妙。
潛在受害者
近來無意間看到了很多這一波很多創業項目的介紹,看完的感覺就是:如果最終大模型的智能峰值過不了圖靈測試2.0,那這些項目都會慢慢死去,像乾涸的湖泊裏的魚一樣。
這類事沒法舉具體項目來點評,我們淩空說一個作爲例子,比如:我可能發現,一個企業用多種平台,反複對齊數據特別費人工,然後可以用RPA結合模型做出改善。這有沒有價值呢?有價值,但如果智能比例不夠,那創造的價值就不夠它自己消耗的,商業上不成立。
再比如我發現家裏很多活,人不願意幹家務,那有個機器人的話有沒有價值呢?有價值,但智能不夠,就幹不出真正有用的産品。
順道說句,周末我去某活動見幾個老朋友,就看到了幾個活動中用的機器人,這簡直把我看的欲哭無淚。這類所謂的具身機器人和十幾年前根本沒有本質進展,還是一個底盤加個PAD,真有進展的還真是智能音箱中花很多時間打磨的部分,即使很嘈雜語音識別的准確率也還是可以了。
和上面類似的項目還很多很多,包括供應鏈上爲AI企業提供彈藥做芯片做數據的,每個人都想成爲英偉達,但如果通過不了圖靈測試2.0,也許會再有一家,但不會有再多了。
如果智能的峰值不能進一步拉高,那這些産品就都會卡在某條線下,該花的錢一點也少不了,但就是不創造新價值。
從這個角度就更容易看到AI發展不是太快,而是太慢的真實含義。誰有多長的血條,一共又有多長的血條呢!
一點點形而上
現有經濟體系裏人其實是大號的工具,扮演這個角色的時間擠占比如家庭、生活上的時間。只有極少一部分人可以在這種工具角色中獲得樂趣,絕大部分人不是,但都需要工作,這就是之前說的異化,和摩登時代比是程度的差異。
而人、工具、組織模式構成了一種能力上限,隨著對上限的追求越來越高,在裏面的人腳下的傳送帶就轉的越快,表現爲就是某些人越來越忙。
而當人們一考慮會失去這樣一個自己不喜歡的角色時,反倒是會更惶恐,因爲有一種經濟臍帶被切斷的感覺。
這就是最有意思的地方,怎麽才能在失去了不喜歡的東西後獲得喜悅?
人工智能是文明要素中的一種,提供了重構過往社會結構的力量,但也不是全部,基于它的進展,我們也許可以更低成本的解決現在那些根本解決不了的問題,比如:貧窮與饑餓,它會提高整個社會的自由度,讓人更有解決問題的空間,重新進行一種更高級的綜合。
在這點上我同意凱文凱利的觀點:科技總是即帶來好的也帶來壞的,但總是好的多一點點。它至少增大了可能的空間。
從這個角度看,人工智能的發展也是慢的。
小結 : 在人工智能上,技術、社會性的想象、商業的判斷現在堆積到了一起,所以經常出各種各樣的觀點,但在當前階段對人工智能做純技術解讀或者做純粹的社會性解讀意義未必很大,只有從商業角度才能更清楚的看到它這種瀕臨死亡和勃勃生機相疊加的矛盾態,所以回到圖靈測試2.0應該是有意義的。-(文 : 李智勇/鈦媒體)