AI的星星之火必將燎原
如果說過去的文章更多的是基于過去十年産業經驗對未來做的推斷,那12月當産品收入達到某個量級後就相當于是推斷得到了檢驗。這時候想到的反倒不是什麽未來願景,而是主席當年的那句老話:星星之火必將燎原。就好像看到了許許多多的火種,潛藏不太容易看到的層次上,一閃一閃冒著微弱的火光。
我對AI的信心從來沒像這一刻這麽強。這不是激進,和這篇文章要一起看的是:爲什麽說AI現在還不行!看著有點矛盾,但其實是一個事情的正反兩面,統一于尺度判斷。
肯定會迎來一個AI原生應用的浪潮
之前文章更多是從圖靈測試2.0和智能原生到底應該定義成什麽樣子來做解讀,這次我們換個方法,舉一個發生在琢磨事這號對應群裏的具體且真實的例子。很不陽光,但仔細想想卻很有意思。
背景很簡單:琢磨事這號有個讀者群,群並沒什麽特別的商業化目的,純粹聚集了些對AI感興趣的同學日常聊聊天,比如做些文章中觀點和産業趨勢的探討。入群的也都是做這個行業並且對AI有點想法的同學。
然後有趣的事情發生了。
不知道什麽時候群裏混入了一些特別的人。
我個人作爲群主一般大家轉發到群裏的文章等都會看看,時間一長就發現有幾個同學不對勁,他們不定期發文章,可總的頻率很高,每次發的文章標題很火,但內容很稀薄,也很短,內容中間必然帶廣告。除了發文章保持絕對沈默,從不發言。
這群是只要不罵街,誰愛說點啥就說點啥的風格,所以最初我也不怎麽想理會。
可在某個瞬間,我突然意識到這不是真人,肯定都是些機器人。
從這個角度往回解讀,就發現雖然套路有點無賴,但確實是一個很小的AI原生應用。純血的。
我們想象下它後面的結構。
必然有一個聯通真實世界捕捉熱點的感知部分,從中選出對應的選題。
再針對選題自動生成內容。
生成內容的同時用爬蟲爬取對應的群,想辦法加進去(反饋環節)。這時候200人以下的群只要掃二維碼就能加入,所以估計是重點關注對象。
進一步還要標識對應的群的屬性,然後和文章的內容做匹配,再之後才是一定頻率的不定期發送。
這麽個應用,核有三個部分:一部分對大模型進行調度負責掃描和生産內容;一部分是日常任務比如發文的原則,一部分同現實進行接軌等。
對現實進行感知,基于大模型進行內容生産,然後內容反饋回現實的世界,並在浏覽的環節嵌入盈利環節。
典型新式智能原生應用。就是你很難想到會用這麽個形式冒出來。
上面說的結構大概率和之前說的Agent結構80%雷同:
和過去應用對比那裏不同了
從技術角度看,基于過去的技術,不用大模型也不是完全不能做,尤其是對于做爬蟲的兄弟。但過去很難這麽做出錢來。(即使現在我也不知道這玩意能不能賺到錢,很想找到這幫哥們問問數,就當騷擾我好幾天的成本了)
原因特別簡單:當AI不足夠成熟,你其實做不出那麽多訂閱號文章,並且還都匹配實時熱點。
所以說這種應用是真的新類別的應用(當然也可以叫Agent)。它從感知到生産到盈利全場景是閉環的。
從我們經常說的圖靈測試2.0的視角就是:它能夠在一個完整商業場景上閉環,不需要人的介入,並且近似全自動的行動。行動的結果可以創造收入。
一旦這種場景成立,那這種應用就可以拿走對應那個場景下的,智能邊界內的價值。
做上面這類應用的同學,未必會像我這做戰略出身的人,天天琢磨套路,更可能就是覺得這事能幹就幹了。現在還少,但當廣大産品和程序員同學了解到打造這麽個東西成本可能和旅遊一次差不多的時候,估計做的人會越來越多。
可這種敏銳感知不是沒限度的,通常最終還是會貼著套路走(經常說的從特殊到一般,一般再到特殊的過程)。
上面這個例子正好契合了之前提到的套路的關鍵點:
純粹數字空間,幻覺影響不大,通過圖靈測試2.0等。
智能原生應用不是AIGC工具
還是要區分下這類應用和純粹內容生成的工具。
雖然兩者都頂著AI的帽子,但卻有本質性差異。
AIGC工具本質上算法驅動,只有極少數的人在天時地利具備的情況下才可能。商業模式極其難以跑通。
智能原生應用的關鍵則落在應用上,是綜合了技術後的産品力,這種産品力要能打破最後那1毫米的障礙。其實大多數人都能做並跑出現金流。這事我們並不陌生,當年的APP不就這樣麽。
過去是英國人在一戰的時候發明了坦克,但坦克的真正發揚光大其實要等待德國人弄出來閃電戰。
AIGC工具和智能原生應用的差別與此類似。
AIGC工具是坦克,而每個智能原生應用都是一場獨特的戰役。
對于AIGC工具,模型的獨特性是關鍵的,對于智能原生應用,深研模型本身可能反倒是有害,更需要往外看,在技術和場景的結合處定位准。
順道一說,智能原生應用也不是GPTs。
加上GPTs的chatGPT自己其實就是一個超級智能原生應用,覆蓋最爲通用的場景。
這就是智能原生應用所隱喻的廣闊空間
幾乎每個領域都會出現這類更加智能和自動的智能原生應用。
所以現在剛剛露頭的各種嘗試才是星星之火。
並且隨著大模型能力的持續提高,火苗只可能越來越大,而範圍會越來越廣。
會從上面那個極其無聊的場景擴展到各個方面。而當下差不多就是Windows應用的1995,移動互聯網的2007。
真做起來還是很費勁,但能做了。
對于智能原生應用而言第一關鍵的是圖靈測試2.0。
雖然前面提到過幾次這裏還是要再說下,因爲它實在像風筝的那根線一樣,決定了不飄不行、但飄的太遠也不行的尺度。
什麽是智能原生應用和圖靈測試
智能原生應用不飄是不行的,因爲過去就沒有這玩意,不飄,你就想象不出來産品需要定義成什麽樣子。
太飄也不行,太飄有點像本來想開飯店,然後發現路不行,決定先修路然後再開飯店。(大部分做智能原生應用的會很像開飯店的那個,OpenAI這些才是修路的)。
這樣一來就需要一個中間的尺度。
這個尺度決定生死成敗,重要性排第一。
第一決定在特定時間長短事到底行不行,第二決定了礦究竟有多大。
還是前面那例子,那個場景其實能通過圖靈測試2.0,然後礦究竟大不大取決于你內容生成的質量。
我們從應用這個角度重新描述一下圖靈測試2.0。
圖靈測試2.0
原始的圖靈測試這樣:
這是一個純粹的智能測試,本質是追求在封閉系統裏面的邏輯自洽性。
現在我們把Agent類似的概念加入這個測試:
這就是圖靈測試2.0。和1.0相比核心差異是什麽呢?
去幻覺,有邊界。
1.0是一個淩空的系統,具有合理性的幻覺其實有助于通過測試,但2.0不行,測試者同時從真實場景和被測試者接受反饋;其次就是測試邊界的限定要求更高的智能深度,這很像趙括學兵法能說的天花亂墜,但不一定能打仗;會打仗不一定兵法上什麽都懂,但水站、陸戰、馬站好歹得會一個。
還是上面那個例子,這個例子下1.0和2.0共通的部分是生成的內容人要能看,2.0獨有的部分是你生成的內容得是符合基礎事實的,也要有點特色和風格,因爲你的受衆不是就看你,也看別的文章,純胡扯廣告估計點擊率會低。
如果純粹的胡扯被認爲是個人,從技術角度可以算通過1.0測試,但從商業角度則沒那麽有價值,轉化率就差。
自己對自己的實現
能否通過圖靈測試2.0的判斷與AIGC能力其實是絕配。
前者定義了技術在商業場景下的價值,而AIGC能力其實降低了實現它的成本。
從這個角度看技術內定了自己的實現,這種必然性,不管從因果角度還是從偶然的角度解讀都是很有趣的事情。
小結 : 即使方向對,也有能力,真做起來也會萬分痛苦,這會像在無人區裏奔跑。
但這也正是價值所在,當所有的隱性知識都變成顯性知識之後,絕大部分商業價值會消失,會變成一個角力的遊戲,那就無趣的很了。
最後如果覺得上面的文章言不盡意,那麽下面這個組合可以讀讀,這其實說的是一個事的不同側面。我比較確定他們是對,並且在這個早期是有價值的。---來源: 钛媒體-