希爾伯特旅館裡,住着AI的某種真相
"無窮"和"無窮+1",哪個更大?
已經吸收了不知道多少數據的AI模型,和比他多學習一條數據的模型,哪個更智能?
想聊聊這個問題,出於一個偶然的機會。很早之前我在測試ChatGPT的時候,突然想問他個刁鑽問題,於是就問它:「希爾伯特旅館悖論,對現實世界有什麼影響?」
說實話,ChatGPT答的驢唇不對馬嘴,還硬拗出幾點,有他一貫的特色。但其中一段回答值得琢磨。他答:「希爾伯特旅館對於計算機科學是有幫助的,因為當我們處理無限大的數據集時,希爾伯特旅館可以作為我們思考方式。」
無限大的數據集,這東西顯然不存在。但當大模型訓練用的數據參數達到某種天文數字,當真人反饋機製成為常態,模型在使用過程中會接觸難以估量的數據。這難道不是某種無限嗎?
但人類能控制無限嗎?
今天這個話題,其實更接近某種科幻討論,或者一些關於AI未來的腦洞。可能大家讀完之後也不清楚在說什麼。但也無妨,我們就當一起舒展一下大腦,放鬆一下最近被ChatGPT弄得挺焦躁的心情。
一起去希爾伯特旅館,度個假吧。
*歡迎來到,悖論旅館
這家旅館坐落在名叫「數學」的熱帶風情度假勝地,有的人來了不想走,有的人一想到它就口乾舌燥。
希爾伯特旅館,其實是德國數學家大衛·希爾伯特在討論無窮這個概念時,舉的一個生動例子。它既是一個數學遊戲,也經常躋身知名的若干悖論之一。
它的具體意思是說,假設一家旅館有無窮個房間,但是都住滿了。這時候又來了一位旅客要訂房間,酒店主人就可以不慌不忙,讓1號房間客人移到2號,2好移3號……以此類推,反正房間數量是無窮的,這樣新的旅客就可以住1號房間。
而這時,又來了一車旅客。酒店主人依舊如法炮製,讓每個房間的客人都向後移動N個房間,最終把新來的客人安置進去。
以此類推,接下來會發生什麼呢?假如新來了無窮個客人。那麼酒店老闆只需要讓每位客人都移到單號房間。比如2號房間移到3號房間,3號房間移到5號房間,把偶數房間都空出來,那麼無窮個客人依舊可以住進去。
即使來了無窮多個旅行團,每個旅行團有無窮多位旅客,希爾伯特酒店依舊有辦法,只需要把非2n(n∈N+)號房間就都空出來就行了。
希爾伯特旅館之所以是個悖論,因為它標明了這樣一件事:無窮是無法比較的。
無窮+1等於無窮;無窮+N等於無窮,無窮加無窮,無窮乘無窮,那還是無窮,無窮是紋絲不動的,又是隨時變化的,無窮是可以包含若干個無窮的。
總之,無窮是難以名狀的。
*無窮這玩意,會有點怪
聽上去,希爾伯特旅館悖論好像沒啥用。其實不然,人類在很多領域幾乎都必然面對「無窮」這個問題,至少在理論推導和概念驗證環節,面對無窮幾乎是必然的。一個事物可以比另一個更無窮,但它們倆都還是無窮。這樣的思路可以進行很多假設,也可以解釋很多問題。
比如說,在物理學當中,希爾伯特旅館悖論可以來解釋量子物理學中的很多現象,其中最典型的就是量子場論中關於虛粒子的假設。關於虛粒子是否真實存在,抑或是一種純粹的假設工具,這個問題有着非常多的爭論,但它確實可以用來解釋引力、光子、膠子等物理定義,進而為解釋真空中的能量情況,分析宇宙輻射做出幫助。前提在於,我們需要用希爾伯特旅館的思維,來理解存在於無窮中的虛粒子。
在計算機科學中,數據存儲是個基本問題,而在設計數據結構的時候,就需要考慮如果有海量數據需要存儲,結構上究竟如何調動能夠保證效率最優,故障率最低。這時就需要假定數據集是無窮的,希爾伯特旅館也就用上了。
無窮很怪,這個概念還經常被用在文學創作,尤其是科幻小說當中。科幻是對未來的推演,但如果某件事可以增長到無窮,它往往會出現反常識的狀態。比如說永生不死的人,它可能首先就會失去對時間的概念,因為無窮的時間已經沒有意義了,進而表現出完全失去人類的一切特徵,畢竟人類的所思所為,都是在時間有限這個前提下驅動的。又比如瞬間移動,它會不會讓空間失去意義,進而讓人失去辨別空間的需求和能力,進而出現從來不想停留下來的人,而始終都在超高速移動的人,究竟還是人嗎?
一件事如果逼近甚至抵達無窮,它就會超出控制,出現反常識,反邏輯的一面。這個邏輯,對於AI似乎也適用。
*用這個邏輯,解釋智能湧現
這幾年伴隨着預訓練大模型的興起,越來越多的人開始談「智能湧現」。一般來說,所謂「智能湧現」現象,是指當模型規模突破某個未知的界限後,就會突然湧現出驚人的智能。比如模型會表達出訓練者預想不到的邏輯感、流暢性,甚至是人類稱之為情商的東西。
事實上,智能湧現作為一個目標,並不是今天才有。早在上世紀70年代,專家機器人的理論構想就是在輸入足夠多的知識後,讓計算機展現出一種無所不知,無所不曉的效果,從而幫助人類解決各種問題。只是礙於當時的算力與數據承載能力,最終這個設想無法落地。
而在今天雲計算+大數據的組合下,更大規模的數據集可以應用到AI訓練中,加上深度學習在算法上實現了更好的數據吸納能力,才最終產出了ChatGPT為代表的智能湧現現象。
智能湧現到底是怎麼實現的,這一點就像深度學習的黑箱性一樣,始終沒有特別合理的解釋。但「智能湧現」這個詞卻不是AI專有的,這個詞更早是一個生物學詞彙,是用來描述螞蟻、魚群表現出的集體智能行為。一隻螞蟻挺傻的,一條魚也不聰明,但當大量螞蟻聚集到一起,所表現出的那種分工明確、體系森嚴、結構精巧的組織行動方式,簡直讓人嘆為觀止。是螞蟻的大腦進化了嗎?恐怕並不是,而是在螞蟻聚集到一定規模後,突破了某種希爾伯特旅館式的智能邊界。
從這個角度看,大模型這條AI之路,或許終極目標並不是模仿人類。它不需要進化出直覺、情感、自由意識這些人類獨有的東西。但它會積累無窮多的數據和知識,當我們無法觀測和預估大模型里擁有多少知識,那麼它就有無窮的知識。AI模型就變成了一座類希爾伯特旅館,它可以吞噬更多知識,吞噬更多無窮,最終可以表現出人類想要的智能,也可能表現出更多人類不想要,或者沒準備好想要的東西。
或許我們改換個思路,最終的通用人工智能AGI、強人工智能Strong AI,可能內在機制並不類似於人類,而是更近乎螞蟻,近乎魚群,近乎希爾伯特旅館。
我們總是討論AI像不像人,能不能做人類所做的,人類有哪些獨有能力,巴拉巴拉巴拉。這是因為我們不住在希爾伯特旅館裡,我們住在一個有限的世界,住在短暫的生命和易朽的軀殼裡,住在一個絕大部分構成物是水的大腦里。但AI不是,它相比人類更加貼近無窮。他能通過圖靈測試,他最終能做到一切。但我們並不知道為什麼,因為AI並不想成為人,他只是剛好住在希爾伯特旅館裡。
「智能湧現」或許是個徵兆,它告訴我們,AI的進化目標不是人類,而是《星際爭霸》裡的蟲族。-(文:腦極體/鈦媒體)