01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

對話吳翰清:把全世界AI聯合起來,打敗OpenAI這個壟斷怪獸

2024011917:09


前面坐著吳翰清,這個中國互聯網技術圈裏多少有點傳奇色彩的“黑客”。

不是所有人都會成爲某種互聯網都市傳說的主角,但他卻一個人占了好幾個,什麽單槍匹馬黑掉了阿裏的網絡,什麽在拉斯維加斯坐著大巴車一路走一路黑掉了路旁酒店的Wi-Fi,一個比一個令人驚異。有的他不停否認,有的是他自己隨口講出來的。

現在他離開了成名的阿裏,不過物理距離不遠,他坐在自己在27層的落地窗轉角辦公室和我們聊天,辦公室門上寫著“總裁辦公室”,盡管這是個剛成立幾個月只有十幾個人的公司,不遠處是阿裏雲去年搬離的原總部大樓,他左側的窗外是一片開闊地,各種近幾年建成的奇異造型的辦公樓和等待著變成辦公樓的農田都在腳下,等待著這個辦公室的主人隨時俯瞰他們。

對話開始沒多久,吳翰清進入了他的世界,這是一個叫做kOS的産品構想,和一個叫做半個宇宙的烏托邦。這個辦公室漸漸開始讓我感覺像是某種科幻小說中反抗邪惡統治的盟軍總部。那個對手就是OpenAI。

OpenAI要打造一個怪獸,我要做的是聯合世界上的居民來一起對抗它。他說。


吳翰清

聽起來十分狂妄,但吳翰清已經開始這麽做了。這是一個大計劃。

孫悟空

去年ChatGPT的發布像一場大海嘯的開端,之後全世界都在一波又一波浪花裏蒙眼狂奔,離開工作了很多年的阿裏後,吳翰清也在研究大模型並尋找創業的方向。但最終,與那些快速投入到模型層或應用層的創業者不同,他得出了一個“相反”的結論:

他認爲大模型的確是個強大的技術進步,但今天大部分人對它的用法卻都錯了。

大模型最驚豔之處在于它呈現出來的、目前仍然是誰也解釋不清到底如何産生的推理能力,而過去一年工業界的AI熱潮基本圍繞著如何繼續加強這種能力和如何把這種能力以應用的形式直接落實到真實世界裏。但吳翰清認爲這是工業界被學術界帶偏了。

“今天整個計算機的工業界被學術界給帶歪了。”他說。“學術界一直在追求讓神經網絡具備邏輯推理能力,首先這是一個非常值得追求的科學問題,但是它是一個到今天都沒有答案的問題,也就意味著今天在學界所有做所謂人工智能或者說人工神經網絡的人都是在猜測,都是在猜想,所以沒有誰能夠100%說我的道路一定是正確的,其中典型的代表就是今天的大模型。今天所有在大模型上做工程投入的人和團隊實際上都是在嘗試去讓神經網絡具備邏輯推理能力,這是一個非常值得追求的科學問題,但它一定不是一個重要的應用問題,在今天一定不是。”

他把大語言模型的本質定義爲:“速成幻覺智能”。

“它是速成的,因爲它是用了大量的語料壓縮進去,所以它今天沒有辦法去增長它的知識,每次增長知識必須重新訓練,它沒有辦法通過一種自學習的模式來增長自己本身的知識,這是一個很嚴重的問題,人類不是這樣去學習的。”

也就是說,他認爲靠大模型自己,幻覺問題永遠解決不了,就永遠沒法直接爲産業所用。

吳翰清還用他自己的方式從技術上證實這個判斷:

“我們當時在想一定要解決一個別人都解決不了的問題,然後才能證明這個東西是有必要的。我找到了這個問題,其實非常簡單,簡單到一句話說清楚了,就叫做——《西遊記》裏面孫悟空到底被提到了多少次?”他說。

“當你把這個問題簡單的作爲輸入題給以惡搞AI系統,然後把《西遊記》給它,你希望它能夠自動回答,但你會發現沒有一個能夠回答,包括OpenAI,包括谷歌,這就很有意思了。爲什麽這麽簡單的問題,你大模型不是天天吹牛嘛,那你回答一下?回答不了。”

回答不了的原因是孫悟空在《西遊記》裏壓根就不叫孫悟空。

“《西遊記》裏面的孫悟空叫做大聖,叫做行者,叫做老孫,叫做臭猢狲,他有一系列的別名。另外還有所有的代詞,他的指稱,你我他。哪一個是指的孫悟空,沒有被計算過,所以當我問GPT的時候它就開始胡說八道。OK,所以這是一個非常非常關鍵的問題,但是被所有人所忽視的問題。”

用一個精妙的小刀捅破巨大的罩幕,典型的黑客行事風格。“我用一個問題幹趴下了所有大模型,就是這麽簡單。”他說。

但不能光提出問題難倒別人,你得給出解法。吳翰清思考後的解法也挺簡單——就是不要只想著大模型了。

“從我們角度來看的時候,這個問題的答案就像擺在我面前一樣這麽直白和顯而易見,就是《西遊記》裏面孫悟空被提到多少次這個問題,對于傳統的程序員來說,它壓根不是一個問題。當你用data mining去做完之後,你基本上就是SQL查一下或者用Python去寫成代碼,它自然而然就出來了。”他說。

“對于所有程序員來說,邏輯推理不是一個問題,1+1必然等于2。但是對于所有做神經網絡的人來說,如何讓神經網絡自動的生成1+1等于2這個答案是一個非常非常難的事情。”

至此吳翰清要做的事情也就呼之欲出了,他要構造一個全新的系統,來統一這兩種技術和能力。

“這又變得非常簡單,我要統一神經網絡和高級編程語言。”他說。“或者更加抽象地說,我嘗試用同一個系統來統一掉連接主義和符號主義,讓它兼具神經網絡的泛化能力,同時又能夠保留高級編程語言的邏輯推理能力。”

在這個系統裏,大語言模型不是全知全能的神,它只是吳翰清構建的世界裏的一個零件。

我做的就是一個計算機

這個“零件”就是CPU,一個新的計算體系裏的CPU。

今天世界上最聰明的人們似乎都立刻拜倒了在大模型的石榴裙下,並且大有抛棄一切舊有技術路線全面圍繞大模型重構一切的勢頭。但吳翰清設想的世界裏,大模型是CPU,只是CPU,只是一個更加“優雅”的、代表未來的系統的一部分,甚至是一小部分。

在12月,吳翰清在他關注者衆多的公衆號上發布了一篇3萬字的長文。這篇創業宣言裏,吳翰清把這個系統的架構設計公開了出來。


架構手繪草圖,更清晰的圖在下文。圖片來源:kmind

它包括輸入輸出模塊、控制器、運算器、存儲器和記憶器。

其中,大語言模型是CPU,它的泛化能力首先被用在LUI裏,主要做指令解析,指令解析完之後的流程則由程序員來控制。其次,大模型還被用在運算器裏,與過往特定場景的data mining方式相比,大模型可以省掉很多程序的編寫,省掉訓練很多特定場景數據樣本的過程。

“所以大模型對我們來說,我們把它封裝成爲了一個個指令,可以原子化的去調用。”吳翰清說。“這是爲什麽我們談它像心髒,它像CPU。它雖然不理解用戶最終的意圖,但是它的每一次跳動都是非常重要的,心髒時刻在跳動,但是它真的不理解你到底在想什麽,想什麽是大腦去理解的事情。”

這樣,一個“降服”了大模型的系統完成。吳翰清認爲這個架構很完美。“kOS的實現完全符合計算機的基礎三論:信息論、控制論和系統論的。它是一個非常優雅的結構設計。”吳翰清說。

“對這個系統,我們不要求局部的神經網絡具備精確的邏輯推理能力,同時也不要求高級編程語言在特定場景具備足夠的泛化能力,所以它的全局是兼具這兩種特性的,統一起來是完全符合系統論的設計思想。”吳翰清說。

“同時我們在模擬人的思考過程,控制器還會不斷地跟外界做交互,多輪對話會反問你並不斷做反饋,這就是控制論的思想。整個系統不斷叠代,循環,交互,由此來獲得人和機器共生交互上的一種智能。”

而在信息論方面,吳翰清直接針對的就是大模型的幻覺問題,要解決的就是孫悟空問題。

今天我們無法對大模型做精准的修改,比如要求它在生成內容後,只對其中的某一段做修改,它們往往是直接重新生成一個新的東西。吳翰清認爲這對于工業界就是災難,你必須能精准的控制它,也就是要有足夠高的“AI精度”,在西遊記裏准確找出所有孫悟空背後AI精度的問題。

“我用了三體裏的概念,提出一個數據脫水與浸泡的技術。”吳翰清說。

“數據脫水這個過程是從原始的應用數據裏通過自動化的data mining産出一個結構化的數據,于是就可以非常方便去用高級編程語言進行處理,所有的python,包括關系型數據庫和圖計算都能派上用場,在這個時候我們程序員過去這麽多年所有的技術積累就都有了用武之地。”他說。

“處理完之後還需要把它還原和恢複回去,變成一個重新可以被使用的原始數據,過程我們依然是通過大模型或者是擴散模型來完成,它是多個計算組合在一起的一個過程,我們把它稱之爲元數據浸泡。”

三體小說裏,三體人可以通過脫水和浸泡改變形態,吳翰清形容數據也可以如此完成改造和恢複,從而讓人們能精確地修改或精確統計原始數據中更細粒度的局部,從而可以回答一些更難的問題。

“所以今天我在幹什麽,我就是在做一台新的計算機,個人AI計算機。”


圖片來源:kmind

這台計算機沒有一個固定的硬件軀殼,已有的硬件都可以視爲它的接口。“功能是來自于結構,所以工程師最重要的工作就是把這個結構定義出來之後,讓它具備新的功能 。”吳翰清說。kOS的結構是個計算機的結構——它是一個擴展的馮.諾依曼結構,比馮諾伊曼架構多了一個,所以它是個計算機。

他給它的英文名命名PAIC,P在前,就像PC這個名詞一樣,因爲這是一個對AIC的個人化。

吳翰清拿個人計算機的發展曆史來對比這個AI時代的計算機。

他把個人計算機的發明歸結爲三個關鍵技術基礎:微處理器、圖形界面、高效的編程語言。它們分別實現了讓普通人買得起;讓普通人能看懂、用懂,和一個可編程的通用計算平台。

而對應到個人AI計算機,它的這三個技術基礎也已經成熟,分別是:雲計算帶來的數據和算力的普惠、大模型實現的新型人機交互方式,以及呼之欲出的新型編程範式。

目前三要素缺少的就是編程範式。吳翰清提出了ACT的概念。“其實本質就是算法,就是你所有的指令編排和秩序的執行以及它的結構。只不過,隨著計算機的不同,它的名字不同,PC時期叫軟件,智能手機時期叫APP,PAIC時期我把它定義爲ACT。”

ACT就是PAIC自己的指令集,用來控制各個模塊,它的編寫需要高級編程語言,但調用可以通過自然語言的映射完成,從而讓用戶可以通過自然語言來操控計算機。

“對于大多數普通用戶來說,並不需要對形式化的編程語言望而生畏,因爲我們的目的,首先是爲了給程序員看,說明白我們的工作原理,我們實際上做了一次類似“魔術揭秘”的事情,而像OpenAI和其他做AI Agent的公司,一定不會揭開自己的商業秘密。我們之所以願意這麽做,是因爲我們的目標和他們是不同的,我們做的是一台計算機,而不是Agent,因此我們希望計算機的工作原理和編程語言是廣爲人知的。”

而這也是一個中間態,最終的狀態是高級編程語言成爲AI用的語言,而所有人都可以用自然語言完成編程。

“我們系統處于從“可編程AI”過渡到“AI可編程”的一個中間狀態,現在支持一個高級編程語言可以讓程序員在調試ACT的過程中方便許多。未來我們希望能實現約翰·巴庫斯的夢想:編程應該是人告訴機器“做什麽”,而不是說“怎麽做”。”

不要造亞裏士多德,而要解放雅典人民

從吳翰清的整個思考和設計的過程裏會發現,這個年少成名、總以代表著打破一切的“黑客”身份出現、外形也多少有些潇灑飄逸的吳翰清,卻習慣回頭看,朝計算機曆史要答案。

事實上,在創業前的一年,他幾乎把精力都投入了一件事上:寫書,寫一本大部頭的書。這本直接取名《計算》的書,把人類的各種計算曆史寫了一遍,一直寫到GPT的出現。

“你們以爲GPT的能力很神奇,在我看來,它背後就跟人們對魔術的驚異一樣。”他說。當魔術揭秘後,背後就是計算。“從我們做工程角度來說就是魔術揭秘。當你把幾千字計算壓縮成一次交互過程的時候,你就會覺得很神奇,實際上你可能計算了很多次。”

現在他同樣要變魔術了,只不過他認爲這次的魔術可以展示給所有人,並且更加優雅,更加是人類未來需要的戲法。

在和吳翰清聊天的過程裏,他一直呈現出這種不太一樣的特質——他幾乎是帶著某種夙願迎來了大模型這個技術的爆發,而這個夙願就是掀翻今天互聯網巨頭們對數據的壟斷。

個人計算機真正變得偉大是因爲它們連在了一起,也就是互聯網的出現。但吳翰清認爲,互聯網出現後因爲信息流動方式的問題,導致數據最終聚集在了少數互聯網巨頭的手裏,他們通過廣告這個精妙的商業模式,把財富聚集在自己手裏,壟斷出現。

大模型帶來的技術變革本有望打破這一切,但在他看來,OpenAI的AGI野心最終是讓自己長成一個吸血的怪獸,它會壟斷所有的知識來靠此收費,在壟斷這件事上不僅故態複萌,甚至換了新方法變本加厲上演。

“數據,算力和算法,這三者的價值全是OpenAI拿走的,所以最後它是會讓所有agent公司死掉。”而且最近OpenAI的“宮鬥”鬧劇也讓吳翰清不再對這家公司的價值觀抱有期待。

要改變這一切,需要從數據的權益角度做出徹底的改變,吳翰清認爲現在終于有了可能:

這場變革要發生在PAIC彼此連接成網的過程裏,發生在一個AI互聯網的世界裏。

吳翰清設計了這個理想的AI互聯網的雛形:半個宇宙。



圖片來源:kmind

每個人有一個可以自己給它取名的“星伴”,它由kOS驅動,能跟你對話,也能幫你去尋找半個宇宙網絡裏的信息。此外還有“星魂”,用來保存星伴的個性化知識、經驗、記憶、性格。你還有一個星盤用來存放你的本地數據,這些數據可以用不同的權限來控制,也可以用不同方式提供給你在半個宇宙的網絡裏的好友。而好友關系上,吳翰清認爲將互聯網設計成一個類似于人類社會關系網絡的模型會是一個更加公平的網絡,他認爲事實上微信就是這樣的網絡結構。

于是這看起來像是一個微信+寵物小精靈+網盤的産品,一個吳翰清想象中未來互聯網的雛形。



半個宇宙目前的界面,許多功能在建設中

在這個構想裏,最終這個世界裏在“上網”的AI比人多。它們永遠在線,永遠在服務著每個人類個體。而它們之間的互動是信息找人:當一個人有需求,自己的PAIC發出廣播,不同的AI之間完成信息的交換,吳翰清認爲,這樣就再也不會出現信息的聚集,也就不會有壟斷。

甚至,吳翰清還從一開始就預想了自己違背初心的場景,爲此設計好機制來保證半個宇宙的純淨。

“我們最關鍵的動作是要把推薦算法給開源掉,這個動作還沒執行,因爲我們系統還不成熟,所以到未來某一天會去執行。第二我們會有大量的ACT開源掉,而且會有很多人選擇把他的ACT給開源掉,來豐富整個社區。”吳翰清承諾。

“開源是手段,本質上是要公衆監督。如果某一天半個宇宙選擇把推薦算法給閉源掉,替換了開源算法,我也號召所有用戶來推翻半個宇宙。”最後這句像是來自某種科幻世界的說法。

于是在這個半個宇宙裏,沒有節點能壟斷知識,也就不會出現全知全能的AGI。甚至,把它們連接在一起,也正是爲了對抗那個全知全能的AGI所代表的黑暗未來的路線。

“這就是我們跟OpenAI願景最大不一樣的地方,它希望AGI出來之後統一掉所有東西,今天看到AGI一旦造神運動成功之後,所有人用的東西都叫做ChatGPT,所有人登錄到他那個網站看到的AI都是同一個名字,就是ChatGPT,這是我們不希望看到的未來。”他說。

吳翰清構建起了一個關乎人類未來的敘事,在這家公司還只有16個人,剛成立幾個月的時候。

“所以OpenAI在創造一個AI亞裏士多德或者AI孔子,讓所有人跟這個人對話,而你只想讓雅典的每個人跟曲阜的人每個人都能對話。”我從他描述的世界裏緩過神來,然後問他。

“而你在做的一切,就是從技術理論上推導出來一個烏托邦的存在,然後你要建造他了。”

“對,你說的對。”

他想了下回答。

“我認爲所有的知識不應該被統一成同樣的價值和同樣的態度,而是應該百花齊放,應該同一件事情有不同的觀點,這樣才是一個更加豐富和美好的未來,而且可能也才會是一個更加公平的未來。”---來源: 矽星人-