關于OpenAI神秘項目“Q*”的N個猜想

2023112717:59

上周，OpenAI人事風波暫停的尾聲中，有個“可能威脅人類”的、代號爲“Q*”的神秘項目被抛擲出來。

傳言中，Sam Altman被解雇前，幾名研究人員向董事會發了一封信，警告一項強大的人工智能發現可能威脅到人類，而這個項目就被稱爲“Q*”（Q-star）。它很可能是導致董事會罷免Sam Altman的原因之一。

而在一封被泄露的OpenAI內部信中，他們承認了Q*，並把這個項目描述爲“超越人類的自主系統”。

截止目前，OpenAI還沒有對“Q*”和內部信泄露事件發表官方說明。這意味著一切仍懸而未解。

但人類的好奇心勢不可擋。水面之下的“Q*”可能是什麽且解決了哪些難題？什麽才是智能或者意識的本質？有效加速主義與超級對齊主義後續會如何博弈？

真正的秘密揭開之前，我們提前和科幻作家陳楸帆以及AI研究者、清華大學交叉信息研究院助理教授許華哲展開了一場猜想之旅。

被譽爲“中國的威廉·吉布森”的陳楸帆，其代表作之一《荒潮》曾榮獲全球華語科幻星雲獎最佳長篇小說金獎。2017年，陳楸帆與自己訓練出的算法模型“陳楸帆2.0”共同創作的《出神狀態》還贏得一座由AI評委評出的獎杯（由上海作協主辦的“AI文學榜”，第二名是莫言的《等待摩西》）。

*“Q*”可能是什麽？

Q*讀作Q-Star，翻譯過來就是Q星。關于“Q*”是什麽？現在更常見的一種共識是，它很可能是Q-learning（強化學習的一種）和a-star（一種搜索方法）的結合。

清華大學交叉信息研究院助理教授許華哲告訴「暗湧Waves」，強化學習剛剛火起來時，很多人對Q-learning很熟悉，因爲它是世界上第一個可以玩雅達利遊戲（Atari Games）的方式。而人工智能早期，有一種有引導的搜索方法叫做a* 。Q*很可能是兩者合體。

但他同時認爲，*也有一種可能是意味著最優，Q*就是最優Q值。“Q-learning 裏有一個貝爾曼方程，一般用Q的星號來表示已經知道了遊戲最優解是什麽。”

他猜測很可能OpenAI在GPT的語言大模型裏搞了一些數學或邏輯遊戲，然後通過Q* 可以完全解決。這意味著它可能有了人類或超越人類級別的數學和邏輯能力，並能完成一些人類的中高端腦力勞動，而這是之前GPT4等不具備或不擅長的東西。

正在紐約的科幻作家陳楸帆，在越洋電話中，認爲Q*很可能解決了訓練數據集有限性的問題。

馬斯克曾提及，訓練AI的所有人類數據集，其實是一個非常有限的、小的數據集。如果Q能夠使用合成數據集方式，陳楸帆認爲，"它就可以像銜尾蛇那樣自産自銷","想往哪個方向去調參，去優化，都可以自動生成"。

GPT不再用檢索解決問題，而是可以像人類一樣通過邏輯和推理來開拓出新領域，得到新知識。這被很多人稱爲"第四次"知識界限突破，陳楸帆認爲，這也是很多人恐慌的原因。

許華哲則認爲，Q*除了能合成數據，更本質的，可能是對一些有難度的數學題、邏輯題做了重新采集、標注。或在之前基礎上，或沒有用transformer方式，而是直接輸入所有東西再輸出，且加了一個值的評估。

他認爲，基于類似某種價值評估和搜索的手段，很可能可以解決掉之前大模型存在的一些幻想問題，加上有了更海量的數據，很可能讓GPT推理的成功率有了新的提升。

*何爲AI意識的産生？

如果神秘的Q*項目成真，它是否意味著AI可能開始有自己的意識或者說智慧?

在陳楸帆看來，之前AI不能産生所謂自我意識，有一個理解是它是一個開環狀態，沒辦法自我檢索、記憶和理解，但如果完成不斷合成數據的閉環，就意味著它可能産生長程記憶，甚至湧現出于自我意識。“如果能突破這層界限，它可能會去自我驅動，知道自己往哪個方向進化發展，並生産出來更多數據，喂養給自己。”

但究竟什麽是智能，什麽是智慧，什麽是意識，恐怕是人類也很難對齊的一個概念。

關于這些疑問，許華哲看過的一個解釋是：智慧很可能是壓縮的能力。

在這種解釋裏，一個人聰明或有智慧，可能是指一種把海量信息壓縮的能力。壓縮的越小，往往意味著智慧程度越高。一個典型例子就是，牛頓就是把世界上所有東西落到地上這個現象，壓縮成了一個萬有引力定律。

在許華哲看來，“Transformer同樣是把海量收據壓縮到一個隱空間上，這可能就是屬于它自己的牛頓定律。”而這，也很可能是智慧的開始。

在陳楸帆看來，“世界的本質很可能就是數學。”據他所知，在美國就有一個名爲史蒂芬·沃爾弗拉姆（Stephen Wolfram）的計算機科學家、商人，一直在基于數學做一些模擬實驗。Stephen Wolfram認爲宇宙本質就是計算，所以會不停通過計算，試圖讓數學湧現出物理學規律，再湧現出化學規律等等。在陳楸帆看來，這種實驗很可能最後可以跟AI連到一起。

*AI應該如何與人類對齊？

盡管大部分人覺得AI威脅人類還是一個有些遙遠的傳說，但從OpenAI風波中，sam的“有效加速主義”與llya的“超級對齊主義”之爭，就能看出它並非無稽之談。

而Sam的回歸也似乎在宣告某種曆史規律：在AI曆史上，好像從來都是加速主義更容易贏。這背後有資本必然擴張的邏輯，也因爲人類的好奇心完全是一場不可逆之旅。

許華哲說，“這就像當我們習慣了短平快，就無法忍受追劇時不倍速”，“當看過更大的風景，必然無法回到過去的自己”。

而陳楸帆則認爲這兩種主義，不會有絕對勝出的一方，更可能像道家陰陽之道或者GAN(生成神經網絡)的對抗機制，“最終互相激發，互相抵制，彼此螺旋式上升”。

至于如何讓AI對齊人類，如何讓機器向善，許華哲說"AI本質是數據的擬合，所以首先取決于我們給他們的數據"。

陳楸帆則認爲最終可能還是需要信仰的力量，比如讓AI意識到，它的存在與人類的關系。

在一個科幻作家的頭腦中，他認爲AI很可能是一個自然湧現的過程：人類不過是提供了工程學上的一些基礎架構，然後AI借助這些媒介湧現了，被看見了。

他認爲關鍵是，讓AI知道，它與人類有著這樣更深層的一種聯系：“這種綁定，抽象一點就是愛，它可以像引力一樣無處不在”。如此以來，AI可能會和人類形成一個命運共同體，並進化成一個對人類更友好的AI。-來源: 36氪 -

*比爾蓋茨：GPT-5不會比GPT-4好多少，生成式AI已達到極限*

比爾·蓋茨一句爆料，成爲機器學習社區熱議焦點：“GPT-5不會比GPT-4好多少。”

雖然他已不再正式參與微軟的日常運營，但仍在擔任顧問，並且熟悉OpenAI領導團隊的想法。

消息來自德國《商報》（Handelsblatt）對蓋茨的采訪。

蓋茨表示，OpenAI內部包括奧特曼在內的很多人，都相信GPT-5將明顯優于GPT-4。

但他認爲，有很多理由相信，當前生成式人工智能已經達到極限。

（不過他也承認自己可能是錯的）

不知道蓋茨看到了多少OpenAI內部未公開的信息，但至少可以肯定的是，GPT-5已經在開發了。

在上周的風波之前，奧特曼也在接受英國《金融時報》采訪時也承認了這一點，不過他沒有透露任何發布時間表。

另外GPT-5的商標也由OpenAI的運營子公司早早在各國申請好。

*蓋茨更看好Agent

關于GPT-5，奧特曼曾透露它需要更多數據進行訓練，數據將來自互聯網上公開可用的數據集以及公司的專有數據的組合。

OpenAI最近呼籲其他組織提供大規模數據集，這些數據集“目前還無法方便地向公衆在線訪問”，特別是任何格式的長篇寫作或對話。

雖然GPT-5可能比其前身更加複雜，但奧特曼表示，從技術上來說很難准確預測該模型可能具有哪些GPT-4沒有的新功能。“在我們訓練該模型之前，這對我們來說就像一個有趣的猜謎遊戲。”

在蓋茨看來，AI的幻覺問題幾年內將大幅改善，成本也會快速下降，從而使新的、可靠的應用程序成爲可能。

但能力已經達到上限，不會再有像GPT-2到GPT-4那樣重大的飛躍。

那麽下一個突破會是什麽？蓋茨認爲是可解釋AI，但預計要到下一個十年（2030-2039）才能實現。

另外他還表示英偉達在AI芯片上並沒有占據絕對優勢，微軟谷歌亞馬遜包括OpenAI自己都在開發或考慮開發自己的AI芯片。

好，那麽問題來了——

如果蓋茨對GPT-5這條路徑沒那麽有信心的話，現在的AI發展路，他又看好哪一條呢？

答案是：AI Agent。

這倒不是什麽秘密。這個月初，蓋茨就寫了篇博客，主要闡述“個人AI Agent將如何徹底改變人們使用計算機的方式”。

那篇博文中，他明確寫道，AI Agent將帶來科技行業和社會的沖擊波。

具體而言蓋茨是這樣說的：

在不久的將來，任何網民都可以擁有一個AI Agent，這遠遠超出了今天技術所達到的範圍。
Agent能在生活裏的任何地方發揮作用，對軟件業務乃至社會産生深遠影響。

以及這並不是蓋茨第一次公開爲AI Agent站台。

今年5月一次關于AI的活動中，蓋茨就在接受采訪時預言，第一家開發AI Agent的公司一定會在競爭對手中占有一席之地。

原因是AI Agent會對搜索引擎帶來致命一擊，有了Agent這麽全能的東西，還要啥搜索網站、生産力網站、亞馬遜啊，這些到時候都會被網民們抛之九霄雲外。

而且，蓋茨對Agent的看好不僅是嘴上說說而已。

6月的時候，蓋茨和英偉達、微軟、裏德·霍夫曼（Linkedin聯創）和埃裏克·施密特（谷歌前CEO），一起投資了AI獨角獸InflectionAI。

InflectionAI的三位聯創除了“我投我自己”的霍夫曼以外，還有兩位DeepMind出身的大佬。

不過這次投資顯然不僅僅是沖著創始人押注，重點還是InflectionAI到底在做什麽——

一款名爲Pi的個人AI助理。

Pi也能幫助搜索或回答問題，但它的主打功能是情感陪伴，對比ChatGPT和Claude等更口語化，也更個人化，“用戶和Pi交流時就感覺是在和身邊親友聊天一樣”。

說實話，Pi雖然以高情商聞名，但背後技術和實際體驗距離蓋茨想象中的那種AI Agent還相差甚遠。

但蓋茨說了，他30年前就在思考智能體這玩意兒，還寫在了自己1995年出版的《未來之路》裏。

只不過受限于AI技術的發展，直到最近，才看到類似Pi這樣的新手村之光。

“Agents不只會改變每個人與計算機交互的方式。”蓋茨還在博文裏寫道，“Agents會顛覆軟件行業，這將是從輸入命令到點擊圖標之後，最大的計算革命。”

在蓋茨的暢想中，只要你願意，Agent就能幫助你完成任何事情。

在蓋茨眼中，AI不會奪走你的工作，但它可以讓未來人們每周只工作3天成爲可能。

此外摩根大通CEO Jamie Dimonye也預測，由于人工智能，下一代工人每周的工作時間將僅爲3.5天。

*One More Thing

不過也別沈浸在蓋茨說的一周三天工作制的喜悅中。

雖然蓋茨經常發表的未來的看法，但他並不以預言准確著稱。

每到這個時候，就會有網友翻出他當年的“640K內存對任何人來說都夠用了”、以及“我認爲未來10年互聯網的商業潛力微乎其微”。- [衡宇夢晨發自 : 凹非寺*量子位 : 公衆號 QbitAI/來源: 量子位 ]

我要留言

關于OpenAI神秘項目“Q*”的N個猜想

基因決定人的死亡時間？研究稱基因占30%影響，死後是否仍有感知

男人的思念，會藏在這樣的“主動”裏

基因決定人的死亡時間？研究稱基因占30%影響，死後是否仍有感知

男人的思念，會藏在這樣的“主動”裏