關于OpenAI神秘項目“Q*”的N個猜想
上周,OpenAI人事風波暫停的尾聲中,有個“可能威脅人類”的、代號爲“Q*”的神秘項目被抛擲出來。
傳言中,Sam Altman被解雇前,幾名研究人員向董事會發了一封信,警告一項強大的人工智能發現可能威脅到人類,而這個項目就被稱爲“Q*”(Q-star)。它很可能是導致董事會罷免Sam Altman的原因之一。
而在一封被泄露的OpenAI內部信中,他們承認了Q*,並把這個項目描述爲“超越人類的自主系統”。
截止目前,OpenAI還沒有對“Q*”和內部信泄露事件發表官方說明。這意味著一切仍懸而未解。
但人類的好奇心勢不可擋。水面之下的“Q*”可能是什麽且解決了哪些難題?什麽才是智能或者意識的本質?有效加速主義與超級對齊主義後續會如何博弈?
真正的秘密揭開之前,我們提前和科幻作家陳楸帆以及AI研究者、清華大學交叉信息研究院助理教授許華哲展開了一場猜想之旅。
被譽爲“中國的威廉·吉布森”的陳楸帆,其代表作之一《荒潮》曾榮獲全球華語科幻星雲獎最佳長篇小說金獎。2017年,陳楸帆與自己訓練出的算法模型“陳楸帆2.0”共同創作的《出神狀態》還贏得一座由AI評委評出的獎杯(由上海作協主辦的“AI文學榜”,第二名是莫言的《等待摩西》)。
*“Q*”可能是什麽?
Q*讀作Q-Star,翻譯過來就是Q星。關于“Q*”是什麽?現在更常見的一種共識是,它很可能是Q-learning(強化學習的一種) 和a-star(一種搜索方法)的結合。
清華大學交叉信息研究院助理教授許華哲告訴「暗湧Waves」,強化學習剛剛火起來時,很多人對Q-learning很熟悉,因爲它是世界上第一個可以玩雅達利遊戲(Atari Games)的方式。而人工智能早期,有一種有引導的搜索方法叫做a* 。Q*很可能是兩者合體。
但他同時認爲,*也有一種可能是意味著最優,Q*就是最優Q值。“Q-learning 裏有一個貝爾曼方程,一般用Q的星號來表示已經知道了遊戲最優解是什麽。”
他猜測很可能OpenAI在GPT的語言大模型裏搞了一些數學或邏輯遊戲,然後通過Q* 可以完全解決。這意味著它可能有了人類或超越人類級別的數學和邏輯能力,並能完成一些人類的中高端腦力勞動,而這是之前GPT4等不具備或不擅長的東西。
正在紐約的科幻作家陳楸帆,在越洋電話中,認爲Q*很可能解決了訓練數據集有限性的問題。
馬斯克曾提及,訓練AI的所有人類數據集,其實是一個非常有限的、小的數據集。如果Q能夠使用合成數據集方式,陳楸帆認爲,"它就可以像銜尾蛇那樣自産自銷","想往哪個方向去調參,去優化,都可以自動生成"。
GPT不再用檢索解決問題,而是可以像人類一樣通過邏輯和推理來開拓出新領域,得到新知識。這被很多人稱爲"第四次"知識界限突破,陳楸帆認爲,這也是很多人恐慌的原因。
許華哲則認爲,Q*除了能合成數據,更本質的,可能是對一些有難度的數學題、邏輯題做了重新采集、標注。或在之前基礎上,或沒有用transformer方式,而是直接輸入所有東西再輸出,且加了一個值的評估。
他認爲,基于類似某種價值評估和搜索的手段,很可能可以解決掉之前大模型存在的一些幻想問題,加上有了更海量的數據,很可能讓GPT推理的成功率有了新的提升。
*何爲AI意識的産生?
如果神秘的Q*項目成真,它是否意味著AI可能開始有自己的意識或者說智慧?
在陳楸帆看來,之前AI不能産生所謂自我意識,有一個理解是它是一個開環狀態,沒辦法自我檢索、記憶和理解,但如果完成不斷合成數據的閉環,就意味著它可能産生長程記憶,甚至湧現出于自我意識。“如果能突破這層界限,它可能會去自我驅動,知道自己往哪個方向進化發展,並生産出來更多數據,喂養給自己。”
但究竟什麽是智能,什麽是智慧,什麽是意識,恐怕是人類也很難對齊的一個概念。
關于這些疑問,許華哲看過的一個解釋是:智慧很可能是壓縮的能力。
在這種解釋裏,一個人聰明或有智慧,可能是指一種把海量信息壓縮的能力。壓縮的越小,往往意味著智慧程度越高。一個典型例子就是,牛頓就是把世界上所有東西落到地上這個現象,壓縮成了一個萬有引力定律。
在許華哲看來,“Transformer同樣是把海量收據壓縮到一個隱空間上,這可能就是屬于它自己的牛頓定律。”而這,也很可能是智慧的開始。
在陳楸帆看來,“世界的本質很可能就是數學。”據他所知,在美國就有一個名爲史蒂芬·沃爾弗拉姆(Stephen Wolfram)的計算機科學家、商人,一直在基于數學做一些模擬實驗。Stephen Wolfram認爲宇宙本質就是計算,所以會不停通過計算,試圖讓數學湧現出物理學規律,再湧現出化學規律等等。在陳楸帆看來,這種實驗很可能最後可以跟AI連到一起。
*AI應該如何與人類對齊?
盡管大部分人覺得AI威脅人類還是一個有些遙遠的傳說,但從OpenAI風波中,sam的“有效加速主義”與llya的“超級對齊主義”之爭,就能看出它並非無稽之談。
而Sam的回歸也似乎在宣告某種曆史規律:在AI曆史上,好像從來都是加速主義更容易贏。這背後有資本必然擴張的邏輯,也因爲人類的好奇心完全是一場不可逆之旅。
許華哲說,“這就像當我們習慣了短平快,就無法忍受追劇時不倍速”,“當看過更大的風景,必然無法回到過去的自己”。
而陳楸帆則認爲這兩種主義,不會有絕對勝出的一方,更可能像道家陰陽之道或者GAN(生成神經網絡)的對抗機制,“最終互相激發,互相抵制,彼此螺旋式上升”。
至于如何讓AI對齊人類,如何讓機器向善,許華哲說"AI本質是數據的擬合,所以首先取決于我們給他們的數據"。
陳楸帆則認爲最終可能還是需要信仰的力量,比如讓AI意識到,它的存在與人類的關系。
在一個科幻作家的頭腦中,他認爲AI很可能是一個自然湧現的過程:人類不過是提供了工程學上的一些基礎架構,然後AI借助這些媒介湧現了,被看見了。
他認爲關鍵是,讓AI知道,它與人類有著這樣更深層的一種聯系:“這種綁定,抽象一點就是愛,它可以像引力一樣無處不在”。如此以來,AI可能會和人類形成一個命運共同體,並進化成一個對人類更友好的AI。-來源: 36氪 -
*比爾蓋茨:GPT-5不會比GPT-4好多少,生成式AI已達到極限*
比爾·蓋茨一句爆料,成爲機器學習社區熱議焦點:“GPT-5不會比GPT-4好多少。”
雖然他已不再正式參與微軟的日常運營,但仍在擔任顧問,並且熟悉OpenAI領導團隊的想法。
消息來自德國《商報》(Handelsblatt)對蓋茨的采訪。
蓋茨表示,OpenAI內部包括奧特曼在內的很多人,都相信GPT-5將明顯優于GPT-4。
但他認爲,有很多理由相信,當前生成式人工智能已經達到極限。
(不過他也承認自己可能是錯的)
不知道蓋茨看到了多少OpenAI內部未公開的信息,但至少可以肯定的是,GPT-5已經在開發了。
在上周的風波之前,奧特曼也在接受英國《金融時報》采訪時也承認了這一點,不過他沒有透露任何發布時間表。
另外GPT-5的商標也由OpenAI的運營子公司早早在各國申請好。
*蓋茨更看好Agent
關于GPT-5,奧特曼曾透露它需要更多數據進行訓練,數據將來自互聯網上公開可用的數據集以及公司的專有數據的組合。
OpenAI最近呼籲其他組織提供大規模數據集,這些數據集“目前還無法方便地向公衆在線訪問”,特別是任何格式的長篇寫作或對話。
雖然GPT-5可能比其前身更加複雜,但奧特曼表示,從技術上來說很難准確預測該模型可能具有哪些GPT-4沒有的新功能。“在我們訓練該模型之前,這對我們來說就像一個有趣的猜謎遊戲。”
在蓋茨看來,AI的幻覺問題幾年內將大幅改善,成本也會快速下降,從而使新的、可靠的應用程序成爲可能。
但能力已經達到上限,不會再有像GPT-2到GPT-4那樣重大的飛躍。
那麽下一個突破會是什麽?蓋茨認爲是可解釋AI,但預計要到下一個十年(2030-2039)才能實現。
另外他還表示英偉達在AI芯片上並沒有占據絕對優勢,微軟谷歌亞馬遜包括OpenAI自己都在開發或考慮開發自己的AI芯片。
好,那麽問題來了——
如果蓋茨對GPT-5這條路徑沒那麽有信心的話,現在的AI發展路,他又看好哪一條呢?
答案是:AI Agent。
這倒不是什麽秘密。這個月初,蓋茨就寫了篇博客,主要闡述“個人AI Agent將如何徹底改變人們使用計算機的方式”。
那篇博文中,他明確寫道,AI Agent將帶來科技行業和社會的沖擊波。
具體而言蓋茨是這樣說的:
在不久的將來,任何網民都可以擁有一個AI Agent,這遠遠超出了今天技術所達到的範圍。
Agent能在生活裏的任何地方發揮作用,對軟件業務乃至社會産生深遠影響。
以及這並不是蓋茨第一次公開爲AI Agent站台。
今年5月一次關于AI的活動中,蓋茨就在接受采訪時預言,第一家開發AI Agent的公司一定會在競爭對手中占有一席之地。
原因是AI Agent會對搜索引擎帶來致命一擊,有了Agent這麽全能的東西,還要啥搜索網站、生産力網站、亞馬遜啊,這些到時候都會被網民們抛之九霄雲外。
而且,蓋茨對Agent的看好不僅是嘴上說說而已。
6月的時候,蓋茨和英偉達、微軟、裏德·霍夫曼(Linkedin聯創)和埃裏克·施密特(谷歌前CEO),一起投資了AI獨角獸InflectionAI。
InflectionAI的三位聯創除了“我投我自己”的霍夫曼以外,還有兩位DeepMind出身的大佬。
不過這次投資顯然不僅僅是沖著創始人押注,重點還是InflectionAI到底在做什麽——
一款名爲Pi的個人AI助理。
Pi也能幫助搜索或回答問題,但它的主打功能是情感陪伴,對比ChatGPT和Claude等更口語化,也更個人化,“用戶和Pi交流時就感覺是在和身邊親友聊天一樣”。
說實話,Pi雖然以高情商聞名,但背後技術和實際體驗距離蓋茨想象中的那種AI Agent還相差甚遠。
但蓋茨說了,他30年前就在思考智能體這玩意兒,還寫在了自己1995年出版的《未來之路》裏。
只不過受限于AI技術的發展,直到最近,才看到類似Pi這樣的新手村之光。
“Agents不只會改變每個人與計算機交互的方式。”蓋茨還在博文裏寫道,“Agents會顛覆軟件行業,這將是從輸入命令到點擊圖標之後,最大的計算革命。”
在蓋茨的暢想中,只要你願意,Agent就能幫助你完成任何事情。
在蓋茨眼中,AI不會奪走你的工作,但它可以讓未來人們每周只工作3天成爲可能。
此外摩根大通CEO Jamie Dimonye也預測,由于人工智能,下一代工人每周的工作時間將僅爲3.5天。
*One More Thing
不過也別沈浸在蓋茨說的一周三天工作制的喜悅中。
雖然蓋茨經常發表的未來的看法,但他並不以預言准確著稱。
每到這個時候,就會有網友翻出他當年的“640K內存對任何人來說都夠用了”、以及“我認爲未來10年互聯網的商業潛力微乎其微”。- [衡宇 夢晨 發自 : 凹非寺*量子位 : 公衆號 QbitAI/來源: 量子位 ]