01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

谷歌、微軟包下核電站 “囤電”,AI技術之外的困境被低估了

2024101817:08

AI的發展給人們描繪了科技進步帶來的“詩和遠方”,但這背後卻有著巨大的能源、資源、勞動力消耗,這是AI發展的沈重現實。

此外,AI作爲一種新型“巨機器”對人和社會的影響也被低估了。

01,  谷歌在本周一表示,與 Kairos Power 公司簽署一份從多個小型模塊化反應堆購買電力的協議,以滿足發展人工智能的用電需求。

谷歌計劃買六到七個小型模塊化反應堆的電力,總計500兆瓦,首個小型模塊化反應堆在2030年之前投入使用。

而在上個月月底,微軟和星座能源公司簽署了一份爲期20年的電力采購協議,計劃重啓曾因嚴重核事故而關閉的美國三哩島核電站。

1979年3月28日,三哩島壓水堆核電站的二號反應堆由于冷卻系統失靈,造成62噸的堆芯熔毀事故,這是人類核能發展史上發生的第一起堆芯熔毀事件。

國際上把核電站事故分爲7級,切爾諾貝利和福島的核事故是唯二的兩件7級事故,而三哩島核泄露處于第5級。

星座能源在1999年買下了一號反應堆,就在發生事故的二號反應堆旁邊,後來因爲經濟效益不好在2019年關閉了。

跟微軟簽協議後,星座能源將投入16億美元對一號反應堆進行翻新,預計到2028年才開始重新發電,時間表受到監管批准的影響。

谷歌、微軟搬出來核電站,一下子囤這麽多電,主要將用來驅動AI數據中心。而且不只這兩家,其他在AI領域布局的科技大佬都在這麽幹。

今年3月,亞馬遜從塔倫能源公司購買了一個自帶核電供應的數據中心園區;甲骨文最近也表示,正在設計1處由3個小型核反應堆供電的數據中心。

科技巨頭之所以搞得這麽大,是因爲AI恐怖的耗電量。

AI究竟有多耗電?

斯坦福人工智能研究所發布的《2023年人工智能指數報告》顯示,OpenAI的GPT-3單次訓練耗電量高達128.7萬度,相當于3000輛特斯拉Model Y跑滿32萬公裏的耗電量。這也是120個美國家庭1年的用電量。

這還只是訓練用的電,相比後面不斷使用的環節只是小頭。

在使用環節,AI每次作出回應也要大量耗電。像ChatGPT有2億多用戶,每天響應這些需求就要耗50萬度電。

大模型的參數量越大,需要處理的數據就越多,所需要的計算量就越大,而算力背後是大量的服務器、存儲設備和網絡設備,它們日夜不停地工作,消耗大量電能。

曾有業內人士表示,國內一線大模型的運營成本中,電費占到了總成本的50%以上。

國際能源署今年發布的報告中預測,未來三年全球對數據中心、加密貨幣和人工智能的電力需求將增加一倍以上,相當于一個德國的全部電力需求。

“我在一年多前就預測過芯片短缺,下一個短缺的將是電力。我認爲明年將沒有足夠的電力來運行所有的芯片。”前段時間馬斯克發出了這樣的預警。

OpenAI首席執行官山姆·奧特曼也表示,人工智能將消耗比人們預期更多的電力。

如果說算力是大模型的底層支撐,那電力就是算力的底層支持。能否獲得更清潔、穩定的能源,以及AI設備能否做到效率更高、更省電,影響著AI發展的可持續性。

02,  除了耗電,AI對資源也有著大量消耗。

比如對水資源的消耗。AI芯片制造過程中涉及大量的清洗和化學處理步驟,生産一個智能手機芯片就需要大約消耗5噸多的水。而AI超算數據中心也需要大量水來散熱,研究發現,單是使用GPT-4生成100字文本就需要消耗多達三瓶水。

有調研估算,到2027年,全球範圍內的AI需求可能需要消耗掉66億立方米的水資源,相當于杭州西湖水量的450多倍。

還有礦産資源,任何高科技的起點都是能源和礦産。

從網絡路由器到電池再到數據中心,AI系統擴展網絡中的每一部分都需要礦産資源。

現代生活的很多方面都被轉移到了“雲端”,但人們很少考慮這些原材料的成本。我們的工作、生活、閑暇娛樂大部分都發生在網絡計算架構的世界,而由雲計算聯通的我們拿在手中的設備,其內核爲锂。

可充電锂離子電池是移動設備、筆記本電腦、家用數字助理和數據中心備用電源的必需品。它們支持著互聯網和互聯網上運行的幾乎所有商業平台。

除此之外,還有很多不可再生的礦物質參與到了AI和其他高科技發展中,包括用于iPhone揚聲器和電動汽車電機的稀土元素镝和钕,用于士兵的紅外軍事設備和無人機的鍺,可以提高锂離子電池性能的钴。

參與世界科技競爭的國家都會根據自身工業要求和對供應風險的戰略評估,制定自己的關鍵礦物清單。



中國、美國、歐盟戰略性關鍵礦産(圖源:國際合作中心網站)

锂、鍺、钴、稀土、石墨等都位列其中,是發展新能源汽車、人工智能、雲計算、光伏、信息通信等高科技不可或缺的。

像稀土,裏面包含17種金屬元素,16種被用在了智能手機裏,這些元素可以在彩色顯示屏、揚聲器、相機鏡頭、可充電電池、硬盤驅動器和其他許多組件中找到。

如果無法保證這些礦物的供應,包括AI在內的科技行業都將陷入停滯。這是技術發展最重要的約束條件。

很多礦産都分布于世界上比較偏僻或者經濟不發達地區,像玻利維亞西南部的烏尤尼鹽沼、剛果中部、蒙古國、印度尼西亞。而采礦曆來都是一件極易引發地緣政治沖突和戰爭的事情。

但包括AI在內的高科技發展給我們帶來了“詩與遠方”,很容易讓我們忽略構成技術“肉身”的這些原材料,背後的稀缺,以及由此帶來的沖突、饑餓和貧窮。

正如“锂電池之父”古迪納夫所擔憂的那樣:“锂的重要性不亞于石油等戰略性資源,一旦開采出現瓶頸,可能會跟石油一樣成爲戰爭的導火索。”

這樣看來,高科技幾乎也可以看作是一種資源密集型的提取技術,把不可再生的礦産、水等轉化一些虛擬能力,期間還伴隨著環境破壞和地緣沖突。

而且,這種巨大的資源密集型基礎設施幾乎完全是私人的。

03,  AI發展不僅存在能源和資源“饑渴”,還存在數據“饑渴”。

數據、算法和算力是AI大模型的三大支柱,而數據是大模型進行訓練的根基。數據集塑造了AI的認知邊界,它們決定了AI“看”世界的界限。

比如,創建計算機視覺系統的第一步,通常是從網上抓取成千上萬甚至數百萬張圖像,然後建立一系列分類體系來對它們進行排序,並以此作爲系統感知可觀察事實的基礎。

如果想構建一個可以檢測蘋果和橙子圖片之間差異的機器學習系統,首先開發人員必須收集和標記數以千計的蘋果和橙子的圖像,並基于此訓練神經網絡。在軟件方面,算法會對圖像進行統計調查,並開發一個模型來識別兩個“類別”之間的差異。

如果一切按計劃進行,經過訓練的模型將能夠區分它以前從未遇到過的蘋果和橙子圖像之間的差異。

但如果所有蘋果的訓練圖像都是紅色的,而沒有一個是綠色的,那機器學習系統可能會推斷“所有蘋果都是紅色的”。青蘋果完全不會被識別爲蘋果。

因此,訓練數據集是大多數機器學習系統進行推理的核心。它們是AI系統用來生成預測基礎的主要原材料。

現在網絡上每天有不可勝數的文本、圖片、音視頻被上傳,AI參與者就開始了數據掠奪。

科技巨頭在其中占據了優勢地位,像騰訊、字節、Meta等掌握著各自的數據渠道,分享內容的人越多,他們能用來訓練大模型的力量就越大。人們很樂意免費爲他們的照片貼上姓名和地點的標簽,而這種無償勞動爲機器視覺和語言模型系統帶來了更准確的標記數據。

沒有這些數據渠道的企業就要爲此付一大筆費用或者想其他辦法得到。

OpenAI就曾被報道其在未得到創作者授權情況下,使用Whisper語音識別工具,轉錄了超過一百萬小時的YouTube視頻內容,並將這些數據用于訓練其GPT-4模型。

但數據,尤其是高質量的數據並非取之不盡的。根據去年Epoch AI人工智能預測組織的一項研究,AI公司可能在 2026年前耗盡高質量文本訓練數據,而低質量文本和圖像數據的枯竭時間可能介于2030年至2060年之間。

山姆·奧特曼曾認爲AI最後應當可以産生高品質的“人造資料”,以便高效地進行自我培訓。

但很多研究者認爲,AI産生的數據質量太差,再用這樣的數據“喂”自己就是“自我投毒”。

對高質量數據的饑渴催生了“AI錄音員”“大數據標注師”“AI編輯”等衆包工作。

之前就有媒體報道,在一些一二線城市,互聯網大廠正以每次300元的價格,招募“AI錄音員”。他們的任務是爲大模型提供定制化的語音數據,通過錄制長達3小時的對話,幫助AI更好地理解和學習人類語言。

這300元不是那麽好掙的,需要提供有充足劇情、嚴格符合規範的高質量內容,可能需要多次重複一些內容以符合要求。

事實上,AI的一個常被忽視的重大事實就是需要數量巨大的低薪工人幫助開發、維護和測試AI系統。比如AI錄音員,還有給數千小時的培訓數據做標記,審查可疑或有害的內容。但他們從未因爲使這個AI系統正常運行而獲得認可。

此外,像亞馬遜的物流系統,即便配備了大量機器人來做諸如搬箱子這樣的重活,但也需要人來配合完成機器人做不了的特殊、精細的工作,比如機器人識別不了的奇形怪狀的東西。

人去配合機器人,就要不斷適應機器人,還要按照機器的節奏,很難運用自己已有的知識或形成工作慣性。

這顯示出了AI發展初期人的改造,把人的勞動和價值之間進行脫節,從而更好地配合機器,也更容易被替代。

而AI大多數訓練集是在人們不知情或未經當事人同意的情況下構建的,像家裏的智能音箱、口袋裏的手機、智能手表、監控記錄下的面部表情等,會不會也被拿來作爲數據訓練AI?

機器學習模型需要持續的數據流才能變得更加准確。但機器只能漸近,永遠不會達到完全精准,這進一步推動算法從盡可能多的人身上提取信息,來爲人工智能提供“燃料”。人類主體性被進一步消解。

04,  寫下這麽多並不是“反技術”,恰恰相反,技術給人類帶來了諸多便利,創造了更多可能性,使人類擺脫了諸多生存和發展難題。

但技術背後是一個涉及能源、資源、人、社會、歷史等各方面的系統性問題。

正如社會學家凱特·克勞福德在其所著《技術之外:社會聯結中的人工智能》中認爲,人工智能既是具身的,也是物質的,由自然資源、燃料、人力、基礎設施、物流、曆史和分類構成,這些都是需要付出代價的。

但很明顯,當下人們更多追求技術的軍備競賽和技術狂歡,而忽略了技術之外的一系列問題。

尤瓦爾·赫拉利在《今日簡史》裏說,19世紀工業革命興起之後,當時的社會、經濟和政治模式都無法應對相關的新情況和新問題。封建主義、君主制和傳統宗教不適合管理工業大都市、幾百萬背井離鄉的工人,並面對現代經濟不斷變化的本質。

狄更斯筆下的煤礦童工、第一次世界大戰和1932—1933年的烏克蘭大饑荒,都只是人類付出昂貴學費的一小部分。

現代文明有核武器及各種更高級的技術,破壞力也更驚人,我們只能比面對工業革命時做得更好才行。

人類的行進既充滿智慧,又是盲目的。做任何事都有代價,或許最優的結果是效果和代價匹配,而非不計代價地奔向目標。---[文 :   商隱社,作者 :  浩然/來源 :   钛媒體]