01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

AI苦工卷向高學歷,美國博士正在搶走印度人工作

2024070115:44



美國人馬特擁有通信博士學位,他最近喜提一份自由職業:成為Scale AI公司的一員,在家訓練AI模型。

「通信博士」「訓練AI模型」,馬特是不是成了一名光榮的AI程序員?事實並非如此。馬特的工作很無聊:他在Scale AI的系統中「接活」,以用戶的角度瀏覽AI模型給用戶的各種回復,判斷AI有沒有說錯,然後提供反饋。比如為谷歌的AI訓練預訂航班,審核哪些ChatGPT的答案會得到用戶的差評。

Scale AI自己不生產大模型,它和谷歌母公司Alphabet、OpenAI、Meta等眾多AI生產商達成合作,為它們提供「人類」。

只不過,來自非洲、印度、菲律賓等地的廉價勞動力,已經不足以滿足客戶的需求。Scale AI已經開始收縮其海外業務,在美國本土雇傭數十萬勞動力,其中不乏像馬特一樣的高知人士。



這家成立了8年的大模型數據標註公司,在今年5月剛剛完成了10億美元F輪融資,由Accel領投,亞馬遜、英特爾、AMD、思科、Meta、老虎全球基金等全球知名公司跟投。公司預計今年銷售額將超過10億美元,使其成為生成式AI公司中銷售額排名靠前的公司之一。

而它的最新估值,已經達到了138億美元。這放在所有AI初創公司中,都是一份不俗的成績,遠遠超過矽谷明星公司Hugging Face去年8月融資後的45億美元估值,更接近埃隆·馬斯克(Elon Musk)的xAI,其最新一輪融資後估值180美元。

A, 讓人類給AI打苦工的Scale AI,已經是當下AI競賽中很關鍵的彈藥庫。

當我們提到「大模型訓練」時,會想到的是用數千個先進芯片驅動大模型,讓其分析數百億字節的文本,其實這只是第一步——預訓練。

但僅靠這些,不足以確保像Anthropic的Claude、OpenAI的ChatGPT、Meta的Llama和谷歌的Bard這樣的系統提供以人類風格編寫的正確答案。

為了實現這一點,需要進行第二步:微調。這就涉及大量的人力,有可能是AI生產商在公司內部雇傭,也有可能是來自Scale、Surge AI、Labelbox、Telus International等公司。這些公司提供大量的人,為客戶的聊天機器人寫下理想的回應,手把手教機器人提供更「完美」的答案。

為AI模型提供數據標註服務的公司並非全新的存在,上一次讓這類公司起飛的風是自動駕駛。

Scale AI就成立於2016年。事實上,Scale AI從一開始就和OpenAI頗有淵源,其孵化於Y Combinator(下稱YC)的初創企業賽馬項目,項目還未結束就已經獲得了YC的支持。而YC彼時的總裁,正是後來聯合創辦了OpenAI的山姆·奧特曼(Sam Altman)。



不過,彼時「千模大戰」還未開始,Scale AI首先趕上的是席卷矽谷的自動駕駛技術熱潮。實現自動駕駛,需要訓練AI算法,而當時沒有其他外包公司擁有對自動駕駛汽車的雷達和傳感器生成的三維圖像進行數據標註的能力。

Scale AI的工程師最初花了幾個月,為自動配送初創公司Nuro建立了3D標註產品。很快,Alphabet的Waymo和通用汽車的Cruise,甚至是蘋果,都成了Scale AI的客戶。

在2017年底,Scale AI雇傭了1000多名標註員,主要在菲律賓。平均來說,這些合同工的時薪是1.5美元,每周工作10個小時。

到了2019年,OpenAI也已經成立幾年,並且將方向主要專註在了開發AI大模型上,隨後成為Scale AI的客戶。只不過彼時AI大模型客戶對於Scale AI來說並不是關鍵收入來源。

隨著自動駕駛技術的熱潮漸漸回落,市場回歸理智,Scale AI也遭遇了危機。在2022年,Scale AI的收入增長已經下降了50%,讓投資人頗為失望。

然而,2022年年底,OpenAI發布了ChatGPT,Scale AI的「第二春」瞬間綻放。

除了OpenAI之外,Scale AI也與Meta和谷歌母公司Alphabet達成了圍繞大模型的合作。公司的收入從2022年的2.27億美元,飆升到2023年的6.8億美元。

站在風口之上,Scale AI喊出2024年收入增長206%的目標,並希望實現盈利。

B, 在這個節點,Scale AI也開始做出一些改變,來自海外的廉價勞動力只能負擔很基礎的任務,但大模型驅動的產品在寫作、編程、專業知識等方面都開始「卷」,Scale AI需要升級手裏的「雇傭兵」。

在一份投資者演示文稿中,Scale說它正在建設的是至關重要的AI基礎設施。該公司開始將自己打造成一個「AI的數據鑄造廠」,讓人聯想到半導體公司。

Scale AI的創始人也開始公開談論持有博士學位的人,或者醫生、律師等在訓練AI系統上的貢獻:「我們需要最優秀和最聰明的頭腦來貢獻數據。」

根據Rest of World的報道,Scale AI最近關閉了肯尼亞、尼日利亞和巴基斯坦的承包商站點。公司的焦點轉向美國本土,招募高知人士,來幫助訓練大模型的專業知識。

大約有30萬人通過Scale AI子公司Outlier運行的工作群等著「派活兒」。

美國本土的Scale AI「雇傭兵」並不廉價,平均時薪可以達到40美元。不過這份工作仍然擺脫不了「苦工」的體驗感。



在美國馬薩諸塞州的梅麗莎·誇西(Melissa Quashie)就以每個小時40美元的薪酬在Scale AI接活,她是一位自由職業者和編輯。她的任務包括評估由大模型生成的不同響應,根據模型回答問題的方式以及回答的內容質量來給出評分。

對誇西來說,在Scale AI的工作就像是「我玩過的最呆的電子遊戲」。她曾經花了兩個小時編寫一個「三天餐譜」,只是為了給聊天機器人改進答案。

此外,隨著Scale AI積累大量的勞動力,供求關系已經開始不平衡。很多時候,Scale AI派發的客戶任務已經難以滿足「雇傭兵」的需求。很多人發現,這份工作雖然時間靈活且薪水誘人,但許多時候都會無事可做。The Information采訪的10位Scale AI「雇傭兵」中,大部分人都有相同的抱怨。

也許是在AI浪潮下公司業務擴展的速度太快,也許是比起勞力們的工作體驗,Scale AI更專註於服務好客戶。總之,Scale AI也開始暴露其他的問題,除了吐槽派的活不夠做之外,人們也抱怨其培訓不足以及系統經常崩潰。

更惱人的還要數薪酬結算,即便是在美國本土為Scale AI提供勞力的「高知人士」,也沒有什麽話語權。開頭提到的博士馬特就表示,他被Scale AI無故踢出平臺。

薪酬的結算不看工作量,而是要考核質量,而最終解釋權自然歸Scale AI所有。而且即便理應收到報酬,也可能因為客戶遲遲不確認而沒有著落。

C, 根據工作質量而不是工作量為苦力們結算,這有助於Scale AI控製成本,而這對於Scale AI來說是現階段的關鍵卡點。

隨著公司將焦點從提供廉價勞動力的海外市場轉移到美國,Scale AI的成本也更難控製。根據The Information獲取的財務數據,Scale AI的毛利率(包括支付給人類苦工的成本),從2022年的59%下降到了2023年的49%。

與此同時,Scale AI告訴投資者,它正在努力降低成本。該公司預測,今年將提高毛利潤率5個百分點,然後到2025年提高到60%。

公司告訴投資者,它正在通過使用內部工具自動識別「高效專家」來降低人工訓練模型的成本,以及依靠計算機生成的數據來增加人類工作的效率。

另一個壓縮成本的方式是減少內部員工(和「雇傭兵」不同,此處指的是在Scale AI工作的正式員工),2023年2月,Scale AI一方面已經看到了AI浪潮的來臨,另一方面也看到了宏觀經濟的影響以及矽谷的裁員潮,它抓住機會,也大刀闊斧裁員20%。

除了盡力壓縮成本之外,Scale AI也在想方設法拓展業務。

雖然很多員工反對,但Scale AI早已把不與政府合作的承諾拋之腦後。最近幾個月,Scale AI的聯合創始人亞歷山大·王(Alexandr Wang)與美國陸軍將領在華盛頓共同登臺,公司每年從政府合同中獲得超過1億美元的收入。此外,他還前往卡塔爾,與政府官員進行閉門會議,卡塔爾也熱衷於開發自己的大語言模型。

在為AI生產商提供大量人力之外,Scale AI也提供AI生成的合成數據集——用AI生成的數據,訓練AI,以滿足AI大模型訓練中不斷膨脹的胃口。



現階段「高質量的人類」依舊是Scale AI最賴以生存的「資源」,因此公司也在采取措施維護「高質量人類」中的那些佼佼者。

在美國德克薩斯州奧斯汀和佛羅裏達州的傑克遜維爾,Scale AI曾舉辦為期數天的研討會,邀請幾十名「頂級苦力」前往參加。

一位參加奧斯汀研討會的人說,大約有50名訓練師參與了一個據悉Alphabet的Bard聊天機器人相關的項目。他們討論了每個人為不同提示寫下的回應,並在晚上一起唱卡拉OK。

在傑克遜維爾,誇西遇到了大學教授、博士生、編劇和播客主持人。「我們連續工作六個小時,然後喝杯葡萄酒。」

「每個人都非常興奮地改善大語言模型。但沒有人談論的是,因為我們在做這份工作,誰會失去他們的工作?」

諷刺的是,數以十萬計的人類在為AI打工,就是為了讓AI的表現越來越好。而當AI足夠好的時候,這些苦力也許也是會被首先拋棄的那批人。畢竟如果AI能自產自銷,何必依靠每小時需要40美元的「高知苦力」?

也許更進一步的問題是,為AI販賣人類勞動力的日子還能持續多久,而這也是懸在Scale AI頭上的一把劍。---來源: 字母榜-