全球科技行業兩年裁員40萬,LLM博士卻拿620萬年薪offer?-(3)
學術界仍然舉足輕重
在GenAI革命中,學術界仍將發揮重要作用。
比如,由UC伯克利、UCSD、CMU和MBZUAI等機構共建立的LMSYS,不僅訓練出了紅極一時的Vicuna模型,而且還製作了相關的推理和訓練庫,收集了大量模型比較數據,並設計了一個後來被廣泛使用的基準測試等等。
所有這些工作本身都很有影響力,即便其中只有一部分發表了論文。
與此同時,像EluetherAI和LAION這樣的研究組織也取得了相當可觀的進展。
如果以arXiv論文的數量來衡量,RLHF研究的速度自8月份以來,已經有了明顯的提高。
求職經歷
在職1年半,作者剛剛結束了在HuggingFace的工作。
他發現,在這裡為自己的工作獲得知名度,比做好工作更難。
以下是他本人在工作中總結的重要經驗:
- 如果你不主動宣傳和交流自己的研究,別人也不會這樣做。然而人們不喜歡這樣的現實。
- 開源發展非常快,因此需要聰明的領導者,以最大限度地發揮集體的力量。
- 開源ML還處於早期階段。我們正在弄清楚做開源ML意味着什麼,OSS將永遠改變。
- 開源在多樣性方面取得了成功。僅僅因為有人在嘗試類似的東西並不意味着你應該停止。
- RLHF還未被充分開發。
對於HuggingFace這樣的初創公司的對外媒體策略,他也是又愛又恨。這樣的公司知道,如何幫助自己在公眾輿論中成長,這一點是很重要。
Nathan Lambert知道這次工作變動即將來臨,所以需要了解工作市場。他在博士畢業時寫過一篇關於求職的文章,也頗受歡迎。
其中,關於建立人際關係網、主動出擊、提高知名度和積極進取的價值觀都適用。
這作者着所做的具體工作,主要圍繞一個高度專業化和需求旺盛的AI領域,但目標更加明確——找到一個能讓自己繼續學習RLHF(科學和工程系統)的地方,而且這個地方足夠開放,並可以繼續進行播客。
他表示,自己不想成為任何創始人、創始工程師、大公司的齒輪等等。
在篩選公司名單時,作者pass掉了蘋果、波士頓動力人工智能研究所、以及與許多初創公司等。
作者認為,即使是那些覺得與自己很有共鳴的公司,他也發現這些人都很難清楚地表達「我到底要做什麼」。
今年上半年,作者剛剛為建立RLHF pipeline付出了巨大的努力,現在即將要重新開始,這並不令人興奮。
不管怎麼說,事實上,大多數人都不知道「你現在要做什麼」,你仍然無法百分之百地選擇自己的方向。
這樣一來,選擇其實就不多了(根據學術性從高到低排序):
Cohere for AI(現場面試後被拒絕)
入職後,他會加入一個小團隊,負責強化學習方向。
公司特意組建了一個小團隊,為想發表論文的Cohere工程師提供機會。團隊中的每個人都很優秀,作為遠程工作來說非常不錯。
不過,考慮到在Hugging Face的經歷,作者很難加入這樣一個對公司的產品和發展不重要的團隊。
艾倫人工智能研究所(AI2)(offer)
能拿到Offer,是作者沒想到的。
艾倫AI研究所曾是介於谷歌大腦和學術研究小組之間的一個組織,現在則轉向了工程學方向,發展大語言模型。
他們在諮詢、工程、自主研究等方面表現得有些含糊,但對於發展NLP,則有着堅定的承諾。
後來作者意識到,他們需要有人來幫助理解RLHF。
Scale AI(口頭offer)
這家公司正轉向RLHF和訓練後的研究領域,作為LLM訓練公司的專業數據提供商,他們的業務正在大幅增長。
入職後,你可以做一些研究,在從事RLHF研究的人中可以獲得最多的數據。有時,也可以幫客戶做些集成,並建立實驗室。
理論上,這是作者面試過的最令人興奮的地方。但因為某種原因,他覺得與自己交談過的人中,並沒有誰引起自己的強烈共鳴。
有時候就是這樣,並不是所有優秀的人都能在一個團隊中共事。
Mosaic,現在的Databricks(offer)
就像每家初創公司一樣,Mosaic希望讓RLHF簡單易用,發揮影響力。
這裡團隊輸出非常穩定,並繼續向公眾發布一些模型,或者論文。
然而,作者擔憂到,由於公司剛被收購,未來在開源上的動力可能不足。
Meta,Llama團隊(現場面試後被拒)
在最先進的開源模型公司工作一段時間,大家都有這樣的想法。
不過讓Lambert為難的是,他不願意加入大公司、大團隊。
但如果關心開源技術,顯然去Meta是一個很好的選擇。
谷歌DeepMind(已撤回)
谷歌正在到處招聘RLHF的人。這裡的資源和基礎設施都無與倫比,但谷歌是Lambert接觸過的最封閉的公司,你得費很大勁才能了解自己進去要做什麼。
幾個團隊大多有自己的專長領域,正在研究如何改進該領域的工具。
作者接觸過的兩個團隊,分別做的是多模態RLHF和LLM Agent。
但在他看來,這種模糊性會讓谷歌的offer遠不如像Llama團隊那樣吸引人。
Contextual AI(口頭offer)
在Lambert接觸過的許多初創工中,他們做事的方式都很合理、很親民。
但在作者看來,建立一個有生命的企業,不僅僅是投擲收購的篩子,也需要推遲建立以客戶為中心的企業文化。
Contextual為作者提供了一個不錯的技術人員+科學傳播者職位。
如果辦公地在舊金山,通勤時間不長,倒是有可能會接受offer。
另外,作者從最初就沒考慮過面試OpenAI,因為他們不缺RLHF專家。
輕量級面經
Nathan Lambert表示,自己經歷的面試都非常輕鬆,更多的是研究聊天,一些編碼測試。
如果想找一份LLM方面的工作,大部分問題都會與各種內部組件的功能相關。比如:
- 注意力在實現層面是如何工作的。(可以參考nanoGPT等資料)
- 多GPU訓練的基礎知識,估算VRAM使用量,通過超參數來減小模型的占用空間(例如量化)。
- 正則化工具,如批量歸一化、權重衰減等。
除了技術之外,還需要根據公司的具體情況,闡述自己在加入之後能貢獻些什麼。
此外,很多公司都會查看簡歷上列出的GitHub倉庫和HuggingFace工具,這可能比複雜的研究項目更容易談論。-[新智元報導*編輯:編輯部/來源:新智元]
參考資料:
https://www.wired.com/story/tech-jobs-layoffs-hiring/
https://www.interconnects.ai/p/ai-research-job-market
https://siliconangle.com/2023/10/12/qualcomm-says-will-lay-off-1200-staff-california/