全球科技行業兩年裁員40萬，LLM博士卻拿620萬年薪offer？-(3)

2023101318:26

學術界仍然舉足輕重

在GenAI革命中，學術界仍將發揮重要作用。

比如，由UC伯克利、UCSD、CMU和MBZUAI等機構共建立的LMSYS，不僅訓練出了紅極一時的Vicuna模型，而且還製作了相關的推理和訓練庫，收集了大量模型比較數據，並設計了一個後來被廣泛使用的基準測試等等。

所有這些工作本身都很有影響力，即便其中只有一部分發表了論文。

與此同時，像EluetherAI和LAION這樣的研究組織也取得了相當可觀的進展。

如果以arXiv論文的數量來衡量，RLHF研究的速度自8月份以來，已經有了明顯的提高。

求職經歷

在職1年半，作者剛剛結束了在HuggingFace的工作。

他發現，在這裡為自己的工作獲得知名度，比做好工作更難。

以下是他本人在工作中總結的重要經驗：

- 如果你不主動宣傳和交流自己的研究，別人也不會這樣做。然而人們不喜歡這樣的現實。

- 開源發展非常快，因此需要聰明的領導者，以最大限度地發揮集體的力量。

- 開源ML還處於早期階段。我們正在弄清楚做開源ML意味着什麼，OSS將永遠改變。

- 開源在多樣性方面取得了成功。僅僅因為有人在嘗試類似的東西並不意味着你應該停止。

- RLHF還未被充分開發。

對於HuggingFace這樣的初創公司的對外媒體策略，他也是又愛又恨。這樣的公司知道，如何幫助自己在公眾輿論中成長，這一點是很重要。

Nathan Lambert知道這次工作變動即將來臨，所以需要了解工作市場。他在博士畢業時寫過一篇關於求職的文章，也頗受歡迎。

其中，關於建立人際關係網、主動出擊、提高知名度和積極進取的價值觀都適用。

這作者着所做的具體工作，主要圍繞一個高度專業化和需求旺盛的AI領域，但目標更加明確——找到一個能讓自己繼續學習RLHF（科學和工程系統）的地方，而且這個地方足夠開放，並可以繼續進行播客。

他表示，自己不想成為任何創始人、創始工程師、大公司的齒輪等等。

在篩選公司名單時，作者pass掉了蘋果、波士頓動力人工智能研究所、以及與許多初創公司等。

作者認為，即使是那些覺得與自己很有共鳴的公司，他也發現這些人都很難清楚地表達「我到底要做什麼」。

今年上半年，作者剛剛為建立RLHF pipeline付出了巨大的努力，現在即將要重新開始，這並不令人興奮。

不管怎麼說，事實上，大多數人都不知道「你現在要做什麼」，你仍然無法百分之百地選擇自己的方向。

這樣一來，選擇其實就不多了（根據學術性從高到低排序）：

Cohere for AI（現場面試後被拒絕）

入職後，他會加入一個小團隊，負責強化學習方向。

公司特意組建了一個小團隊，為想發表論文的Cohere工程師提供機會。團隊中的每個人都很優秀，作為遠程工作來說非常不錯。

不過，考慮到在Hugging Face的經歷，作者很難加入這樣一個對公司的產品和發展不重要的團隊。

艾倫人工智能研究所（AI2）（offer）

能拿到Offer，是作者沒想到的。

艾倫AI研究所曾是介於谷歌大腦和學術研究小組之間的一個組織，現在則轉向了工程學方向，發展大語言模型。

他們在諮詢、工程、自主研究等方面表現得有些含糊，但對於發展NLP，則有着堅定的承諾。

後來作者意識到，他們需要有人來幫助理解RLHF。

Scale AI（口頭offer）

這家公司正轉向RLHF和訓練後的研究領域，作為LLM訓練公司的專業數據提供商，他們的業務正在大幅增長。

入職後，你可以做一些研究，在從事RLHF研究的人中可以獲得最多的數據。有時，也可以幫客戶做些集成，並建立實驗室。

理論上，這是作者面試過的最令人興奮的地方。但因為某種原因，他覺得與自己交談過的人中，並沒有誰引起自己的強烈共鳴。

有時候就是這樣，並不是所有優秀的人都能在一個團隊中共事。

Mosaic，現在的Databricks（offer）

就像每家初創公司一樣，Mosaic希望讓RLHF簡單易用，發揮影響力。

這裡團隊輸出非常穩定，並繼續向公眾發布一些模型，或者論文。

然而，作者擔憂到，由於公司剛被收購，未來在開源上的動力可能不足。

Meta，Llama團隊（現場面試後被拒）

在最先進的開源模型公司工作一段時間，大家都有這樣的想法。

不過讓Lambert為難的是，他不願意加入大公司、大團隊。

但如果關心開源技術，顯然去Meta是一個很好的選擇。

谷歌DeepMind（已撤回）

谷歌正在到處招聘RLHF的人。這裡的資源和基礎設施都無與倫比，但谷歌是Lambert接觸過的最封閉的公司，你得費很大勁才能了解自己進去要做什麼。

幾個團隊大多有自己的專長領域，正在研究如何改進該領域的工具。

作者接觸過的兩個團隊，分別做的是多模態RLHF和LLM Agent。

但在他看來，這種模糊性會讓谷歌的offer遠不如像Llama團隊那樣吸引人。

Contextual AI（口頭offer）

在Lambert接觸過的許多初創工中，他們做事的方式都很合理、很親民。

但在作者看來，建立一個有生命的企業，不僅僅是投擲收購的篩子，也需要推遲建立以客戶為中心的企業文化。

Contextual為作者提供了一個不錯的技術人員+科學傳播者職位。

如果辦公地在舊金山，通勤時間不長，倒是有可能會接受offer。

另外，作者從最初就沒考慮過面試OpenAI，因為他們不缺RLHF專家。

輕量級面經

Nathan Lambert表示，自己經歷的面試都非常輕鬆，更多的是研究聊天，一些編碼測試。

如果想找一份LLM方面的工作，大部分問題都會與各種內部組件的功能相關。比如：

- 注意力在實現層面是如何工作的。（可以參考nanoGPT等資料）

- 多GPU訓練的基礎知識，估算VRAM使用量，通過超參數來減小模型的占用空間（例如量化）。

- 正則化工具，如批量歸一化、權重衰減等。

除了技術之外，還需要根據公司的具體情況，闡述自己在加入之後能貢獻些什麼。

此外，很多公司都會查看簡歷上列出的GitHub倉庫和HuggingFace工具，這可能比複雜的研究項目更容易談論。-[新智元報導*編輯:編輯部/來源:新智元]

參考資料：

https://www.wired.com/story/tech-jobs-layoffs-hiring/

https://www.interconnects.ai/p/ai-research-job-market

https://siliconangle.com/2023/10/12/qualcomm-says-will-lay-off-1200-staff-california/

我要留言

全球科技行業兩年裁員40萬，LLM博士卻拿620萬年薪offer？-(3)

全球科技行業兩年裁員40萬，LLM博士卻拿620萬年薪offer？-(2)

藍色+棕色,灰色秋冬之間氣質與腔調的抒情詩,穿出秋天的高級感*獨特藝術時尚穿搭

全球科技行業兩年裁員40萬，LLM博士卻拿620萬年薪offer？-(2)

藍色+棕色,灰色秋冬之間氣質與腔調的抒情詩,穿出秋天的高級感*獨特藝術時尚穿搭