01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

全球科技行業兩年裁員40萬,LLM博士卻拿620萬年薪offer?-(3)

2023101318:26



學術界仍然舉足輕重

在GenAI革命中,學術界仍將發揮重要作用。

比如,由UC伯克利、UCSD、CMU和MBZUAI等機構共建立的LMSYS,不僅訓練出了紅極一時的Vicuna模型,而且還製作了相關的推理和訓練庫,收集了大量模型比較數據,並設計了一個後來被廣泛使用的基準測試等等。

所有這些工作本身都很有影響力,即便其中只有一部分發表了論文。

與此同時,像EluetherAI和LAION這樣的研究組織也取得了相當可觀的進展。

如果以arXiv論文的數量來衡量,RLHF研究的速度自8月份以來,已經有了明顯的提高。


求職經歷

在職1年半,作者剛剛結束了在HuggingFace的工作。

他發現,在這裡為自己的工作獲得知名度,比做好工作更難。

以下是他本人在工作中總結的重要經驗:

- 如果你不主動宣傳和交流自己的研究,別人也不會這樣做。然而人們不喜歡這樣的現實。

- 開源發展非常快,因此需要聰明的領導者,以最大限度地發揮集體的力量。

- 開源ML還處於早期階段。我們正在弄清楚做開源ML意味着什麼,OSS將永遠改變。

- 開源在多樣性方面取得了成功。僅僅因為有人在嘗試類似的東西並不意味着你應該停止。

- RLHF還未被充分開發。



對於HuggingFace這樣的初創公司的對外媒體策略,他也是又愛又恨。這樣的公司知道,如何幫助自己在公眾輿論中成長,這一點是很重要。

Nathan Lambert知道這次工作變動即將來臨,所以需要了解工作市場。他在博士畢業時寫過一篇關於求職的文章,也頗受歡迎。

其中,關於建立人際關係網、主動出擊、提高知名度和積極進取的價值觀都適用。

這作者着所做的具體工作,主要圍繞一個高度專業化和需求旺盛的AI領域,但目標更加明確——找到一個能讓自己繼續學習RLHF(科學和工程系統)的地方,而且這個地方足夠開放,並可以繼續進行播客。

他表示,自己不想成為任何創始人、創始工程師、大公司的齒輪等等。

在篩選公司名單時,作者pass掉了蘋果、波士頓動力人工智能研究所、以及與許多初創公司等。

作者認為,即使是那些覺得與自己很有共鳴的公司,他也發現這些人都很難清楚地表達「我到底要做什麼」。

今年上半年,作者剛剛為建立RLHF pipeline付出了巨大的努力,現在即將要重新開始,這並不令人興奮。

不管怎麼說,事實上,大多數人都不知道「你現在要做什麼」,你仍然無法百分之百地選擇自己的方向。

這樣一來,選擇其實就不多了(根據學術性從高到低排序):



Cohere for AI(現場面試後被拒絕)

入職後,他會加入一個小團隊,負責強化學習方向。

公司特意組建了一個小團隊,為想發表論文的Cohere工程師提供機會。團隊中的每個人都很優秀,作為遠程工作來說非常不錯。

不過,考慮到在Hugging Face的經歷,作者很難加入這樣一個對公司的產品和發展不重要的團隊。

艾倫人工智能研究所(AI2)(offer)

能拿到Offer,是作者沒想到的。

艾倫AI研究所曾是介於谷歌大腦和學術研究小組之間的一個組織,現在則轉向了工程學方向,發展大語言模型。

他們在諮詢、工程、自主研究等方面表現得有些含糊,但對於發展NLP,則有着堅定的承諾。

後來作者意識到,他們需要有人來幫助理解RLHF。

Scale AI(口頭offer)

這家公司正轉向RLHF和訓練後的研究領域,作為LLM訓練公司的專業數據提供商,他們的業務正在大幅增長。

入職後,你可以做一些研究,在從事RLHF研究的人中可以獲得最多的數據。有時,也可以幫客戶做些集成,並建立實驗室。

理論上,這是作者面試過的最令人興奮的地方。但因為某種原因,他覺得與自己交談過的人中,並沒有誰引起自己的強烈共鳴。

有時候就是這樣,並不是所有優秀的人都能在一個團隊中共事。

Mosaic,現在的Databricks(offer)

就像每家初創公司一樣,Mosaic希望讓RLHF簡單易用,發揮影響力。

這裡團隊輸出非常穩定,並繼續向公眾發布一些模型,或者論文。

然而,作者擔憂到,由於公司剛被收購,未來在開源上的動力可能不足。

Meta,Llama團隊(現場面試後被拒)

在最先進的開源模型公司工作一段時間,大家都有這樣的想法。

不過讓Lambert為難的是,他不願意加入大公司、大團隊。

但如果關心開源技術,顯然去Meta是一個很好的選擇。

谷歌DeepMind(已撤回)

谷歌正在到處招聘RLHF的人。這裡的資源和基礎設施都無與倫比,但谷歌是Lambert接觸過的最封閉的公司,你得費很大勁才能了解自己進去要做什麼。

幾個團隊大多有自己的專長領域,正在研究如何改進該領域的工具。

作者接觸過的兩個團隊,分別做的是多模態RLHF和LLM Agent。

但在他看來,這種模糊性會讓谷歌的offer遠不如像Llama團隊那樣吸引人。

Contextual AI(口頭offer)

在Lambert接觸過的許多初創工中,他們做事的方式都很合理、很親民。

但在作者看來,建立一個有生命的企業,不僅僅是投擲收購的篩子,也需要推遲建立以客戶為中心的企業文化。

Contextual為作者提供了一個不錯的技術人員+科學傳播者職位。

如果辦公地在舊金山,通勤時間不長,倒是有可能會接受offer。

另外,作者從最初就沒考慮過面試OpenAI,因為他們不缺RLHF專家。

輕量級面經

Nathan Lambert表示,自己經歷的面試都非常輕鬆,更多的是研究聊天,一些編碼測試。

如果想找一份LLM方面的工作,大部分問題都會與各種內部組件的功能相關。比如:

- 注意力在實現層面是如何工作的。(可以參考nanoGPT等資料)

- 多GPU訓練的基礎知識,估算VRAM使用量,通過超參數來減小模型的占用空間(例如量化)。

- 正則化工具,如批量歸一化、權重衰減等。

除了技術之外,還需要根據公司的具體情況,闡述自己在加入之後能貢獻些什麼。

此外,很多公司都會查看簡歷上列出的GitHub倉庫和HuggingFace工具,這可能比複雜的研究項目更容易談論。-[新智元報導*編輯:編輯部/來源:新智元]

參考資料:

https://www.wired.com/story/tech-jobs-layoffs-hiring/

https://www.interconnects.ai/p/ai-research-job-market

https://siliconangle.com/2023/10/12/qualcomm-says-will-lay-off-1200-staff-california/