01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

2023上半年風投資本瘋狂追捧的20個AI公司,哪家會成為第一個泡沫?-(3)

2023080813:38

大模型工具系列

為什麼大模型工具賽道這麼火爆呢?原因也很簡單,人工智能大模型LLM就像一塊潛力無限的大油田,但一般人是直接用不了石油的,你得把它開採出來,通過煉油廠來提取各種柴油,汽油這樣的產品,運送到加油站才能服務於你我這樣的普通消費者對吧。

AI大模型也是如此,所以我們看到整個大模型基建的上下游,出現了很多的創業機會。

首先比如說,算力上的優化,代表性的公司就是CoreWeave。

11. CoreWeave:算力優化「比傳統雲提供商便宜80%」

CoreWeave公司在今年完成2.21億美元B輪融資,估值20億美元,由Magnetar Capital領投,英偉達也有參與投資。



CoreWeave這個公司還蠻有意思的,它是一個算力提供商,主打Cloud-based GPU的概念,也就是用戶不用自己買GPU,直接在CoreWeave的雲算力上訓練各種AI模型就可以。這對中小型的AI公司,沒有預算或者排不上隊買英偉達GPU的公司們,無疑來說是有吸引力的。

雖然英偉達現在有對中小企業的數據中心服務,谷歌雲和亞馬遜雲也有算力服務,但我們聽到的業內看法是,還是挺貴的。CoreWeave號稱可以提供「比傳統雲提供商便宜80%」的算力,如果真的能優化算力成本到這樣的程度,市場的需求肯定還是非常大。

而CoreWeave除了綁定和英偉達的合作與投資之外,也抱緊了微軟的大腿。在今年6月初,微軟就和CoreWeave簽署AI算力協議,同意在未來數年內向CoreWeave投資數十億美元,用於雲計算基礎設施建設。

12. LangChain/LlamaIndex:結合外部數據,大模型開發必備

在2023年上半年,還有一個讓資本追逐的公司叫做LangChain,在2023年的3月獲得Benchmark Capital投資的1000萬美元種子輪之後的僅僅一周,又宣布由紅衫領投的超過2000萬美元融資。



這個公司很有意思,LangChain本來是一位機器學習工程師Harrison Chase在2022年10月作為開源項目推出的,沒想到項目在開源社區受到了意料之外的熱度,當時在GitHub 上數百名貢獻者參與改進、開發者們在Twitter 上熱門討論、在Discord社區各種活躍、在YouTube上紛紛推出教程,甚至舊金山和倫敦大家自發組織線下聚會。為什麼LangChain的社群和生態能做得這麼好呢?

因為這可以說是大模型開發的必備。

簡單來說,LangChain可以讓AI開發人員把像GPT-4這樣的大型語言模型和外部數據結合起來。比如說,ChatGPT的模型參數訓練只到2021年,你要問它一點實時的事情它沒辦法回答你,因此,將大模型連接到自定義的數據和計算,就會有更多的可能性。而這就是LangChain做的事情:讓大模型訪問最新的數據,包括報告、文檔和網站信息等等。

在2023年3月OpenAI發布GPT-4之後,Langchain的市場熱度飆漲。

和LangChain相似的項目還有叫做LlamaIndex的公司,由前Uber研究科學家Jerry Liu創立,為開發者提供框架,使得大語言模型來和各種數據源合作。

目前LlamaIndex拿到了850萬美元的種子輪資金,參與投資的包括Greylock,OpenAI創始人Sam Altman的弟弟Jack Altman等一眾硅谷大佬和機構。



說明這個方向確實也是大模型基建的重要方向。同時,我們看到,在如此早起的大模型AI創業浪潮中,大企業的收購動作已經開始。

13. MosaicML:企業模型部署及優化

今年6月底,美國大數據巨頭Databricks宣布將以13億美元的價格,收購位於舊金山的人工智能初創公司MosaicML。要知道,這家公司2021年才成立於舊金山,之前只披露過一輪的融資,員工也才62人。上一輪估值也才2.2億美元,這次收購價的估值直接翻了5倍。

而這筆交易也是目前為止生成式AI領域最大額度的收購案。



MosaicML主要提供生成式AI的平台和一套完整的解決方案,包括開源的一系列對商用友好的大模型,推理和訓練支持,讓用戶能夠在自己的數據和安全環境中訓練和部署生成式AI模型。很多企業反映,用OpenAI的GPT模型有個問題就是,很多數據是我公司的內部機密,不可能直接拿去給OpenAI訓練,因此,很多企業需要定製AI模型,不需要GPT那麼大的通用模型,但需要更垂直精確一些的,比如說工程,健康醫療,法律,金融,安全甚至政府領域這樣對於數據有着嚴格的合規和控制的模型尋求。而這些市場需求是暫時OpenAI這樣的通用大模型無法服務的。

同時,MosaicML還號稱自己的訓練成本更低,比如說在推理產品上,MosaicML比OpenAI的GPT模型成本低4倍,圖像生成的成本比使用OpenAI的DALL-E 2便宜15倍。因此,更小更垂直更數據隱私的大模型,加上更低的成本,這是MosaicML的殺手鐧。如今在Databricks收購之後,MosaicML整個團隊和技術都將納入Databricks旗下。

另外的一個特別火的創業方向,就是縮小模型,誒,這就要提到一個被英偉達在今年收購的公司了,OmniML。

14. OmniML:AI邊緣計算/縮小模型

在算力優化這個領域非常值得一提的是英偉達在今年2月低調收購的OmniML。具體收購數額沒有披露。

這個團隊是三名華人創立的初創公司,在2021年創立,非常年輕的團隊,之前種子輪融了1000萬美元,沒想到這麼快就被英偉達下手了。

其中一位聯合創始人還是我們硅谷101團隊一位研究志願者的同學,他這次拒絕了交流,但看看以後有沒有機會跟他們團隊具體聊聊邊緣計算和縮小模型,感覺是非常重要的技術。

OmniML做的事情,簡單來說就是讓AI訓練變得更簡單更快速、將機器學習模型「縮小」到邊緣設備上運行、而不再依賴雲端的公司。公司表示,能使機器學習任務在不同邊緣設備上的速度提高10倍,而工程工作量僅為1/10。同時,OmniML推出了一款名為Omnimizer的平台,可以將計算密集型的AI模型適應於低功耗的硬件,得到更小、更快、更適合所運行硬件的模型。也就是說,公司之後可以將模型運行在比如說無人機、智能照相機和汽車等設備上,這將有效地使模型擺脫對雲的依賴,使得運行機器學習模型的能力更加快速和容易。

這將在未來幾年的算力市場帶來非常大的影響,英偉達這麼早就搶買也能說得通啦。

這個賽道如今其實非常的熱鬧了,我們也只是舉了其中的幾個例子,但大的方向大家可以看到,算力優化,大模型簡化,開發簡化以及更加垂直的應用是整個AI賽道創業的一個重要方向,也是風險投資資金如今瘋狂湧入的方向。

然而,AI如今的創業生態不僅如此,還有更好玩的一些應用,和垂直領域的發展,在最後一部分我們來講講。

多領域垂直應用系列15. Casetext,Harvey:AI律師

首先的一個垂直應用來講講法律方向的AI進展。說實話,當ChatGPT出現的時候,律師,特別是初級律師是大家覺得最會被取代的職業之一。

在6月27日,湯森路透宣布將以6.5億美元現金收購 AI法律技術初創公司Casetext。

Casetext這個公司成立於2013年,在被收購之前,從Union Square Ventures等機構融資了超過6400萬美元。這個公司的一款旗艦產品名為「CoCounsel」,旨在利用 AI 來審查文件,幫助處理法律研究備忘錄,準備取證和分析合同。Casetext也是最早被授權使用GPT-4模型的公司之一,也就是說,Casetext是和OpenAI合作,用GPT-4作為CoCounsel的基礎設施後端。

在法律垂直賽道還有一個備受關注的公司叫做Harvey,這家公司在去年12月獲得了OpenAI等機構500萬美元的投資,自己打造了垂直的大模型,可以協助進行合同分析、 盡職調查、訴訟和監管合規性等 ,並可以幫助根據數據生成見解、建議和預測。

而就在12月的融資之後,今年4月,Harvey宣布獲得紅衫等基金投資的2100萬美元的A 輪融資,有一些頭部律所,比如說全球第七大律師事務所Allen&Overy,普華永道等已經成為Harvey的客戶。可見,AI也許會很快改變律師事務所的人才資源配置。