AI情報局/AI文檔搜索公司完成融資*大模型最強架構TTT問世.....
* AI文檔搜索公司Hebbia完成1.3億美元融資,a16z領投;奧特曼成立AI健康公司;大模型最強架構TTT問世
融資快報 :
Hebbia 完成 1.3 億美元融資:位於紐約的 AI 初創公司 Hebbia 宣布完成新一輪 1.3 億美元融資,由 a16z 領投,Index Ventures、Google Ventures 以及 Peter Thiel 參投。據悉,Hebbia 目前估值約為 7 億美元,公司成立於 2020 年,其軟件可分析數字化文檔和數據源,包括監管文件、PDF 以及音頻和視頻剪輯,以幫助客戶處理比面向消費者的聊天機器人更復雜的查詢,類似 Glean。
曠視科技MEGVII上交所提交註冊:曠視科技MEGVII以自研視覺感知算法引擎為核心,致力於持續打造在各商業領域的 AIoT 操作系統,以及深度構建具備連接百億物聯網設備能力的生態系統,為 200 多個國家和地區的數十萬開發者提供智能物聯服務及解決方案。近日曠視科技MEGVII上交所提交註冊。
Solidroad獲得 120 萬美元投資:Solidroad 是一個用於招聘、入職和培訓的人工智能平臺。本輪融資由 Dan Kiely(Voxpro 聯合創始人)、Jack Pierce(Wayflyer 聯合創始人)、Ciaran Lee(Intercom 聯合創始人)、CPL 的 Anne Heraty 和前 PayPal 高管 Louise Phelan 領投。
Roboat籌集55萬歐元融資:阿姆斯特丹自主船舶技術公司Roboat從LUMO Labs和SHIFT Invest籌集了55萬歐元的資金。該公司開發了人工智能軟件,可以在交通繁忙的荷蘭內陸水道中航行,集成到新車中,也可以改裝到負責載人、貨物運送和廢物收集的商船上。
AI視頻初創公司Captions融資6000萬美元:最近 RunwayML正在籌集大量資金。現在,由前微軟工程師Gaurav Misra創立的人工智能視頻初創公司Captions已獲得6000萬美元的C輪融資。由Index Ventures領投的這筆投資對該公司的估值為5億美元。
中國國內情報:
中國電信發布星辰軟件工廠,產品文檔生成代碼:
中電信人工智能科技有限公司和中國電信人工智能研究院發布星辰大模型・軟件工廠的產品,並稱這是國內首款破局性 AI 開發工具。星辰軟件工廠利用最新的多模態大模型技術,自動生成前後端代碼,並進行自主測試和糾錯,形成軟件開發的全自動流水線。用戶僅需簡單寫下產品文檔,大模型可根據文檔內容生成代碼,在軟件工廠內一鍵部署並上線。
騰訊智影小程序上線 AI 視頻功能,限時免費一鍵生成風格化視頻:
此功能限時免費(未公布收費價格)。視頻風格化就是在原視頻的基礎上進行風格化處理,只需導入視頻並一鍵「變身」,就能快速生成風格化視頻(支持 10s 視頻),智影 AI 提供了多種模板。
國內首個 HPC 源碼倉庫「源碼之家」上線國家超算互聯網平臺:
「源碼之家」提供的源碼商品分為人工智能、工業仿真、氣象環境、化學材料等 11 個類別,覆蓋 193 款 HPC 軟件,支持用戶一鍵下載所需源碼,並提供便捷輔助編譯工具,目前已涵蓋超四千種源碼商品。
2023 下半年中國智算服務市場規模達 114.1 億元:
國際數據公司 IDC 發布報告顯示2023 下半年中國智算服務市場整體規模達到 114.1 億元人民幣,同比增長 85.8%。智算集成服務市場呈現出一超多強的特征,華為依托其領先的芯片能力及全棧服務能力,市場份額領先,前五名還有新華三、百度、寒武紀和中國電子雲。
GenAI IaaS 市場份額則較為平均,前五名分別為字節火山引擎、阿裏巴巴、商湯科技、百度以及騰訊。
* 中科院院士領銜推出大模型的第 3 種記憶:
中科院院士鄂維南領導的上海算法創新研究院團隊提出了一種新型大模型記憶格式Memory, 更加高效和成本更低。該模型受人腦記憶機製啟發,區分了顯式記憶、隱式記憶和外部信息三種記憶形式,並將其應用於大模型中。實驗結果表明,Memory 模型在推理速度、減少 「幻覺」 問題以及在專業領域任務上的表現均優於傳統 RAG 方法。此外,Memory 模型在 HuggingFace 排行榜上的評測結果顯示,顯式記憶的引入提高了平均分數 2.51%,有效地提升了模型的性能。
論文:https://arxiv.org/abs/2407.01178
中國AI融資總額達37762億元:
《2024世界人工智能法治藍皮書》報告顯示,2023年,中國 AI 核心產業規模達到5784億元,同比增速為13.9%。行業投資方面,去年中國 AI 行業已發生投融資事件815起,融資總額達2631億元,投資事件有所下降但融資總額有所提升。
目前,中國 AI 行業的投資主體主要以產業投資類為主,包括啟明創投、紅杉資本、順為資本、阿裏、騰訊、百度等。截至2023年12月14日,中國 AI 行業總計有10110起投資事件發生,總計融資金額達37762億元人民幣。
* 清華團隊開發CharacterGen,單圖高效生成3D角色:
清華大學研究團隊開發的CharacterGen框架在3D角色生成領域取得重大突破。該技術能從單張圖像創建具有一致姿勢和高質量外觀的3D角色模型,並支持後續骨架綁定和動畫製作。CharacterGen采用基於圖像的多視角擴散模型校準姿勢,結合變換器的稀疏視圖重建模型創建詳細3D模型。研究團隊還開發了特殊的紋理生成策略和專用訓練數據集。實驗結果表明,CharacterGen在生成高質量3D角色方面表現出色,為遊戲和動畫製作等領域帶來新的可能性。該項目將於SIGGRAPH 2024發布,相關代碼和數據集也將開源。
?https://charactergen.github.io/
* MOSS大模型項目負責人邱錫鵬稱大模型的下個階段是「世界模型」:
復旦大學教授、MOSS大模型項目負責人邱錫鵬認為,當前,大語言模型還存在很多不足。比如在落地階段,大語言模型的會遇到難以解決的「幻覺問題」,即生成不真實、不可靠、不存在的信息。邱錫鵬將大模型的未來趨勢和發展方向,總結為觀察世界、產生動作,並走向「世界模型」。
* 中國工程院院士鄭緯民稱國產AI芯片核心問題是生態不夠好,如果生態好60%的性能也有人用:
中國工程院院士、清華大學計算機科學與技術系教授鄭緯民表示,相比英偉達,國產 AI 芯片系統生態不夠好。什麽是生態系統好呢?鄭緯民給出的定義是,如果原來用英偉達寫了一個AI CUDA軟件,現在很容易移植到國產系統上,寫起來的方法跟原來差不多,就叫生態好。如果移植起來,沒有一年兩年移不過來,那就是不好。
國際情報:
OpenAI CEO 奧特曼與赫芬頓成立新的AI健康公司:
OpenAI CEO Sam Altman 與AI醫療健康巨頭Thrive Global的CEO Arianna Huffington 在《時代》宣布Thrive AI Health公司的成立。Thrive AI Health的目標是打造一個個性化「AI健康教練」,以手機App形式呈現。目前公司CEO是谷歌前健康和可穿戴設備負責人DeCarlos Love,OpenAI創業基金和Thrive Global是主要投資方。
* 大模型最強架構TTT問世,Transformer一夜推翻:
斯坦福、UCSD、UC 伯克利和 Meta 研究人員提出的新型大模型架構 Test-Time-Training layers。TTT 方法通過對輸入 token 進行梯度下降來壓縮上下文,代替了註意力機製,並具有線性復雜度。這一項目研究了一年多,最終的研究成果顯示 TTT-Linear 和 TTT-MLP 在性能上超越了 Transformer 和 Mamba。TTT 層的核心思想是使用自監督學習將歷史上下文壓縮成一個隱藏狀態,這種隱藏狀態可以是線性模型、小型神經網絡等形式。
論文地址:https://arxiv.org/abs/2407.04620
Groq推出閃電般快速的LLM引擎,僅四個月吸引28萬開發者:
該引擎讓開發者們可以直接進行大型語言模型的快速查詢和任務執行。引擎使用Meta的開源LLama3-8b-8192LLM,默認支持其他模型,每秒可處理1256.54個標記,遠超Nvidia等公司的GPU芯片。 Groq 還為開發者提供了將應用程序從 OpenAI 切換到 Groq 的簡單方式,目前已有超過 28 萬名開發者使用了其服務。CEO Ross 預測,到明年,全球一半以上的推理計算將在 Groq 的芯片上運行。
* Meta AI為移動設備開發緊湊型語言模型MobileLLM:
MobileLLM是為智能手機和其他資源受限的設備設計高效語言模型的新方法。該研究挑戰了有關有效AI模型規模的假設,取得了2.7%到4.3%的性能提升。MobileLLM的開發符合人們對更高效AI模型的需求,尚未向公眾開放,但已開源預訓練代碼。
* OpenAI中國禁令不影響微軟Azure中國版:
只要註冊微軟的Azure雲服務,OpenAI的對話式人工智能模型可供中國企業使用,該服務是通過一家本地合資企業在中國運營的。微軟在其公開聲明中明確表示,Azure中國是與本地公司21Vianet共同運營的合資企業,在中國提供Azure的OpenAI服務。
* Poe社交平臺推出Previews功能,AI編程可視化:
該功能允許用戶在聊天中直接生成Web應用程序並與之實時互動。比如,通過聊天生成的小遊戲、互動動畫、拖拽界面或者數據圖表等。類似Claude的Artifacts功能,Poe平臺還推出了其他多種功能,比如多個機器人一起聊天、文件上傳和視頻輸入等。適用於擅長編碼的大型語言模型,如Claude3.5Sonnet、GPT-4和Gemini1.5Pro等。
* 無人車團隊推出電影級視覺AI特效Odyssey,鏡頭堪比好萊塢大片:
Odyssey能生成好萊塢級別的山脈、平原、植被、海洋、河流等故事鏡頭。它最大的亮點在於,完全掌控視覺敘事核心層的每個生成元素和方面。突破了現有視頻AI的可控性障礙。
Odyssey兩位核心創始人都來自自動駕駛領域。CEO Oliver Cameron是60多家DeepTech初創公司的天使投資人,早期一直從事自動駕駛汽車領域。CTO Jeff Hawke負責Odyssey可定向視覺AI,研究領域涉及機器學習、計算機視覺、機器人等。
* 蘋果首款支持 Apple Intelligence 的智能家居設備將是一款桌面機器人:
古爾曼透露,蘋果首款搭載 Apple Intelligence 功能的智能家居設備將是一款全新的桌面機器人。古爾曼表示,期待在現有蘋果智能家居設備上使用 Apple Intelligence 功能的用戶可能要失望了,他們需要等待蘋果推出 AI 驅動的桌面機器人產品。
* Gartner報告稱64%受訪者不希望客服系統部署 AI:
市場調查機構 Gartner 調查報告表示 64% 的受訪客戶不希望客服使用 AI。 53% 的客戶如果發現某家公司客服使用 AI,會考慮轉向競爭對手。客戶認為客服系統引入 AI 之後,聯系到人工客服變得更加困難,另一方面的擔憂是 AI 提供錯誤答案。
* 谷歌前董事長稱中國AI發展只落後美國2年:
谷歌前董事長埃裏克·施密特表示,中國AI並沒有復製美國的發展速度,中國AI只落後美國兩年,兩年並不算長。「芯片禁運」是征向中國的「成本稅」,但這些並不能起決定性作用。
更多國際情報:
電信公司部署 AI 遏製詐騙電話:AI 聊天機器人 Ibrahim,能夠與詐騙者的 AI 進行對話,延長通話時長。達利・卡法爾教授團隊還推出了 Apate AI 工具,能了解騙子的詐騙技巧,幫助警告人們並為執法部門提供情報
華頓證券國際推出AI-IRO,利用AI提升投資者關系管理的軟件:該產品旨在通過利用資本市場大數據,提高上市公司的投資者關系工作效率,並提升企業品牌形象。使用 Claude 系列大語言模型和先進的技術支持,結合矢量知識庫、文本轉語音和語音轉文本技術。
Xinsir開源Controlnet++模型,支持Openpose、Canny等十多種條件控製:該模型基於ControlNet架構,新增模塊支持超過十種不同的控製類型,提供了多種控製條件下的圖像生成示例。
Product Hunt 熱榜,旅行規劃Wanderboat AI
Wanderboat AI 是一個提供個性化旅遊建議的旅行規劃網站,用戶可通過與 AI 聊天或上傳旅遊指南來獲取定製旅行行程,簡化了旅行規劃過程。Wanderboat AI 涵蓋了從著名景點到當地特色活動的廣泛內容,旨在為各類旅行者提供全面的旅遊信息。但實際效果和用戶接受度仍有待觀察。
?https://wanderboat.ai/?ref=producthunt
* GitHub Trending 熱榜,MindsDB
MindsDB 是一個簡化企業級 AI 應用開發和部署過程的開源平臺,它集成了多種數據源和 AI/ML 框架,允許開發者使用SQL語法和各種API來創建、優化和部署機器學習模型。MindsDB提供了豐富的功能,包括模型微調、知識庫構建、語義搜索、實時預測和AI代理創建等,能幫助企業從數據中提取價值。但它的實際效果和適用性可能因企業的具體需求和技術能力而異,企業在選擇使用時,仍需考慮其與現有系統的兼容性、學習曲線以及長期維護等因素。
?https://mindsdb.com/
開發者推薦 :
1.ai-ng/swift:新一代AI語音助手項目亮相
ai-ng/swift項目是一款基於Groq和Cartesia技術的高速AI語音助手。該項目利用Groq進行快速推理,結合OpenAI Whisper進行語音轉錄和Meta Llama 3生成文本響應。同時,它采用Cartesia的Sonic語音模型實現快速語音合成,並將合成的語音流式傳輸到前端。
項目還整合了語音活動檢測技術,能夠精確捕捉用戶的說話時機。整個應用程序使用TypeScript編寫,基於Next.js框架開發,並已成功部署到Vercel平臺。
?https://github.com/ai-ng/swift
?https://swift-ai.vercel.app/
2.UltraPixel:超大分辨率圖像生成神器
UltraPixel是一款能夠生成超高分辨率圖像的黑科技。通過Stable cascade訓練和微調,支持直接生成1K到6K分辨率的圖片。其技術手段包括隱式神經表示和尺度感知歸一化層,保持高度細節和真實感。同時,在最小空間內高效處理,參數利用率高達97%,提高訓練和推理效率。
?https://jingjingrenabc.github.io/ultrapixel/
3.QualityPrompts:58種提示技術助力AI交互優化
QualityPrompts的Python庫,實現了58種源自OpenAI和Microsoft調查的提示技術。該庫支持通過pip安裝,允許用戶定義指令和輸出格式,並能自動搜索相關示例。QualityPrompts提供了多種高級提示技術,如System2Attention和Tabular Chain of Thought Prompting,旨在提高與語言模型的交互效果。雖然項目采用MIT許可證並鼓勵社區參與,但目前尚未發布正式版本,其實際應用效果還有待進一步驗證。
?https://github.com/sarthakrastogi/quality-prompts
熱議話題 :
* AI新動向:企業數據或成發展新引擎
近期研究顯示,以消費者互聯網為來源的公共數據采集正逐漸接近極限,而企業專有數據可能成為AI創新的新動力。數據顯示,Zoom每年產生超2萬億分鐘的會議記錄,遠超YouTube每年1.5億小時的內容;Ironclad每年處理超10億份文檔;Slack每周傳遞超10億條消息。這些海量的專有商業數據不僅數量龐大,而且具有獨特價值,可能為AI技術帶來新的發展機遇。
與此同時,B2B企業應用展現出強大的變現能力。數據對比顯示,Salesforce Sales Cloud的每用戶月收入高達$80,遠超消費者平臺如Meta的$3.73和TikTok的$0.85。這一差異凸顯了企業數據的商業價值,可能會吸引更多AI創新聚焦於企業應用領域。
然而,如何在保護隱私和商業機密的同時有效利用這些數據,將是未來AI發展面臨的重要挑戰。隨著技術的進步和政策的完善,企業數據有望成為推動AI技術突破的新引擎。---[雷峰網/AI情報局]