01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

免費 AI “神器”系列第六彈:Stability AI三款圖片視頻震撼發布,金融助手Finpilot輕鬆分析阿里騰訊業績

2024022614:09


近期,生成式人工智能(AIGC)領域又湧現出多款創意十足的新應用。

今天,钛媒體AGI梳理了免費 AI “神器”系列第六彈,共五款,其中不少産品再一次拓寬了我們對AI的想象力。

    .AI視頻生成平台——Stable Video
    .跨模態大預言模型——AnyGPT
    .實時人臉互換直播工具——SwapStream
    .聲畫分離模型——PixelPlayer
    .金融分析師的人工智能助手——Finpilot

1、Stability AI三連發:Stable Diffusion 3、Stable Video、Creative Upscaler

繼OpenAI發布的視頻生成模型Sora風靡全球之後,AI 文生圖和視頻領域競爭加速,行業“鼻祖”、生成式 AI 技術公司Stability AI 2月22日-23日連續推出三款新産品:Stable Diffusion 3、Stable Video、Creative Upscaler,迎戰Sora。

産品信息:首先,Stable Diffusion 3是目前全球最強大的文生圖模型,生圖質量有很大改進,支持多主題提示,參數量從 800M 到 8B 不等,支持手機、電腦等便攜式設備使用,大大降低AI大模型的使用門檻。

其次,Stable Video是基于Stable Video Diffusion技術推出的 AI 視頻生成平台,支持生成高質量視頻,新增了鏡頭控制等功能,用戶可以通過該工具快速創建高質量的視頻內容,無需專業技能和複雜的軟件,隨時用 AI 生成視頻。

最後,Creative Upscaler是該公司新推出的 AI 圖像提升增強工具,可以將圖像升級到4k分辨率,並創造以前沒有的新細節等,從而賦予圖像新生命。

産品功能:Stable Diffusion 3與之前版本一致,采用了與Sora一樣的Diffusion Transformer架構,直接生成逼真的 AI 圖片,不過目前還沒有全面開放,權重也沒有公布。團隊提到,他們正在采取一些安全措施,防止不法分子濫用。想要嘗鮮的用戶可以通過https://stability.ai/stablediffusion3申請。

Stable Video支持基于 AI 的圖生視頻和文生視頻,比上一代升級優化了畫面穩定性、運動幅度、畫面細節處理等功能,以及新增鏡頭控制能力。如今,用戶可以將記憶轉化爲動態影像,或通過文字創造全新的故事,可用于商業宣傳視頻、教學視頻、産品展示等更多場景。

Stable Video付費方面,公測期間,用戶每日登錄都有150的積分,可免費用來生成15個視頻,若用戶有制作大量視頻需求也可按需購買。目前主要有兩種付費標准:一是10美元購買500積分,可制作50個視頻,二是50美元購買3000積分,可制作300個視頻。

最後是Creative Upscaler應用工具。其擁有分辨率提升、細節創造、創造力調整、面向高質量轉換、原始圖像保留、生命注入等獨特的 AI 技術功能。與大多數同類 AI 産品不同,Creative Upscaler結合文本提示和圖像,能創造出原本不存在的新細節,爲圖像賦予新的生命和可能性。




體驗地址:https://www.stablevideo.com/

https://creator.nightcafe.studio/stability-ai-creative-upscaler

2、實時人臉互換直播工具——SwapStream

産品信息:SwapStream是一款基于 AI 與雲技術的實時人臉互換直播工具,用戶無需下載,可直接通過浏覽器實現人臉互換直播。



産品功能:SwapStream可將任意人臉實時互換到直播視頻中,同時支持多個直播平台同步,還可添加自定義RTMP直播通道等。使用簡單、擴展性強,適用于各類直播場景,主要受衆人群包含需要進行人臉互換的直播、需要快速設置直播環境的用戶以及需要擴展直播範圍的主播等。

體驗地址:https://www.swapstream.ai/

3、跨模態大語言模型——AnyGPT

産品信息:AnyGPT是由複旦大學、上海人工智能實驗室等機構聯合推出的一款多模態大語言模型,該模型采用離散表示技術,通過在各模態輸入上進行離散標記,實現了多模態信息的統一處理。

産品功能:首先AnyGPT可進行任何模態的輸入和輸出,無論是文本、圖像、音頻或是視頻都支持輸入,並可生成任何模態的輸出。

其次,AnyGPT可進行多模態理解和生成,能從一個模態接收輸入並在另一個或多個模態中生成輸出。如它可以從文本生成音樂,從語音生成圖片等。

最後,AnyGPT可實現任意模態轉換,如將語音指令轉換成文本+圖片+音樂的響應,或將語音+音樂轉換成圖像+文本的響應。


項目及演示地址:https://junzhan2000.github.io/AnyGPT.github.io/

4、聲畫分離模型——PixelPlayer

産品信息:PixelPlayer 是一款聲畫分離模型,能通過分析大量未標記的視頻,識別視頻中哪些區域在産生聲音,並將聲音分離成代表每個像素聲音的組件。該模型由麻省理工學院計算機科學與人工智能實驗室開發。

産品功能:PixelPlayer 能處理和識別人們演奏不同樂器的視頻,並對單聲道音頻輸入進行音視頻源分離和定位,最終實現將聲音信號分割成多個通道,每個通道對應一個樂器類別,並能爲視頻中的每個像素指定一個獨立的音頻波形。


在PixelPlayer開發團隊的演示視頻中,點擊視頻上的不同聲源區域,會發出不同的聲音。

PixelPlayer爲音視頻編輯、多媒體內容制作、增強現實應用等領域提供了強大的工具,使得獨立調整視頻中不同聲音源音量、去除或增強特定聲音源等操作成爲可能。截至發稿,PixelPlayer在Github上已累積351顆星。

體驗地址:http://sound-of-pixels.csail.mit.edu/

5、金融分析師的人工智能助手——Finpilot

産品信息:Finpilot是一款由西雅圖初創公司Finpilot推出、專門爲金融分析師設計的 AI 助手應用,以生成式 AI 技術爲核心,旨在協助金融分析師進行研究和解答金融問題。

産品功能:Finpilot可幫助分析師快速搜集和分析金融數據,股票分析,編寫報告,以及進行數據可視化。同時,Finpilot提供可驗證的信息來源,保證數據研究質量。用戶只需與Finpilot對話,即可獲取對應的金融或財務數據,從而簡化金融分析工作流程,大幅提高工作效率。

例如,通過問答,用戶可獲取阿裏巴巴、騰訊、HAL等公司分部過去五年的收入數據,以及比較SNOW、CRWD等多個公司淨留存率等。


另外,2月23日,Finpilot還官宣完成由Madrona領投的400萬美元的融資。Finpilot表示,本輪融資的資金主要用于擴大技術團隊和升級軟件功能,包括引入更先進的自然語言處理技術、提高ChatGPT在金融領域的應用和智能水平,以及部分用于市場推廣,以增強軟件在金融行業的影響力。

體驗地址:https://www.finpilotai.com/

---(钛媒體/作者 : 章橙*編輯 : 林志佳|钛媒體AGI)