01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

免費 AI “神器”系列第八彈:全球首個 AI 軟件工程師Devin來襲;阿里版Sora模型爆火

2024031317:58

圖片來源:unsplash

近期,通用人工智能(AGI)領域又湧現出多款創意十足的新應用。

今天,钛媒體AGI梳理了免費 AI “神器”系列第八彈,共五款,其中不少産品再一次拓寬了我們對AI的想象力。

    * 全球首個最強 AI 軟件工程師——Cognition Labs Devin
    * "阿里版Sora"——AtomoVideo
    * 條漫生成神器——Dashtoon Studio
    * AI版“大家來找茬”——Anything in Any Scene
    * AI頭像生成器——PhotoMaker
    * 3D生成模型——TripoSR

1、全球首個最強 AI 軟件工程師——Cognition Labs Devin

産品信息:今天,華人團隊創立的Cognition Labs推出全球第一個 AI 軟件工程師 Devin,也是目前最強的 AI 軟件工程師,引發網絡關注。

産品功能:不同于GitHub Copilot等 AI 編程助手,Devin並非單純輔助的角色,而是能夠完全獨立、端到端地完成整個開發項目,包括從編寫代碼、修複 Bug 到最終執行的完整編程生命周期。

Cognition表示,它可以計劃和執行需要數千個決策的複雜工程任務,可以在每一步中回憶相關的上下文,隨著時間的推移學習並糾正錯誤,以及主動與用戶協作的能力;而且 Cognition 還爲 Devin 配備了通用的開發人員工具,包括 shell、代碼編輯器和沙盒計算環境中的浏覽器——人類完成工作所需的一切。



數據顯示,根據他們對 Devin 在 SWE-bench 上做的測評,Devin不僅可以自動完成任務,還可以在幾分鍾內自行編寫整個應用程序,並且自動正確解決了 13.86% 的問題,遠遠超過Claude 2(4.80%)、Llama、GPT-4(1.74%,3.5測試結果是 0%)。




隨著Devin的推出,3月13日,Cognition Labs宣布完成2100萬美元的A輪融資,由Funders Fund領投,Stripe創始人Patrick Collison和John Collison,Twitter 前高管埃拉德·吉爾 (Elad Gil) 等跟投。目前,Cognition創始團隊共有10個人,華人面孔居多。

項目地址:https://www.cognition-labs.com/blog

2、"阿里版Sora"——AtomoVideo

産品信息:AtomoVideo是一款由阿里巴巴推出的高保真圖生視頻(I2V,Image to Video)框架,能通過輸入圖片生成對應的動態視頻。

産品功能:用戶向AtomoVideo輸入一張高清圖片後,即可生成1~2秒的動態視頻。視頻內容不僅與初始圖片的細節與風格保持高度一致,而且動作也相對流暢,不會出現突兀的跳轉。



AtomoVideo演示視頻

此外,AtomoVideo不僅能與現有的多種文生圖(T2I)模型兼容,還能夠通過叠代預測後續幀的方式,支持長視頻序列的生成。

據開發團隊介紹,AtomoVideo生成的視頻的動作流暢度和時間連貫性,都要明顯優于明星視頻生産産品Pika與Runway。他們使用了多粒度圖像注入技術,能使AtomoVideo生成的視頻與給定圖像保持高度的一致。

AtomoVideo一經推出便受到不少關注,被譽爲“阿里版Sora”。不過,目前阿里團隊只發布了AtomoVideo的論文和演示視頻,並未開放在線體驗地址。

項目地址:https://huggingface.co/papers/2403.01800

3、條漫生成“神器”——Dashtoon Studio

産品信息:Dashtoon Studio是一款由初創公司Dashtoon推出的AI漫畫生成應用,能根據文本快速生成相應的漫畫。

産品功能:用戶只需在Dashtoon Studio平台的文本框,輸入一段包含人物與情節的文本,等待2分鍾左右就能生成一話漫畫。Dashtoon Studio允許用戶自由設定漫畫人物的形象與漫畫風格,創作有個人特色的漫畫作品。




Dashtoon Studio允許用戶自由設定漫畫人物的形象與漫畫風格

Dashtoon表示,這一工具可以大幅縮短漫畫的制作時間。此前創作一話漫畫可能需要40~50小時,現在只需5~6小時。

公開資料顯示,Dashtoon由Sanidhya Narain、Lalith Gudipati和Soumyadeep Mukherjee于 2022年12月創立,前兩者曾是音頻娛樂公司Pocket FM的創始團隊成員。

2023年11月,Dashtoon宣布,已完成500萬美元種子輪融資,印度風投公司Matrix Partners India和Stellaris Venture Partners領投。此輪資金計劃將用于Dashtoon在未來幾個月內深化其人工智能研究、推進産品開發和內容制作。

體驗地址:https://dashtoon.com/

4、AI版“大家來找茬”——Anything in Any Scene

産品信息:Anything in Any Scene是一款由小鵬汽車推出、能將任何對象無縫插入到動態視頻中的視頻模擬框架。

産品功能:Anything in Any Scene能將真實的物體集成到給定的場景視頻中,並放置在適當的位置以確保幾何真實感,還能根據視頻裏的天氣狀況和光照條件模擬真實陰影,並采用風格轉換網絡來細化最終的視頻輸出,以最大限度地提高被插入物體與視頻的融合度。




視頻中被紅框框出的物體就是被Anything in Any Scene巧妙安插進去的。

Anything in Any Scene的開發團隊表示,該框架可以用于電影制作,例如替換掉一些拍攝成本較高的電影場景,或模擬現實世界很少發生但又比較重要的場景。

項目地址:https://anythinginanyscene.github.io/

5、AI頭像生成器——PhotoMaker

産品信息:PhotoMaker是一款由騰訊開發,可以根據文本描述生成多種風格照片的AI生成技術。

産品功能:用戶可以在PhotoMaker上輸入想定制的人的多張照片,然後結合文本描述,生成不同風格的個人照片。還可以把多張人物照片特征混合後,生成個性化的人物圖像,比如將蘋果公司CEO蒂姆·庫克和OpenAI首席執行官薩姆·奧爾特曼照片混合,再比如生成圖靈獎得主楊立昆(Yann LeCun)配上各種電影畫面的 AI 合成圖片,形成擁有全新面部特征的人物。


PhotoMaker的生成效果示意圖

PhotoMaker甚至可以將人物的黑白老照片變成彩色高清照片,還能通過替換關鍵詞,改變原照片人物的年齡和性別。截至發稿,PhotoMaker在Github上已累積超過7700顆星。

體驗地址:https://huggingface.co/spaces/TencentARC/PhotoMaker

6、3D生成模型——TripoSR

産品信息:TripoSR是一款由Stability AI和華人團隊VAST聯合推出的3D生成模型。

産品功能:用戶只需將圖像上傳到TripoSR上,等待數秒後就能生成對應的3D模型圖。不需要任何prompt和專業知識,甚至不需要依賴GPU。



TripoSR生成的3D模型圖

開發團隊聲稱,這款3D生成模型能爲遊戲、工業設計和建築專業人士提供用于可視化3D對象的響應式輸出。

體驗地址:https://huggingface.co/spaces/stabilityai/TripoSR

---(钛媒體/作者 : 任穎文、林志佳,*編輯 : 林志佳|钛媒體AGI)