免費 AI “神器”系列第八彈：全球首個 AI 軟件工程師Devin來襲；阿里版Sora模型爆火

2024031317:58

圖片來源：unsplash

近期，通用人工智能（AGI）領域又湧現出多款創意十足的新應用。

今天，钛媒體AGI梳理了免費 AI “神器”系列第八彈，共五款，其中不少産品再一次拓寬了我們對AI的想象力。

    * 全球首個最強 AI 軟件工程師——Cognition Labs Devin
    * "阿里版Sora"——AtomoVideo
    * 條漫生成神器——Dashtoon Studio
    * AI版“大家來找茬”——Anything in Any Scene
    * AI頭像生成器——PhotoMaker
    * 3D生成模型——TripoSR

1、全球首個最強 AI 軟件工程師——Cognition Labs Devin

産品信息：今天，華人團隊創立的Cognition Labs推出全球第一個 AI 軟件工程師 Devin，也是目前最強的 AI 軟件工程師，引發網絡關注。

産品功能：不同于GitHub Copilot等 AI 編程助手，Devin並非單純輔助的角色，而是能夠完全獨立、端到端地完成整個開發項目，包括從編寫代碼、修複 Bug 到最終執行的完整編程生命周期。

Cognition表示，它可以計劃和執行需要數千個決策的複雜工程任務，可以在每一步中回憶相關的上下文，隨著時間的推移學習並糾正錯誤，以及主動與用戶協作的能力；而且 Cognition 還爲 Devin 配備了通用的開發人員工具，包括 shell、代碼編輯器和沙盒計算環境中的浏覽器——人類完成工作所需的一切。

數據顯示，根據他們對 Devin 在 SWE-bench 上做的測評，Devin不僅可以自動完成任務，還可以在幾分鍾內自行編寫整個應用程序，並且自動正確解決了 13.86% 的問題，遠遠超過Claude 2（4.80%）、Llama、GPT-4（1.74%，3.5測試結果是 0%）。

隨著Devin的推出，3月13日，Cognition Labs宣布完成2100萬美元的A輪融資，由Funders Fund領投，Stripe創始人Patrick Collison和John Collison，Twitter 前高管埃拉德·吉爾 (Elad Gil) 等跟投。目前，Cognition創始團隊共有10個人，華人面孔居多。

項目地址：https://www.cognition-labs.com/blog

2、"阿里版Sora"——AtomoVideo

産品信息：AtomoVideo是一款由阿里巴巴推出的高保真圖生視頻（I2V，Image to Video）框架，能通過輸入圖片生成對應的動態視頻。

産品功能：用戶向AtomoVideo輸入一張高清圖片後，即可生成1~2秒的動態視頻。視頻內容不僅與初始圖片的細節與風格保持高度一致，而且動作也相對流暢，不會出現突兀的跳轉。

AtomoVideo演示視頻

此外，AtomoVideo不僅能與現有的多種文生圖（T2I）模型兼容，還能夠通過叠代預測後續幀的方式，支持長視頻序列的生成。

據開發團隊介紹，AtomoVideo生成的視頻的動作流暢度和時間連貫性，都要明顯優于明星視頻生産産品Pika與Runway。他們使用了多粒度圖像注入技術，能使AtomoVideo生成的視頻與給定圖像保持高度的一致。

AtomoVideo一經推出便受到不少關注，被譽爲“阿里版Sora”。不過，目前阿里團隊只發布了AtomoVideo的論文和演示視頻，並未開放在線體驗地址。

項目地址：https://huggingface.co/papers/2403.01800

3、條漫生成“神器”——Dashtoon Studio

産品信息：Dashtoon Studio是一款由初創公司Dashtoon推出的AI漫畫生成應用，能根據文本快速生成相應的漫畫。

産品功能：用戶只需在Dashtoon Studio平台的文本框，輸入一段包含人物與情節的文本，等待2分鍾左右就能生成一話漫畫。Dashtoon Studio允許用戶自由設定漫畫人物的形象與漫畫風格，創作有個人特色的漫畫作品。

Dashtoon Studio允許用戶自由設定漫畫人物的形象與漫畫風格

Dashtoon表示，這一工具可以大幅縮短漫畫的制作時間。此前創作一話漫畫可能需要40~50小時，現在只需5~6小時。

公開資料顯示，Dashtoon由Sanidhya Narain、Lalith Gudipati和Soumyadeep Mukherjee于 2022年12月創立，前兩者曾是音頻娛樂公司Pocket FM的創始團隊成員。

2023年11月，Dashtoon宣布，已完成500萬美元種子輪融資，印度風投公司Matrix Partners India和Stellaris Venture Partners領投。此輪資金計劃將用于Dashtoon在未來幾個月內深化其人工智能研究、推進産品開發和內容制作。

體驗地址：https://dashtoon.com/

4、AI版“大家來找茬”——Anything in Any Scene

産品信息：Anything in Any Scene是一款由小鵬汽車推出、能將任何對象無縫插入到動態視頻中的視頻模擬框架。

産品功能：Anything in Any Scene能將真實的物體集成到給定的場景視頻中，並放置在適當的位置以確保幾何真實感，還能根據視頻裏的天氣狀況和光照條件模擬真實陰影，並采用風格轉換網絡來細化最終的視頻輸出，以最大限度地提高被插入物體與視頻的融合度。

視頻中被紅框框出的物體就是被Anything in Any Scene巧妙安插進去的。

Anything in Any Scene的開發團隊表示，該框架可以用于電影制作，例如替換掉一些拍攝成本較高的電影場景，或模擬現實世界很少發生但又比較重要的場景。

項目地址：https://anythinginanyscene.github.io/

5、AI頭像生成器——PhotoMaker

産品信息：PhotoMaker是一款由騰訊開發，可以根據文本描述生成多種風格照片的AI生成技術。

産品功能：用戶可以在PhotoMaker上輸入想定制的人的多張照片，然後結合文本描述，生成不同風格的個人照片。還可以把多張人物照片特征混合後，生成個性化的人物圖像，比如將蘋果公司CEO蒂姆·庫克和OpenAI首席執行官薩姆·奧爾特曼照片混合，再比如生成圖靈獎得主楊立昆（Yann LeCun）配上各種電影畫面的 AI 合成圖片，形成擁有全新面部特征的人物。

PhotoMaker的生成效果示意圖

PhotoMaker甚至可以將人物的黑白老照片變成彩色高清照片，還能通過替換關鍵詞，改變原照片人物的年齡和性別。截至發稿，PhotoMaker在Github上已累積超過7700顆星。

體驗地址：https://huggingface.co/spaces/TencentARC/PhotoMaker

6、3D生成模型——TripoSR

産品信息：TripoSR是一款由Stability AI和華人團隊VAST聯合推出的3D生成模型。

産品功能：用戶只需將圖像上傳到TripoSR上，等待數秒後就能生成對應的3D模型圖。不需要任何prompt和專業知識，甚至不需要依賴GPU。

TripoSR生成的3D模型圖

開發團隊聲稱，這款3D生成模型能爲遊戲、工業設計和建築專業人士提供用于可視化3D對象的響應式輸出。

體驗地址：https://huggingface.co/spaces/stabilityai/TripoSR

---（钛媒體/作者 : 任穎文、林志佳，*編輯 : 林志佳｜钛媒體AGI）

我要留言

免費 AI “神器”系列第八彈：全球首個 AI 軟件工程師Devin來襲；阿里版Sora模型爆火

印度，不得不撤軍了！

美國AI軟件獨角獸CEO預測：明年英偉達GPU芯片價格將會暴跌，甚至變得不值錢

印度，不得不撤軍了！

美國AI軟件獨角獸CEO預測：明年英偉達GPU芯片價格將會暴跌，甚至變得不值錢