免費AI“神器”系列第九彈:“字節版Sora”突然爆火;AI 代碼軟件走紅網絡
近期,生成式人工智能(AIGC)領域又湧現出多款創意十足的新應用。
今天,钛媒體AGI梳理了免費 AI “神器”系列第九彈,共五款,其中不少産品再一次拓寬了我們對AI的想象力。
*字節推出的AI視頻生成模型——AnimateDiff-Lightning
*開源SDXL動漫模型——Animagine XL 3.1
*視頻自動生成音效的AI工具——Optimizer AI
*通過攝像頭能實現在紙上彈鋼琴的AI應用——Paper Piano 紙鋼琴
*截圖轉代碼應用——screenshot-to-code
1、字節版Sora:AnimateDiff-Lightning AI視頻模型
産品信息:AnimateDiff-Lightning是字節跳動推出的文生視頻大模型,該模型是從AnimateDiff SD1.5v2中提煉出來的,包含了1步、2步、4步和8步提煉模型的版本。其中,2步、4步和8步模型的生成質量非常好,爲視頻創作者帶來更多了想象和助力。
産品功能:AnimateDiff-Lightning能夠根據文本描述生成視頻,比起原來的AnimateDiff模型,速度提升十倍以上。同時還可以與多種不同風格的基礎模型結合使用,將現有視頻轉換成不同風格的視頻。比如將現實風格視頻轉換成動漫卡通風格,以滿足不同視頻風格創作需要。此外,AnimateDiff-Lightning支持多步驟蒸餾模型,提供1步、2步、4步和8步的蒸餾模型,用戶可以根據自己的需求,在生成視頻的速度和質量之間做出選擇,以平衡生成速度和視頻質量。
體驗地址:https://huggingface.co/ByteDance/AnimateDiff-Lightning?ref=top.aibase.com
論文地址: https://arxiv.org/html/2403.12706v1
2、開源SDXL動漫模型——Animagine XL 3.1
産品信息:Animagine XL3.1是由海藝AI與Cagliostro Lab合作推出的一款開源動漫文生圖模型。相較于V3.0版本,Animagine XL 3.1在各方面都進行顯著的技術性提升,使其對動漫作品和風格的理解更加深入,爲用戶提供更加強大的動漫圖像生成體驗。
産品功能:Animagine XL 3.1能夠根據文本提示生成高質量動漫風格圖像。爲了提高生成結果的准確性,Animagine XL3.1采用了標簽排序的方式,可以更准確地根據輸入的標簽進行生成圖像,提高生成結果准確性。同時,Animagine XL 3.1擁有87萬張圖片的數據集,極大增強了模型對各種動漫角色的識別能力;引入全新概念“美學標簽”,更新了質量和年份標簽,不僅提高了生成圖像的視覺吸引力,也確保圖像風格一致性,符合更高要求的審美質量標准。
此外,Animagine XL3.1還解決了3.0版本中的過曝問題,提高了生成圖像的質量。通過對算法和訓練過程的優化,該模型在生成圖像時,能夠更好地控制圖像的亮度和色彩,從而避免過曝現象的出現。目前V3.0在Civitai的下載量超7萬。
體驗地址:https://huggingface.co/spaces/cagliostrolab/animagine-xl-3.1
模型下載地址:https://huggingface.co/cagliostrolab/animagine-xl-3.1?ref=top.aibase.com
3、視頻生成音效的AI工具——Optimizer AI
産品信息:Optimizer AI是一款可以爲視頻自動生成音效的AI工具,旨在提升遊戲開發者、藝術家和視頻創作者工作效率,通過音效爲視頻增添更多活力。
産品功能:首先,用戶輸入文字提示即可生成適用于視頻中各種場景的聲音和音效,包括遊戲音效、動畫背景音和視頻配樂。用戶還可以通過指定風格標簽(如卡通、恐怖等)來引導生成不同風格的聲音。
其次,Optimizer AI支持聲音效果生成,包括變聲功能,能夠基于一個參考聲音生成多個類似的聲音。
再次,Optimizer AI可以生成用于背景音樂或創建特定氛圍的聲音,並能夠處理和理解文本的信息,保持生成的一致性的同時還可以生成時長更長的聲音效果。
最後,即將推出的視頻到聲音全面生成功能將允許用戶從視頻中直接生成聲音效果,進一步擴展聲音創作的可能性。
官網地址: https://www.optimizerai.xyz/
體驗地址: https://discord.com/invite/bgfnVaaU2n
4、通過攝像頭追蹤在紙上就能彈鋼琴的AI應用——Paper Piano 紙鋼琴
産品信息:Paper Piano(紙鋼琴)是一款通過攝像頭追蹤就能實現在任何一張白紙上彈鋼琴的AI應用。Paper Piano(紙鋼琴)的工作原理是通過在紙上預定義不同區域來代表鋼琴鍵,當攝像頭捕捉到手指觸摸特定區域時,相應的音符將被生成。
産品功能:用戶只需准備兩張A4大小的白紙模擬鋼琴鍵盤,Paper Piano(紙鋼琴)通過攝像頭跟蹤和手指識別技術捕捉用戶的手指移動,從而實現在紙上模擬鋼琴鍵按壓,奏出美妙音樂。值得注意的是,爲了確保手指追蹤的准確性,系統要求在網絡攝像頭的設置上注意角度、高度和距離,同時光線越強,性能也會越好。
不過,目前該項目尚處于支持最多兩根手指的階段,未來將支持更多手指和更高敏感度的訓練模型,爲用戶提供更豐富的演奏體驗。這一技術的發展可能帶來更多有趣的音樂應用,使用戶無需購買真正的鋼琴即可享受演奏的樂趣。
體驗地址:https://github.com/Mayuresh1611/Paper-Piano?ref=top.aibase.com
5、截圖轉代碼應用——screenshot-to-code
産品信息:screenshot-to-code是一種基于人工智能技術的創新工具,旨在幫助開發人員將圖像或界面設計截圖轉換成可執行的代碼。用戶只需上傳截圖,即可獲得整潔的網頁代碼,如HTML、Tailwind CSS和JavaScript等。
産品功能:首先是智能生成代碼,通過集成GPT-4Vision,該應用程序能夠智能地分析截圖並生成相應的HTML、Tailwind CSS和JavaScript代碼,提高用戶寫代碼效率。
其次是DALL-E3生成相似圖像,應用程序不僅能生成代碼,還可以利用DALL-E3生成與原始截圖相似的圖像,增強用戶體驗。
最後是實時代碼更新,用戶可以直接在應用程序中查看生成的代碼,並在需要時通過與AI互動指令,調整樣式或更新缺失的部分,以滿足其需求。
因其簡單、高效的圖轉代碼功能,screenshot-to-code深受開發者和設計者歡迎,截至發稿,該應用在GitHub平台已累計超35000顆星。
體驗地址:https://screenshottocode.com/
---(钛媒體/作者 : 章橙*編輯 : 林志佳|钛媒體AGI)