01-神魔宇宙 ***宇宙天國首部曲 彌勒天書閣 https://maitreya-books.com/ 神話從來就不是怪力亂神,而是原始先民在日常生活情況的觀察之中,所建立的真實認知。唯有相信神話中的真實,才能感受到神話的詩意隱喻背後,所具有的神聖力量。打開你的想像,打開你的相信,你才能知道神話告訴了你什麼宇宙生命的資訊。 生命起源於宇宙之中,生長於宇宙之中,結束於宇宙之中,因此,宇宙的起源就是生命背景的起源。生命形成的每一個階段,其實都在述說著生命的本能,也就是生命本就存在的一種力量,在此雖是說明一種狀況,然而將這狀況投射在生命的生活行動之中,你就會明白自己究竟有哪些不可思議的本能!

免費AI「神器」第十三彈:會20種語言的數字人爆火.....

2024041417:32

免費AI「神器」第十三彈:會20種語言的數字人爆火;機器人能提前0.8秒預測人類表情



(圖片來源:unsplash)

近期,生成式人工智能(AIGC)領域又湧現出多款創意十足的新應用。

今天,鈦媒體AGI梳理了免費 AI 「神器」系列第十三彈,共五款,其中不少產品再一次拓寬了我們對AI的想象力。

    *會20種語言的克隆數字人——Digen

    *能模仿人類表情的人形機器人——EMO

    *Domo AI 新功能上線:能讓靜態人像動起來

    *吊打Midjourney的AI文生圖工具——Ideogram

    *文生圖框架——LaVi-Bridge

1、會20種語言的克隆數字人——Digen AI

產品信息:Digen是由Digen AI研發的全新克隆數字人工具產品,稱是利用生成式 AI 技術創建面向未來的視頻,支持多達20種語言、40+種聲音,手勢、口型和語調全部同步一致,視頻效果比較逼真。



產品功能:用戶可通過官網申請內測,使用時免費進行個性化頭像生成,大約需要5-7天時間,隨後可以進行視頻編輯和生成等操作,最終可以實現數字人視頻狀態,聲稱為Digen in Real Motion 1.0。

目前,Digen包括免費版、創作者版、專業版三個版本,後兩者每月計費分別為9.9 美元、19.9美元,如果按年訂閱價格會更低一些。公司稱,免費計劃的訂閱者不受任何時間限製,但每月只能製作總長度為2分鐘的視頻,視頻數量沒有限製。

有分析稱,Digen是Sora、Heygen、PIKA、Runway等產品的強有力競品之一。

用戶可通過https://digen.ai填寫信息申請內測資格。

2、能模仿人類表情的機器人——EMO

產品信息:哥倫比亞大學創新機器實驗室近日推出一款可以預測人的表情,並能與人類同步做出表情的人臉機器人。這款機器人采用自我監督學習框架,運作原理類似於人類通過照鏡子來練習面部表情。



產品功能:EMO可以在人類微笑前839毫秒預測即將到來的微笑,並通過模型與人類同時表達微笑。此外,Emo還可以預測悲傷、憤怒和驚訝等表情,還能與人類進行眼神互動,但目前還不能做出人類的所有表情。

據了解,Emo的眼睛裏裝有攝像頭,矽膠皮膚下有26個電機,類似於人類面部的肌肉,可以為機器人的面部表情提供動力。另外,該機器人使用兩個神經網絡,一個用來觀察人臉並預測表情,另一個研究如何在機器人臉上產生表情。第一個神經網絡通過視頻網站上的視頻進行訓練,第二個神經網絡讓機器人通過實時攝像機觀看自己做的表情來訓練。

團隊研究人員表示,未來,他們還將拓寬機器人的表情範圍,希望EMO能對人所說的話做出反應,而不是簡單模仿人類。此外,研究人員正利用大模型將語言交流整合到Emo中,讓Emo能夠回答問題和對話。

3、Domo AI 新功能上線:能讓靜態人像動起來

產品信息:Domo AI是映刻科技推出的一款將照片和視頻動漫化的AI工具,該工具可以將用戶上傳的圖片和視頻轉繪為動漫風格,經過不斷叠代更新,Domo AI近日推出了圖像生成視頻新功能。

產品功能:Domo AI的新功能結合了深度學習和計算機視覺算法的前沿技術,通過智能識別和分析靜態照片中的人物特征,再與動態視頻中的運動數據進行精準匹配。在強大的算法驅動下,Domo AI能夠巧妙地將照片中的人物「移植」到視頻中,實現靜態到動態的完美轉變。



例如,用戶可以上傳一張靜態照片和一個參考的動態視頻,Domo AI便能夠巧妙地將靜態照片中的人物替換成動態視頻中的人物,實現驚人的視覺轉換。

Domo AI功能強大,適用於多種場景和應用。不僅可用於社交媒體上分享生動有趣的動態照片,還可以為電影、遊戲或廣告製作添加特效,為用戶提供無限的創意空間。

目前,Domo AI新功能已經在Discord頻道上正式上線,用戶只需在頻道內使用/move命令,即可輕松體驗將靜態照片變為動態視頻的神奇過程。

官方網址:https://domoai.app/

體驗地址:https://discord.gg/domoai

4、吊打Midjourney、DALL·E 3的AI文生圖工具——Ideogram

產品信息:Ideogram是一款超強文字生成圖像工具,旨在生成包含可以清晰閱讀文本的圖像。該模型由谷歌前員工組成的創業團隊打造,團隊成員曾參與開發谷歌的 Imagen 圖像生成軟件和視頻生成模型。



產品功能:Ideogram的主要功能為文生圖功能,但與其他圖像生成模型不同的是,Ideogram擅長生成包含文本的圖片,用戶只需輸入提示詞,Ideogram就可以按照要求將文字融入生成的圖片中,實現平面、懸浮甚至立體文字效果。比如生成電影、產品海報、T恤印花等圖像,解決了生圖AI在圖像文字生成上的痛點。

近期上線的Ideogram 1.0版本在正確顯示文本方面有了顯著提升,生成的圖像也更加逼真,可以對復雜提示詞進行精確響應。Ideogram 表示,參與測試的評估者對於 Ideogram 1.0 在提示對齊、圖像連貫性、整體偏好和文本渲染質量方面的偏好超越了 DALL·E 3 和 Midjourney V6。

同時 Ideogram 1.0 還引入了 一個名為「魔法提示」的新功能,該功能可以根據用戶的原始描述,編寫更詳細的提示詞,進而創造出更美觀且具創意的圖像。

此外,Ideogram 1.0版本還能理解冗長、復雜的提示詞,生成清晰、逼真的圖像,包括動物、奇怪組合的呈現,以及照片級逼真的人物表情和手部動作。

付費方面,用戶每天能免費使用25個提示詞,生成100張圖。8美元月付費用戶每天可以生成100個提示詞,400張圖。20美元月付費用戶可以無限使用。

體驗地址:https://ideogram.ai/t/explore

5、文生圖框架——LaVi-Bridge

產品信息:LaVi-Bridge是一個無需訓練將不同的語言模型和生成視覺模型結合起來,以實現文本到圖像的生成的技術框架,該框架由香港大學、香港中文大學和香港科技大學的研究團隊共同開發。



產品功能:通過使用LoRA(Low-rank Adaptation)和適配器,LaVi-Bridge提供了一種靈活且即插即用的方法,無需修改原始模型的權重。這個框架兼容多種語言模型和生成視覺模型,能夠適應不同的結構。

在這一框架內,團隊證明了通過整合更高級的模塊(如更先進的語言模型或生成視覺模型)可以明顯提高文本對齊或圖像質量等能力,經過大量評估驗證了LaVi-Bridge模型的有效性。

項目地址:https://shihaozhaozsh.github.io/LaVi-Bridge/

---(鈦媒體/作者:章橙*編輯:林誌佳|鈦媒體AGI)