![](https://pica.nidbox.net/83/b/1705746861_aedaea9b_83.jpg)
【新智元導讀】Midjourney大神的超深度測評來了!V6比起V5.2究竟有哪些改進?來感受一下吧。
最近,國外的一位名叫Andrei Kovalev的大神網友,做出了一份Midjourney V6的超深度評測。
指南很專業,V6和V5.2有什麽不同,很直觀地就能看出來。
下面,就讓我們來跟隨大神的腳步,深入感受一下Midjourney V6的性能有多強吧。
V6模型,究竟比V5.2強在哪
在以往,當我們看一張AI生圖時,可能馬上就會感覺到這是AI畫的。
但在Midjourney V6中,你很少會有這樣的感覺。
在這一部分中,Kovalev介紹了V6的優勢、劣勢,以及和V5.2相比的主要變化。
Tim Walker的高級時裝正面肖像,清澈的白色空靈機器人,半透明的皮膚淹沒在電線的海洋中。紅色和青色色調,發光的高光,深色陰影
![](https://pica.nidbox.net/84/b/1705746884_008beebe_84.jpg)
V6
![](https://pica.nidbox.net/84/b/1705746901_b758c09c_84.jpg)
V5.2
Kovalev發現,V6有以下升級(因爲當前還處于Alpha測試,以後還會發生變化)。
在遵循提示時更准確了,並且使用更長的提示時,效果會更好。 新模型的一致性大大增強了。 V6改進了圖像提示功能。 現在V6有了兩個新的升頻器,具有微妙和創意模式(都將分辨率提高了兩倍)。 有一個「unopinionated」的 --style raw模式(類似于 V5.2)。 此外,還可以在圖像中添加文本了。
所以,V6究竟變成了什麽樣子?
超現實主義
以往每次的Midjourney升級,都會提升照片的真實感,V6也不例外。
最能定義V6的關鍵詞,恐怕就是超現實主義。
川內凜子的少女太空飛行員攝影肖像
![](https://pica.nidbox.net/83/b/1705746947_d42b320c_83.jpg)
V6
![](https://pica.nidbox.net/83/b/1705746970_43ccec02_83.jpg)
V5.2
總而言之,V6的逼真度爆表,上升到了一個新台階,尤其是在攝影風格上,已經到了讓人迷惑的程度。
Kourtney Roy的老海員攝影肖像
![](https://pica.nidbox.net/83/b/1705746994_cb1b40c0_83.jpg)
V6
而Midjourney V6中逼真圖像功能之所以如此驚人,恰恰是因爲存在缺陷:鏡頭像差、故意過度突出的區域、意外的失焦元素以及各種膠片效果。
Mitsuo Katsui拍攝的初音未來照片 --stylize 175
![](https://pica.nidbox.net/83/b/1705747018_3d5c6dce_83.jpg)
當然,V6不止是人像畫得好。
第比利斯的延時攝影 --stylize 175
![](https://pica.nidbox.net/84/b/1705747036_deb6146e_84.jpg)
而且,在某些情況下需要更微妙的外觀和感覺,這時V6的超現實主義就顯得有些尖銳,顯得有些矯枉過正。
Ara Guler對1970年代伊斯坦布爾賭場賭徒的肖像
![](https://pica.nidbox.net/84/b/1705747052_424dbb72_84.jpg)
V6
![](https://pica.nidbox.net/83/b/1705747079_a19bd6de_83.jpg)
V5.2
細節很瘋狂
每次在Midjourney的下一個模型發布之前,許多人都會屏住呼吸,想看看他們會如何處理細節。
V6中的細節,很瘋狂。而新的upscalers功能,則讓細節更進一步。
Ivan Bilibin的畫作,描繪騎著白狼的冬季領主
![](https://pica.nidbox.net/84/b/1705747106_794ca4db_84.jpg)
V6
![](https://pica.nidbox.net/83/b/1705747129_6732c3c0_83.jpg)
V5.2
不過,雖然圖像的複雜性隨著每個新模型的出現而穩步上升,但在此過程中,卻丟失了一些東西,比如紋理。
比如,V4的精細程度在V5+中提高了十倍,因此幾乎不可能實現膠片顆粒或真實筆觸這類效果。
雖然離真正的顆粒感似乎仍然遙不可及,但V6顯然朝著以前失去的原始性,邁出了明確的一步。
它的紋理令人驚歎,比起V5來大放異彩(在V5中,需要選擇「non-refined」的視覺風格)。
Marianna Rothen的夢幻女孩
![](https://pica.nidbox.net/84/b/1705747155_77beae08_84.jpg)
V6
![](https://pica.nidbox.net/83/b/1705747177_ee7b9c75_83.jpg)
V5.2
另一個能很好地描述V6的概念,是非常規組合(unconventional composition),這導致了V5.2中結構化和平衡方法的重大轉變。
以前的模型追求幾何完美、黃金比例和中心主體,而V6追求不對稱,經常將主體從畫面中間移開。
Tyrus Wong的跨維度神秘野獸
![](https://pica.nidbox.net/83/b/1705747201_05952dc3_83.jpg)
V6
![](https://pica.nidbox.net/84/b/1705747224_a3ce3a87_84.jpg)
V5
這可能會提供更具動態性和吸引力的視覺效果,但也需要相應地調整提示。即使是很小的調整,也可以恢複中心構圖和對稱性。
可變性增強
可以看到,在V6中,同一提示結果的可變性增強了。
與早期模型相比,單個提示的四個變體,通常顯示出更明顯的差異。
Jessie Willcox Smith的《銀術士》
![](https://pica.nidbox.net/83/b/1705747323_ae97588e_83.jpg)
V6
![](https://pica.nidbox.net/83/b/1705747323_705eca48_83.jpg)
V5.2
許多情況下,這會産生一種更具創意、更有趣,有時甚至更忠實于現實生活中原型的多樣性的藝術風格表現。
藝術風格
在提示中,我們可以引用「Style modifiers」的名稱,召喚圖像的特定視覺風格、技術、流派、主題或上下文。
像素藝術
![](https://pica.nidbox.net/83/b/1705747333_eadde0e7_83.jpg)
V6
![](https://pica.nidbox.net/84/b/1705747487_bbebeada_84.jpg)
V5.2
現在,每個新模型都更善于了解源材料,並且在輸出中重新創建它,這已經是一個傳統。
然而,Midjourney從未停止這種戲劇性的變化。
by Jody Bergsma
![](https://pica.nidbox.net/83/b/1705747438_4cd41cea_83.jpg)
V6
![](https://pica.nidbox.net/84/b/1705747507_74ac8977_84.jpg)
V5.2
無論這些風格本身多麽偉大,真正將它們從對原作的單純解釋轉變爲獨特的東西的,是我們添加的提示。
圖片中添加文本
雙手拿著報紙,標題爲「Midjourney的文本 - 真實還是騙局?」
![](https://pica.nidbox.net/83/b/1705747564_c29c736d_83.jpg)
V6
![](https://pica.nidbox.net/84/b/1705747581_2bbcd160_84.jpg)
V5.2
更多詳解,還請參考原文網站。---[新智元報導*編輯:Aeneas/來源: 新智元]
參考資料:https://midlibrary.io/midguide/midjourney-v6-in-depth-review-part-1-overview