新版Midjourney太炸裂:AI繪畫(huà)再無(wú)Bug,“有圖有真相”時(shí)代徹底過(guò)去
過(guò)去幾個(gè)月,以ChatGPT為首的聊天機器人攪得科技界滿(mǎn)城風(fēng)雨,大家都忙著(zhù)去跟各家的AI聊天,讓它們來(lái)寫(xiě)郵件、寫(xiě)代碼、寫(xiě)詩(shī)。而當語(yǔ)言模型在大跨步向前進(jìn)化時(shí)候,AIGC的另一個(gè)重要分支——繪圖,最近其實(shí)也完全沒(méi)閑著(zhù)。
【資料圖】
去年曾因拿下藝術(shù)比賽大獎而名噪一時(shí)的Midjourney,近期在A(yíng)I生成圖片領(lǐng)域熱度可以說(shuō)堪比OpenAI。MidjourneyV4版本去年年底幾乎跟ChatGPT同期上線(xiàn),而就在上周GPT-4推出的時(shí)候,Midjourney也飛速推出了第五代版本,而這一次的更新堪稱(chēng)“炸裂”。
一周以來(lái),各種用Midjourney生成的神圖層出不窮,國足奪冠、特朗普插秧、教皇打碟、異形下鄉……只要你敢想AI就敢畫(huà),而且隨便拿出一張都能做到以假亂真的程度。但可能有創(chuàng )作的偽照片過(guò)于真實(shí),引起了太多爭議,太多新用戶(hù)涌入導致服務(wù)器不堪重負,本周二,Midjourney宣布關(guān)閉了其免費賬戶(hù)的使用通道。
不過(guò),另外一方面,在人們瘋狂娛樂(lè )的同時(shí),一些人也嘗試著(zhù)把ChatGPT和Midjourney結合起來(lái)使用,一些由人類(lèi)構思、AI主導和操作的“人機合作”作品也逐漸顯現出了商業(yè)化應用的輪廓。
當圖片向照片進(jìn)化:一個(gè)由AI創(chuàng )造的平行世界誕生
你有沒(méi)有想象過(guò)這樣的畫(huà)面:
在不久前落幕的卡塔爾世界杯上,整個(gè)綠茵球場(chǎng)變成了一片紅色的海洋。大家歡呼雀躍,全場(chǎng)掌聲雷動(dòng)。
圖片來(lái)自小紅書(shū)博主,賬號:Ai船長(cháng)
愛(ài)因斯坦沒(méi)有出現在實(shí)驗室里,而是梳著(zhù)標志性的發(fā)型,在音樂(lè )節上狂歡。
圖片來(lái)自推特
馬斯克沒(méi)有在21世紀造火箭和電動(dòng)汽車(chē),而是穿越到了蘇聯(lián)工廠(chǎng),真正當起了一名“鋼鐵俠”(工人)。
圖片來(lái)自推特
這樣的世界,你覺(jué)得怎么樣?
以上這些無(wú)比真實(shí)的照片,并不是由誰(shuí)花了大量時(shí)間PS制作的,而是很多普通人通過(guò)動(dòng)一動(dòng)手指頭,打幾個(gè)關(guān)鍵字,就讓人工智能在十幾秒內所自動(dòng)生成的。
造就這以假亂真世界的幕后推手是一個(gè)名為Midjourney的AI生成圖片工具??梢哉f(shuō),目前在A(yíng)IGC繪圖領(lǐng)域,MidJourney是一個(gè)比OpenAI還神奇的存在。Midjourney沒(méi)有任何巨頭的重金支持,是一個(gè)自籌資金的獨立研究實(shí)驗室,它的發(fā)起人為曾兩次拒絕蘋(píng)果收購的Leap Motion公司的創(chuàng )始人David Holz,目前全職員工僅有11人。
但就是這么一個(gè)超小型團隊,卻是當前AI繪圖領(lǐng)域最炙手可熱的明星,甚至將OpenAI的DALL-E、Stable Diffusion、英偉達的GauGAN2等同類(lèi)工具都甩在了身后。
比肩GPT的更新速度,驚嘆和爭議相繼到來(lái)
Midjourney的迭代速度相較于OpenAI可以說(shuō)是有過(guò)之而無(wú)不及。去年3月份第一版本首次上線(xiàn),4月份便火速更新第二版本,接著(zhù)7月份上線(xiàn)Open Beta V3版本首次向公眾開(kāi)放,之后以其獨特的藝術(shù)性風(fēng)格吸引了一些用戶(hù)。其中,最出圈的就是這張由普通人給出提示詞、AI負責創(chuàng )作,跟人類(lèi)藝術(shù)家同臺比賽之后斬獲金獎的油畫(huà)。
之后Midjourney并沒(méi)有停下更新的腳步,11月又推出第四代版本添加了更多圖片風(fēng)格,緊接著(zhù)今年3月份,Midjourney V5版本登場(chǎng)。此次V5版本的更新之所以能引發(fā)大量關(guān)注,主要是因為它解決了一個(gè)技術(shù)難題和完成了一次跨越性的突破。
其中,技術(shù)難題指的是——畫(huà)手。
讓AI畫(huà)出逼真的人類(lèi)手部特征是一個(gè)看起來(lái)簡(jiǎn)單但卻出奇復雜的任務(wù)。首先,在 AI的訓練圖集中,手往往都不是圖片的重點(diǎn),同時(shí)人們握手、牽手、鼓掌等不同狀態(tài)下手部形態(tài)各異,很難形成標準化的模版,這也就造成了AI學(xué)習難度的激增。
此外,即便對于傳統人類(lèi)畫(huà)師來(lái)說(shuō),畫(huà)手也是最困難的地方之一。手的幾何形狀復雜,并沒(méi)有一套標準的線(xiàn)條或形狀,指關(guān)節上的皺紋和褶皺、手掌上的陰影等細節非常多,并且每個(gè)人的手都不一樣,是獨一無(wú)二的存在,并不能套用。
因此正確并精細化地畫(huà)手對于所有的AI工具來(lái)說(shuō)都是一項困難的挑戰,在Midjourney的V5之前,行業(yè)內的AI繪畫(huà)工具都無(wú)法很好地完成。
Midjourney(左)、Stable Diffusion(右上)和DALL-E 2(右下)此前生成的奇怪人手,圖片來(lái)自buzzfeednews
但現在,Midjourney V5版本的已經(jīng)完美解決了這個(gè)問(wèn)題。
圖片來(lái)自推特
不僅告別了六指或畸形,還能結合人物特點(diǎn)畫(huà)出不同狀態(tài)和年齡畫(huà)出不同的手部細節,就連在光影中的手指紋路也能被完美呈現。
圖片來(lái)自于mpost
而除了攻克了畫(huà)手這個(gè)技術(shù)難題之外,Midjourney V5此次另一跨越性的突破在于——能夠生成照片級的圖片,并且還是攝影大師拍的那種。
在V5之前,Midjourney生成的圖片總體以卡通或超現實(shí)風(fēng)格為主,但V5版本能夠支援包括真實(shí)、抽象、油畫(huà)等更廣泛的風(fēng)格,圖像解像度比上個(gè)版本提高2 倍。而此次寫(xiě)實(shí)風(fēng)格的上線(xiàn),可以說(shuō)直接到了讓很多攝影師都要感嘆“攝影學(xué)不存在了”的地步。
比如,以“90年代大街上的模特”為主題,完美創(chuàng )造出真假難辨的照片。
圖片來(lái)自推特,賬號Nick St. Pierre
以“你好小朋友”為主題,用膠片質(zhì)感完成童年重現。
圖片來(lái)自小紅書(shū)博主,賬號:逗比
以“發(fā)生颶風(fēng)的新聞報道”為主題,無(wú)中生有地去還原一個(gè)災難現場(chǎng)等等。
圖片來(lái)自推特
從以上這些照片示例中可以看出,Midjourney的寫(xiě)實(shí)圖片生成并不局限于一種固定的風(fēng)格,而是會(huì )根據你描述場(chǎng)景和想要的風(fēng)格來(lái)智能化的調整色調、像素、鏡頭語(yǔ)言等。最近Midjourney產(chǎn)出的很多圖片,甚至已經(jīng)達到人的肉眼無(wú)法判別真偽的程度。
如果從技術(shù)的角度,Midjourney的進(jìn)步無(wú)疑是讓人驚艷和贊嘆的。但可能也因為這些照片太過(guò)于真實(shí)和太多新用戶(hù)的涌入,本周二,Midjourney宣布關(guān)閉了其免費賬戶(hù)的使用通道。分析認為,此舉也是為了防止更多離譜的“照片”出現,從而擾亂現實(shí)世界和散布有害信息。
比如,此前真的就有媒體以把特朗普被捕的生成圖片當成了真實(shí)現場(chǎng)照片,從而造成了虛假新聞的出現和發(fā)酵。此外,Midjourney目前的關(guān)鍵詞審核機制并不嚴格,因此也存在產(chǎn)生大量有害照片的風(fēng)險。Midjourney表示他們正在進(jìn)一步加強對于A(yíng)I生成內容的監管和審核。
圖片來(lái)自于The Verge
ChatGPT+Midjourney強強聯(lián)合,AI作品走向商業(yè)化應用
目前,MidJourney仍然需要結合Discord使用,使用方法依然很簡(jiǎn)單,通過(guò)輸入文字和一些參數要求描述即可。目前還支持用戶(hù)上傳自己的圖片,再根據圖片進(jìn)行AI生成。
目前,一段完整Midjourney的“咒語(yǔ)”示例大概如下:
A man in futuristic armor with cyberpunk details(對想要呈現圖片的文字描述,可以添加更多細節),shot on Canon R6 with 50mm f1.2(風(fēng)格描述,可以提出是什么設備拍攝的、或者是以哪位知名藝術(shù)家或攝影師的風(fēng)格),--v 5(使用第五代版本技術(shù))--ar 4:6 (畫(huà)幅比例,V5 版本中你可以自定義任何比例)--iw 1(輸入的參考圖片的權重占比)
雖然咒語(yǔ)的構成并不算復雜,但對于很多只有一個(gè)模糊想法的普通用戶(hù)來(lái)說(shuō),如何讓Midjourney來(lái)畫(huà)出自己腦中圖像仍然比較困難。于是,ChatGPT也登場(chǎng)了。
ChatGPT能發(fā)揮什么作用呢?首先你可以模糊地描述你的構想,讓ChatGPT拓展成一個(gè)充滿(mǎn)細節的畫(huà)面描述,接著(zhù)讓它從這段文字描述中提取關(guān)鍵詞。然后,你可以將Midjourney的提示句的語(yǔ)法構成告訴ChatGPT,再通過(guò)幾次訓練讓Midjounery記住如何通過(guò)你輸入的關(guān)鍵詞來(lái)創(chuàng )建Midjourney的命令語(yǔ)法。
之后你只需要復制粘貼ChatGPT給你的指令粘貼到Midjourney的命令框里即可生成圖片,如果你不滿(mǎn)意還可以讓ChatGPT來(lái)繼續幫你修改完善關(guān)鍵詞。
目前,已經(jīng)有很多人已經(jīng)在嘗試將ChatGPT和Midjourney結合產(chǎn)出的結果,應用于自己的工作中。比如,做電商的不再需要去花大價(jià)錢(qián)去找攝影師、設計師,而是只需要把產(chǎn)品圖片和關(guān)鍵詞提供給AI工具,就能直接生成商業(yè)大片。
圖片來(lái)自小紅書(shū)博主,賬號:阿湯嬌嬌啊、阿泰ATAI動(dòng)態(tài)視覺(jué)
未來(lái)甚至也不用找真人模特了,直接用AI生成就行。
還有人將其用于室內家居設計領(lǐng)域,幫助自己來(lái)做網(wǎng)站、生成宣傳圖片等。
可以預見(jiàn)的是,ChatGPT和Midjourney的合作可能僅僅只是AI商業(yè)化應用的一個(gè)開(kāi)端。隨著(zhù)AI技術(shù)的快速發(fā)展,各種工具的出現讓AI的應用范圍也會(huì )指數級的擴大。目前,在設計、電商、廣告、游戲、影視等各個(gè)領(lǐng)域都涌現出了更多的用例,在娛樂(lè )性大大增強的同時(shí),全新的機遇賽道也在被開(kāi)啟。
最后,讓我們來(lái)做一個(gè)無(wú)獎競猜。以下兩張烤雞的圖片中,你認為到底哪一張才是由真的相機拍攝的呢?
認為是上邊這張請在評論區留1,認為是下邊這張的請留2。歡迎大家參與!
本文作者:Juny,本文來(lái)源:硅星人,原文標題:《新版Midjourney太炸裂:AI繪畫(huà)再無(wú)Bug,“有圖有真相”時(shí)代徹底過(guò)去》
風(fēng)險提示及免責條款 市場(chǎng)有風(fēng)險,投資需謹慎。本文不構成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標、財務(wù)狀況或需要。用戶(hù)應考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結論是否符合其特定狀況。據此投資,責任自負。關(guān)鍵詞: