起猛了,OpenAI竟然把AI繪畫和ChatGPT合 并 了!
這不,最新發(fā)布的DALL·E 3,直接給AIGC帶來了兩大震撼——
提示詞門檻極大降低
理解語意的細微差異的細節(jié)描述,準確到令人發(fā)指
沒錯,新版DALL·E 3,不僅省去了提示詞工程,還順帶把語言理解能力提升了一個檔次!
你只管隨意想象。詞,ChatGPT幫你拓展;畫,DALL·E 3給你精確到細節(jié)。
AI就能像拍電影一般,保證從背景到人物,細節(jié)一字不差地復(fù)刻出來:
滿月下的街道,熙熙攘攘的行人正在享受繁華夜生活。
街角攤位上,一位有著火紅頭發(fā)、穿著標志性天鵝絨斗篷的年輕女子,正在和脾氣暴躁的老小販討價還價。
這個脾氣暴躁的小販身材高大,老道,身著一套整潔西裝,留著引人注目的小胡子,正在用他那部蒸汽朋克式的電話興致勃勃地交談。
除了基礎(chǔ)細節(jié),DALL·E 3甚至能將模糊的形容詞如繁華、討價還價、脾氣暴躁演繹得活靈活現(xiàn),和CLIP已經(jīng)不在一個檔次了。
同時,相比上一代老模型,DALL·E 3自身的畫技也前進了一大步:
這般操作,直接把網(wǎng)友看愣了。
有網(wǎng)友已經(jīng)決定取消Midjourney訂閱了?!叭绻鸐idjourney無法準確理解文本,這甚至稱不上是同臺競技。”
還有網(wǎng)友調(diào)侃,這簡直就是給即將到來的谷歌Gemini上壓力。
更多細節(jié),我們從DALL·E 3展示的效果一一來看。
相比前兩代,DALL·E 3最大的優(yōu)勢在于原生構(gòu)建在ChatGPT之上。
不僅意味著語言理解能力大幅飛躍,甚至提示詞都可以讓ChatGPT自己來寫。
更多細節(jié)藏在奧特曼都忍不住自夸可愛的宣傳視頻里。
這是一個家長把5歲小朋友腦海里的幻想變成現(xiàn)實的故事。
首先家長詢問ChatGPT,“我家5歲寶寶一直在說一個’超級向日葵刺猬’,它該長什么樣?”
可以看到ChatGPT同時寫了四段不同風(fēng)格的提示詞,并給出對應(yīng)圖像。
家長選擇其中偏童話插圖風(fēng)格的一張后,故事的主角小刺猬形象似乎就能固定下來了,可以繼續(xù)請ChatGPT畫出更多。
順便給小刺猬一個名字Larry,后面的對話中就不用每次都說“超級向日葵刺猬”了。
主角定好了,接下來再添加更多元素,讓整個童話故事更豐富,比如給Larry畫個房子。
這里既展示出了DALL·E 3創(chuàng)作一致形象的能力,也展示出郵箱上正確寫上了LARRY的名字,解決了之前版本DALL·E不會寫字的問題。
反正都用上ChatGPT了,不如把故事情節(jié)也完善一下?
剛編好的情節(jié)立馬就可以有配套的插畫了。
保持角色形象,遷移到完全不同的貼紙畫風(fēng)也沒問題,可以直接打印出來。
注意了,最絕的地方來了,直接讓ChatGPT總結(jié)前面對話中所有內(nèi)容,寫成一個完整的睡前故事。
雖然演示到此結(jié)束,但完全可以想象配合ChatGPT插件功能,還可以直接生成一本電子書出來。
就讓人想起之前網(wǎng)友提議,確保AI安全的最佳方法是讓OpenAI、Anthropic等公司的員工都有孩子。
這樣他們就有動力確保AGI到來時世界是安全的。(手動狗頭)
雖然DALL·E 3現(xiàn)在還不能馬上玩到,一次放出的大量樣張也可以先看個飽了。
每一張點開還可以看到提示詞,都是直接用人話描述,沒怎么加復(fù)雜咒語的那種。
復(fù)雜場景與不存在的概念組合,效果很驚艷。
搞室內(nèi)設(shè)計概念圖,光影明暗關(guān)系乍看也挑不出毛病。
配合正確寫字能力,直出海報也是生產(chǎn)力拉滿(沒指定文字的小字部分還有些問題)。
剛加入OpenAI不久的德?lián)銩I之父Noam Brown也曬出了他試玩的機器人打牌圖。
CEO奧特曼最喜歡的則是這張“牛油果看醫(yī)生”。
有網(wǎng)友去試了同樣的提示詞用在DALL·E 2的效果,只能說字也不對、牛油果中間的洞沒話出來,治療是更是沒有……
還記得2021年1月DALL·E 1剛出的時候嗎?夢開始的地方就是一組“牛油果做的沙發(fā)”。
也難怪網(wǎng)友感嘆:看看它走了多遠!
當(dāng)然,除了上述特性以外,OpenAI也預(yù)告了一些神奇的新功能。
例如,DALL·E 3即將配套推出一個圖像鑒別器。
這個分類器可以幫助識別圖像是否由DALL·E 3生成,不僅能避免誤傷(手動狗頭),也能在DALL·E創(chuàng)作出好作品時快速將它認領(lǐng)成自己的。
至于在生成圖像上,OpenAI自述也做了大量工作,防止其生成暴力、色情或其他有害圖片,或是帶有公眾人物(明星、名人等)姓名的圖像生成。
關(guān)于隱私方面,之前紐約時報就曾爆料稱,OpenAI正在通過某些技術(shù),模糊掉上傳到ChatGPT的圖像中的人臉。
這也是為了避免ChatGPT變成一個徹底的“人臉識別工具”,尤其是已經(jīng)有不少照片流傳到互聯(lián)網(wǎng)上的名人明星們。
如今這個技術(shù)可能也被用到了DALL·E 3中,防止生成侵權(quán)圖像。
同時,OpenAI也與安全紅隊合作,提高了圖像風(fēng)險評估的能力。
除此之外,在訓(xùn)練數(shù)據(jù)上,有了Midjourney的“前車之鑒”,OpenAI這次也學(xué)會了保護自己。
聯(lián)系客服