OpenAI一夜顛覆AI繪畫!DALL·E 3+ChatGPT強強聯(lián)合,畫面直接細節(jié)爆炸

2 評論 4228 瀏覽 33 收藏 14 分鐘

可以看到,最新發(fā)布的DALL·E 3,不僅省去了提示詞工程,還把語言理解能力提升了一個檔次。具體DALL·E 3展示的效果體現(xiàn)出了哪些能力和細節(jié)?一起跟著作者來看看吧。

起猛了,OpenAI竟然把AI繪畫ChatGPT合 并 了!

這不,最新發(fā)布的DALL·E 3,直接給AIGC帶來了兩大震撼——

  • 提示詞門檻極大降低
  • 理解語意的細微差異的細節(jié)描述,準確到令人發(fā)指

沒錯,新版DALL·E 3,不僅省去了提示詞工程,還順帶把語言理解能力提升了一個檔次!

你只管隨意想象。,ChatGPT幫你拓展;,DALL·E 3給你精確到細節(jié)。

AI就能像拍電影一般,保證從背景到人物,細節(jié)一字不差地復(fù)刻出來:

滿月下的街道,熙熙攘攘的行人正在享受繁華夜生活。

街角攤位上,一位有著火紅頭發(fā)、穿著標志性天鵝絨斗篷的年輕女子,正在和脾氣暴躁的老小販討價還價。

這個脾氣暴躁的小販身材高大,老道,身著一套整潔西裝,留著引人注目的小胡子,正在用他那部蒸汽朋克式的電話興致勃勃地交談。

除了基礎(chǔ)細節(jié),DALL·E 3甚至能將模糊的形容詞如繁華、討價還價、脾氣暴躁演繹得活靈活現(xiàn),和CLIP已經(jīng)不在一個檔次了。

同時,相比上一代老模型,DALL·E 3自身的畫技也前進了一大步:

這般操作,直接把網(wǎng)友看愣了。

有網(wǎng)友已經(jīng)決定取消Midjourney訂閱了。“如果Midjourney無法準確理解文本,這甚至稱不上是同臺競技。”

還有網(wǎng)友調(diào)侃,這簡直就是給即將到來的谷歌Gemini上壓力。

更多細節(jié),我們從DALL·E 3展示的效果一一來看。

一、在ChatGPT里直接用

相比前兩代,DALL·E 3最大的優(yōu)勢在于原生構(gòu)建在ChatGPT之上。

不僅意味著語言理解能力大幅飛躍,甚至提示詞都可以讓ChatGPT自己來寫

更多細節(jié)藏在奧特曼都忍不住自夸可愛的宣傳視頻里。

這是一個家長把5歲小朋友腦海里的幻想變成現(xiàn)實的故事。

首先家長詢問ChatGPT,“我家5歲寶寶一直在說一個’超級向日葵刺猬’,它該長什么樣?”

可以看到ChatGPT同時寫了四段不同風(fēng)格的提示詞,并給出對應(yīng)圖像。

家長選擇其中偏童話插圖風(fēng)格的一張后,故事的主角小刺猬形象似乎就能固定下來了,可以繼續(xù)請ChatGPT畫出更多。

順便給小刺猬一個名字Larry,后面的對話中就不用每次都說“超級向日葵刺猬”了。

主角定好了,接下來再添加更多元素,讓整個童話故事更豐富,比如給Larry畫個房子。

這里既展示出了DALL·E 3創(chuàng)作一致形象的能力,也展示出郵箱上正確寫上了LARRY的名字,解決了之前版本DALL·E不會寫字的問題

反正都用上ChatGPT了,不如把故事情節(jié)也完善一下?

剛編好的情節(jié)立馬就可以有配套的插畫了。

保持角色形象,遷移到完全不同的貼紙畫風(fēng)也沒問題,可以直接打印出來。

注意了,最絕的地方來了,直接讓ChatGPT總結(jié)前面對話中所有內(nèi)容,寫成一個完整的睡前故事。

雖然演示到此結(jié)束,但完全可以想象配合ChatGPT插件功能,還可以直接生成一本電子書出來。

就讓人想起之前網(wǎng)友提議,確保AI安全的最佳方法是讓OpenAI、Anthropic等公司的員工都有孩子。

這樣他們就有動力確保AGI到來時世界是安全的。(手動狗頭)

雖然DALL·E 3現(xiàn)在還不能馬上玩到,一次放出的大量樣張也可以先看個飽了。

每一張點開還可以看到提示詞,都是直接用人話描述,沒怎么加復(fù)雜咒語的那種。

復(fù)雜場景與不存在的概念組合,效果很驚艷。

搞室內(nèi)設(shè)計概念圖,光影明暗關(guān)系乍看也挑不出毛病。

配合正確寫字能力,直出海報也是生產(chǎn)力拉滿(沒指定文字的小字部分還有些問題)。

剛加入OpenAI不久的德?lián)銩I之父Noam Brown也曬出了他試玩的機器人打牌圖。

CEO奧特曼最喜歡的則是這張“牛油果看醫(yī)生”。

有網(wǎng)友去試了同樣的提示詞用在DALL·E 2的效果,只能說字也不對、牛油果中間的洞沒話出來,治療是更是沒有……

還記得2021年1月DALL·E 1剛出的時候嗎?夢開始的地方就是一組“牛油果做的沙發(fā)”。

也難怪網(wǎng)友感嘆:看看它走了多遠!

二、“如有侵權(quán),請來刪圖”

當然,除了上述特性以外,OpenAI也預(yù)告了一些神奇的新功能。

例如,DALL·E 3即將配套推出一個圖像鑒別器

這個分類器可以幫助識別圖像是否由DALL·E 3生成,不僅能避免誤傷(手動狗頭),也能在DALL·E創(chuàng)作出好作品時快速將它認領(lǐng)成自己的。

至于在生成圖像上,OpenAI自述也做了大量工作,防止其生成暴力、色情或其他有害圖片,或是帶有公眾人物(明星、名人等)姓名的圖像生成。

關(guān)于隱私方面,之前紐約時報就曾爆料稱,OpenAI正在通過某些技術(shù),模糊掉上傳到ChatGPT的圖像中的人臉。

這也是為了避免ChatGPT變成一個徹底的“人臉識別工具”,尤其是已經(jīng)有不少照片流傳到互聯(lián)網(wǎng)上的名人明星們。

如今這個技術(shù)可能也被用到了DALL·E 3中,防止生成侵權(quán)圖像。

同時,OpenAI也與安全紅隊合作,提高了圖像風(fēng)險評估的能力。

除此之外,在訓(xùn)練數(shù)據(jù)上,有了Midjourney的“前車之鑒”,OpenAI這次也學(xué)會了保護自己。

相比于直接和畫手打官司、或者等著被起訴,OpenAI在官網(wǎng)放出了一則訓(xùn)練數(shù)據(jù)“免責(zé)聲明”

您可以填寫表格,禁止我們的網(wǎng)絡(luò)爬蟲GPTBot訪問您的網(wǎng)站?;蛘?,您也可以發(fā)送您想要保護隱私的圖像,我們會把它從訓(xùn)練數(shù)據(jù)中刪掉。

不過也有網(wǎng)友對DALL·E 3演示效果不滿意,認為比不上MidJourney資深玩家出的圖,OpenAI的資金可是充裕n多倍啊。

還有網(wǎng)友開啟列文虎克模式,開始挨個挑演示圖中漏掉的提示詞細節(jié)。

比如這張杯子里缺少微型閃電。

這張散落在海底的只有大炮殘骸,沒有寶藏。

具體這些問題能不能通過調(diào)整提示詞改善,就要等實際上手玩過才知道了。

那么DALL·E 3具體什么時候上線呢?劃重點了:

  • ChatGPT Pro會員(20美元/月)和企業(yè)版在10月可用。
  • 獨立版在今年秋天晚些時候提供(目前價格15美元可以玩115次)。

參考鏈接:

[1]https://openai.com/dall-e-3

[2]https://www.nytimes.com/2023/07/18/technology/openai-chatgpt-facial-recognition.html

[3]https://twitter.com/sama/status/1704547625482203560

作者:夢晨,蕭簫

來源公眾號:量子位(ID:QbitAI),追蹤人工智能新趨勢,關(guān)注科技行業(yè)新突破

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @量子位 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 未來國內(nèi)大模型也會收費嘛

    來自天津 回復(fù)
  2. 會員太貴

    來自上海 回復(fù)