henry 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
用提示詞就能點(diǎn)對(duì)點(diǎn)編輯圖片?
Qwen:沒(méi)錯(cuò),正是在下。
瞧,上面這套“哪里不對(duì)改哪里”的操作,就來(lái)自“凌晨戰(zhàn)神”Qwen團(tuán)隊(duì)最新發(fā)布的——Qwen-Image-Edit
作為Qwen-Image20B的圖像編輯版,Qwen-Image-Edit除了能做上面這種精準(zhǔn)的文字修改,還能夠新增、消除、重繪、修改元素,而且還支持IP編輯、視角切換、風(fēng)格遷移等生成式玩法。
網(wǎng)友:這一連串功能擺出來(lái),PS都得收聲。
一次出圖,玩轉(zhuǎn)增刪改
話不多說(shuō),我們直接看效果。
原創(chuàng)IP編輯
原創(chuàng)IP編輯需要保持原始圖像視覺(jué)語(yǔ)義不變的前提下,對(duì)圖像內(nèi)容進(jìn)行修改,也就是所謂的語(yǔ)義編輯。
Qwen以他們的吉祥物卡皮巴拉作為輸入,生成了一系列衍生IP形象。
(卡皮巴拉:我一好好的水豚成熊了?)
不難看出,這些IP形象既忠實(shí)呈現(xiàn)了卡皮巴拉的角色特性,又在對(duì)應(yīng)場(chǎng)景中展現(xiàn)出豐富多彩的形象。
那么,Demo很優(yōu)秀,實(shí)測(cè)效果又如何?
對(duì)此,我們進(jìn)行了簡(jiǎn)單地實(shí)測(cè),提示詞:這只熊穿著體操隊(duì)服,雙手拉在單杠上。
實(shí)話說(shuō),生成效果確實(shí)不賴,單杠因受力產(chǎn)生了自然變形,更難能可貴的是雙手手指數(shù)量也是一致的(動(dòng)漫角色經(jīng)典的四根手指)。
視角轉(zhuǎn)換
接下來(lái)是視角轉(zhuǎn)換,Qwen-Image-Edit在這里不僅展示了90度旋轉(zhuǎn),還展示了180度旋轉(zhuǎn)。
我們把WRC上拍的小瓦力輸入Qwen-Image-Edit,分別進(jìn)行右側(cè),后側(cè)視角轉(zhuǎn)換的測(cè)試。
(注:這張圖片并不是嚴(yán)格意義上的主視圖,而且還有點(diǎn)俯視,我們看看效果。)
嚴(yán)格來(lái)說(shuō),右側(cè)瓦利的右手(圖片左)有些變形,但轉(zhuǎn)向后側(cè)的效果實(shí)屬驚艷到了。
虛擬形象生成
虛擬形象可以說(shuō)是大伙最愛(ài)玩的功能之一,生成頭像嘎嘎好用。
在Qwen展示的案例中,如果硬要挑刺就是——3D卡通風(fēng)格把原先的半框眼鏡變成了全框的黑框眼鏡。
在測(cè)試的過(guò)程中,我們發(fā)現(xiàn),一旦畫(huà)風(fēng)變得復(fù)雜(圖為熱血漫畫(huà)風(fēng)格),線條就會(huì)稍顯凌亂。
(眼鏡框細(xì)節(jié)倒是保留了下來(lái))
不過(guò),在網(wǎng)友的測(cè)試中,效果倒是非常不錯(cuò):自拍頭像的女性版本,動(dòng)漫版,007版和惡魔版本。
A新增
除了上面的生成式語(yǔ)義編輯,外觀元素的增、刪、改也非常重要。
Qwen-Image-Edit展示了在圖片中添加指示牌的案例,可以看到Qwen-Image-Edit不僅成功添加了指示牌,還生成了相應(yīng)的倒影,細(xì)節(jié)處理十分到位。
我們用一張?jiān)陬U和園實(shí)拍的照片進(jìn)行測(cè)試,提示詞:add the small wooden sign in the foreground in front of the tree with the text ‘welcome to SummerPalace’(在樹(shù)前的前景中添加一個(gè)小木牌,牌上寫(xiě)著“歡迎來(lái)到頤和園”。)
在測(cè)試中,我們發(fā)現(xiàn),如果輸入的圖像分辨率過(guò)高,Qwen會(huì)主動(dòng)報(bào)告:編輯后的圖片會(huì)降低分辨率。
同時(shí),由于照片的分辨率較高,生成的圖片有些失真。
不過(guò),基本的畫(huà)面元素和新增操作還是實(shí)現(xiàn)了。
為了驗(yàn)證是否是分辨率的問(wèn)題,我們把照片換成分辨率沒(méi)那么高的漫畫(huà)圖片,輸出效果還是非常不錯(cuò)的。
提示詞:add the small wooden sign in the foreground in front of the woman with the text ‘welcome to the sea’(在女人前的前景中添加一個(gè)小木牌,牌上寫(xiě)著“歡迎來(lái)到大?!薄#?/p>
AI消除與重繪
在消除和重繪方面,Qwen展示了兩個(gè)很巧妙的例子,一個(gè)是去除頭發(fā)絲等細(xì)小元素,另一個(gè)是在一堆復(fù)雜元素中,選取其中一個(gè)元素改變顏色。
看得出來(lái),效果確實(shí)不錯(cuò)。
這里我們簡(jiǎn)單測(cè)試了一下改顏色的操作,把上面的a從黃色變成橙色。
其他字母的顏色都沒(méi)變,只有a變了。
我服了!確實(shí)厲害!
虛擬場(chǎng)景與穿搭模擬
接下來(lái)是兩個(gè)老生常談的電商場(chǎng)景,模特?fù)Q背景,換衣服。
人物手部,肢體末端,頭發(fā),光影表現(xiàn)都不錯(cuò)。
文字設(shè)計(jì)與海報(bào)編輯
Qwen-Image-Edit在下面的案例中展示了中、英雙語(yǔ)的文字編輯能力。
令人驚艷的是,其不光能修改海報(bào)中的大字,連細(xì)小的文字也能精準(zhǔn)調(diào)整。
對(duì)此,我們拿自己的海報(bào)進(jìn)行了測(cè)試:把AICoding改成AIAgent。
沒(méi)毛病,高,實(shí)在是高!
鏈?zhǔn)骄庉?/p>
最后,就是我們開(kāi)頭展示的,框出錯(cuò)誤的部分,逐步修改的方法,Qwen-Image-Edit把它叫做鏈?zhǔn)骄庉嫛?/p>
在Qwen展示的案例中,他們先用Qwen-Image生成了一幅《蘭亭集序》。
不難看出,這幅AI生成的書(shū)法作品中有不少錯(cuò)字。
在這里,Qwen展示了不用重新生成整幅圖片,就能解決這些問(wèn)題的辦法——
很簡(jiǎn)單,就是框住錯(cuò)誤的字,交給Qwen-Image-Edit改就可以。
離譜的是,對(duì)于一些生僻字,還可以圈出錯(cuò)誤的偏旁,實(shí)現(xiàn)偏旁級(jí)別的修復(fù)。
就這樣,逐步修改畫(huà)面中的瑕疵,最終得到完美的圖片。
需要說(shuō)明的是,上述簡(jiǎn)單實(shí)測(cè)均為一次出圖
可以看到,經(jīng)過(guò)Qwen-Image-Edit處理的圖片,雖然有時(shí)會(huì)有一些色調(diào),細(xì)節(jié)的輕微改變,但在絕大多數(shù)情況下,都和官方說(shuō)的一樣,能達(dá)到不錯(cuò)的編輯效果。
你給這個(gè)效果打幾分?
創(chuàng)意+精準(zhǔn),統(tǒng)統(tǒng)搞定
據(jù)介紹,Qwen-Image-Edit這次的主要更新包括:
- 語(yǔ)義與外觀雙重編輯:Qwen-Image-Edit不僅支持low-level的視覺(jué)外觀編輯(如元素的添加、刪除、修改等,要求圖片其他區(qū)域完全不變),也支持high-level的視覺(jué)語(yǔ)義編輯(如IP創(chuàng)作、物體旋轉(zhuǎn)、風(fēng)格遷移等,允許整體像素變化但保持語(yǔ)義一致)。
- 精準(zhǔn)文字編輯:Qwen-Image-Edit支持中英文雙語(yǔ)文字編輯,可在保留原有字體、字號(hào)、風(fēng)格的前提下,直接對(duì)圖片中的文字進(jìn)行增、刪、改等操作。
- 強(qiáng)大的基準(zhǔn)性能:在多個(gè)公開(kāi)基準(zhǔn)測(cè)試中的評(píng)估表明,Qwen-Image-Edit在圖像編輯任務(wù)上具備SOTA性能,是一個(gè)強(qiáng)大的圖像編輯基礎(chǔ)模型。
其中,為了同時(shí)實(shí)現(xiàn)語(yǔ)義與外觀雙重的編輯能力,Qwen-Image-Edit將輸?圖像同時(shí)輸?到Qwen2.5-VL(實(shí)現(xiàn)視覺(jué)語(yǔ)義控制)和VAEEncoder(實(shí)現(xiàn)視覺(jué)外觀控制)。
換句話說(shuō),就是從創(chuàng)意裂變到精準(zhǔn)改字,所有常見(jiàn)的圖像編輯需求Qwen都能hold住。
最后,Qwen-Image-Edit的體驗(yàn)方式如下,感興趣的同學(xué)快去體驗(yàn)吧!
Qwen-Image-Edit:https://huggingface.co/spaces/Qwen/Qwen-Image-Edit
Qwenchat:https://chat.qwen.ai/
GitHub:https://github.com/QwenLM/Qwen-Image
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.