新智元報(bào)道
編輯:桃子 犀牛
【新智元導(dǎo)讀】剛剛,豆包·圖像創(chuàng)作模型Seedream 4.0同時(shí)登頂「文生圖」和「圖像編輯」兩項(xiàng)榜單!相比Nano Banana,Seedream 4.0在文生圖的清晰度和美感上優(yōu)勢(shì)較為明顯;在圖像編輯上則難分伯仲,僅小幅領(lǐng)先。
谷歌Nano Banana一夜爆火之后,各種邪修玩法兒,至今讓全網(wǎng)意猶未盡。
等距視角、多圖合成、老照片修復(fù)、3D手辦.......創(chuàng)意腦洞大開,全網(wǎng)玩瘋。
誰曾想,短短半個(gè)月后,大洋彼岸就殺出來了一個(gè)最強(qiáng)逆襲者!
就在剛剛,字節(jié)跳動(dòng)發(fā)布的豆包·圖像創(chuàng)作模型Seedream 4.0,一舉拿下了Artificial Analysis「文生圖」和「圖像編輯」兩大榜單的第一。
一鍵創(chuàng)作+編輯,原生4K分辨率,一次最多上傳10張參考圖。
如今,全網(wǎng)的畫風(fēng)是這樣子的——
左右滑動(dòng)查看
有網(wǎng)友隨手扔了一張糊到爹媽都不認(rèn)的圖,Seedream 4.0直出一張超清版的,簡(jiǎn)直是廢片秒變神作。
生圖不僅是它的強(qiáng)項(xiàng),Seedream 4.0還具備了超強(qiáng)的知識(shí)和推理能力。
就比如,一邊生圖,一邊解方程;生成的冰激凌配方圖,邏輯清晰;一鍵比較建筑特點(diǎn),美觀且要點(diǎn)明了......
左右滑動(dòng)查看
這是因?yàn)?,Seedream 4.0首次將「生成圖像」和「圖像編輯」(SeedEdit 3.0),全部整合到單體模型中。
相較于上一代,4.0版本生成文字清晰又準(zhǔn)確,尤其是在中文文字渲染上,效果碾壓GPT-4o、Gemini 2.5 Flash。
比如,我們想把下面這聽飲料上面的字換成「新智元」。
Seedream 4.0給出的結(jié)果,不僅光影正確,而且字體也很有設(shè)計(jì)感。
相比之下,谷歌Nano Banana生成的,除了「新」字之外,可以說是是驢唇不對(duì)馬嘴。
更多對(duì)比如下:
左右滑動(dòng)查看
可以說,Seedram 4.0的橫空出世,一夜之間掩蓋了谷歌「香蕉」所有光芒。
現(xiàn)在,打開「火山方舟體驗(yàn)中心」,就可以免費(fèi)體驗(yàn)4K高清多模態(tài)生圖了!
點(diǎn)擊【閱讀原文】即可直達(dá),傳送門:https://www.volcengine.com/experience/ark?launch=seedream
一手實(shí)測(cè),更適合中國寶寶
多圖融合,是最常見的一種玩法兒。
不論是「雙人同框」,還是每日穿搭、模仿火柴人動(dòng)作草圖等等,Seedream 4.0可以全部拿捏。
甚至,一次上傳10張參考圖,它都能以正確的邏輯融合成一張圖。
十圖無縫合成,生成專屬OOTD
就比如,今日份OOTD穿搭,Seedream 4.0就能直接幫你承包了。
讓圖1女孩穿上圖2的穿搭
上傳一張個(gè)人照片,再淘一張穿搭圖,上身效果如何,幾秒就能get了。
令人驚艷的是,照片生成的太自然了,人物一致性非常高,肉眼根本辨別不出是AI生成的。
再換一套簡(jiǎn)約風(fēng)格的,果然人美穿啥都好看。
接下來加大難度,一次上傳八張圖片:一張主角,五張配飾,外加一只杜賓和一輛吉普汽車。
為了讓圖像呈現(xiàn)得更加美觀,提示要求男子站在汽車一旁,狗緊挨著男主。
圖1的男子穿上第2、3、4、5、6張圖的穿搭,站在第八張圖汽車前,第七張圖小狗站在男人身旁
不得不說,Seedream 4.0理解力一絕,還能準(zhǔn)確地給男主穿上衣服,戴上配飾。
隨便一個(gè)pose模板,Seedream 4.0便可以讓任何人做出相同的動(dòng)作。
一位古裝女子和一位畫上的皇帝,做圖3的擺拍,那會(huì)是怎樣的效果?
將圖1、圖2合進(jìn)一張圖里,參考圖3姿勢(shì)
快看,這張合照堪稱「天作之合」,真是挑不出一點(diǎn)毛病,比拍照還真。
再比如,自己想要一張和霉霉合照,Seedream 4.0就可以幫你實(shí)現(xiàn)愿望。
圖1和圖2女生合拍,兩人表現(xiàn)自然一些,背景是上海東方明珠夜景
上傳兩張圖后,一句話,即可無縫合成。
可以看到,照片中人物的衣服、頭發(fā)顏色等細(xì)節(jié)非常一致,而且動(dòng)作自然,沒有出現(xiàn)人物失真的情況。
現(xiàn)場(chǎng)手繪一個(gè)「火柴人」,就讓犬夜叉和殺生丸來一個(gè)打斗擺拍。
讓圖1和圖2兩個(gè)人,模仿圖3的姿勢(shì)
沒想到,就這么隨筆一畫,讓Seedream 4.0就讓動(dòng)漫人活靈活現(xiàn)了。
還有3D物理世界小人,Seedream 4.0也可讓其動(dòng)作1:1復(fù)刻。
圖1女生做圖2的動(dòng)作
連續(xù)生圖,淘汰制片人?
想連續(xù)做動(dòng)畫或視頻,缺少靈感?
Seedream 4.0還具備了強(qiáng)大的「連續(xù)生圖」的能力,只要輸入劇情描述,AI即可自動(dòng)生成多個(gè)關(guān)鍵畫面幀。
最后,再借助AI視頻工具,合成動(dòng)態(tài)視頻。
從故事腳本到視覺呈現(xiàn),一個(gè)人即可輕松搞定Vlog、創(chuàng)意短片,從此制作效率翻倍。
舉個(gè)栗子,你可以讓名畫中的人,在同一時(shí)空下相遇。
圖1的梵高和圖二的蒙娜麗莎,在圖3的一家酒吧里偶遇,然后兩人在圖4露天小餐館暢談,需要環(huán)境的局部特寫,比如酒館的光影,酒杯特寫等。
梵高和蒙娜麗莎在一家酒吧偶遇后,兩人又去戶外小餐館暢聊。
動(dòng)漫連載,下一個(gè)宮崎駿是你
我們?cè)賮碜鲆粋€(gè)動(dòng)漫連環(huán)畫,上傳一張有人物角色的照片。
然后,若是想要指定的畫面,把所有故事分鏡的腳本扔給Seedream 4.0。
保持封面參考圖的繪畫風(fēng)格和封面的主體,下面每句話幫忙生成一句故事分鏡(一共5個(gè)分鏡):
1. 夏日清晨,小女孩背著繡小熊的布包,牽著卷毛小狗從家門口出發(fā),門廊竹席上還放著沒喝完的綠豆湯。
2. 兩人走到公園長(zhǎng)椅旁,小狗突然追著粉蝴蝶跑遠(yuǎn),小女孩舉著剛摘的狗尾草。
3. 路過野菊花叢,小女孩蹲下來摘小黃花,小狗叨起一朵送到她手邊,花瓣上還有露珠。
4. 聽到遠(yuǎn)處賣冰粉的叫賣聲,小女孩牽著小狗跑過去,買了碗紅糖冰粉,用小勺子喂小狗嘗了口。
5. 突然下起小雨,小女孩拉著小狗躲進(jìn)公園的木亭子,小狗縮在她腳邊,用腦袋挨著她。
不一會(huì)兒工夫,五個(gè)分鏡全部出來了。畫面效果非常驚艷,而且人物畫面全部保持一致。
左右滑動(dòng)查看
電影分鏡,堪比好萊塢大片
一直以來,人們都難以相信,一款A(yù)I工具如何能砸掉制片人的飯碗?
當(dāng)你真正體驗(yàn)之后,就會(huì)驚嘆這就是現(xiàn)實(shí)!
接下來,上傳一張女主和一張男主的照片,任何人就可以直接拍出一部短劇。
prompt:參考圖片形象,生成三種影視分鏡:第一幕女主去買帽子;第二幕轉(zhuǎn)角遇到了圖2的帥氣男子;第三幕男主向女主表達(dá)愛慕,兩人微笑。復(fù)古風(fēng)格。
第一幕:女主去買帽子。
值得一提的是,在第一幕畫面生成中,Seedream 4.0還整了一個(gè)高難度——鏡面。
可以看到,女主表情和鏡子中一致,包括帽子、耳釘、珍珠項(xiàng)鏈、衣服等等,和原圖保持高度一致。
第二幕,女主出門轉(zhuǎn)角,偶遇到了男主。
這一幕中,Seedream 4.0放大了視角,營(yíng)造了一種「魔法版」的偶遇,逼真還原了男女主。
第三幕,男主向女主表達(dá)愛慕。
注意看,這里的鏡頭又被拉近,男女主之間的甜蜜溢出了屏幕,一根羽毛成為了他們之間愛情的見證。
是不是感覺情節(jié)太過精彩,還沒有看夠。不如,接下來的故事,就由你們來續(xù)寫~
創(chuàng)意玩法,腦洞大開
除了多圖融合、連續(xù)生圖,Seedream 4.0還有各種本領(lǐng)。
比如,讓它取出漢堡的所有餡料,只保留頂部和底部的面包片。而且,兩個(gè)面包片之間空隙間隔,要與原來的一致。
Remove all the ingredients from the burger and keep only the top and bottom buns. Leave a gap between them, keeping the same spacing as if the fillings were still inside.
一個(gè)只有面包,沒有夾層的漢堡就閃現(xiàn)了。
它還可以生成一個(gè)可愛小狗的桌面手辦。
根據(jù)草圖,生成對(duì)應(yīng)主體的立體搪膠手辦,擺放在深色電腦桌上
除了圖片的生成和編輯外,Seedream 4.0還擁有智能——它真的理解圖片上的內(nèi)容。
比如讓它推斷生成,一張上海東方明珠照片12個(gè)小時(shí)后的樣子。
12個(gè)小時(shí)后,城市展示的景色
模型不僅正確推斷出12小時(shí)后是夜景,而且建筑物的細(xì)節(jié)、角度等也都非常完美的還原。
補(bǔ)全后的4k圖像真的是相當(dāng)清晰。
再比如,給它一個(gè)時(shí)間,然后問1分鐘之后會(huì)顯示什么。
Seedream 4.0也能正確推斷出相應(yīng)的時(shí)間,而且其他參數(shù)也都沒有隨意改動(dòng)。
草圖建模也不在話下。
設(shè)計(jì)師有福了。
根據(jù)草圖,設(shè)計(jì)出完整建筑,并上色
可以看到,模型不僅完美還原出建筑的設(shè)計(jì)細(xì)節(jié)以及外部材料的質(zhì)感,為了方便展示頂部的設(shè)計(jì),它甚至還改變了視角。
簡(jiǎn)直太貼心了。
還可以反過來玩,將建筑轉(zhuǎn)換成模型,而且是不同的角度。
這都需要模型進(jìn)行很多推理。
把建筑做成不同視角的全景模型,白色的背景,微縮模型,需要四張,不同角度,分別是鳥瞰圖、頂視圖、側(cè)視圖、仰視圖
最近還流行的一種玩法是制作教程。
比如讓Seedream 4.0生成一張牛肉漢堡制作步驟教程圖,繪制在手賬本上。
可以看到最后的教程步驟清晰,實(shí)用性很高。
彩鉛手賬風(fēng)格,出一個(gè)牛肉漢堡制作步驟教程圖,步驟說明要中文,女生手寫可愛字體,繪制在一個(gè)手賬本上
更進(jìn)一步的應(yīng)用是制作信息圖表。
這個(gè)應(yīng)用不僅好玩兒,還更有教育意義——一下子把枯燥的文字知識(shí)變成圖表,讓學(xué)習(xí)的效率指數(shù)型上升。
舉個(gè)栗子:牛頓第二定律。
提示詞:“牛頓第二定律”信息圖表,包括科普文字、示意圖和基礎(chǔ)物理公式,分列進(jìn)行排版
太香了。上學(xué)時(shí)要是有這東西,我的成績(jī)絕對(duì)還能上升兩個(gè)層次。
一鍵接入API
當(dāng)然,作為一家云平臺(tái),火山引擎也支持API接入,面向開發(fā)者解鎖更多玩法。
在火山引擎拿到自己的API KEY后,只需點(diǎn)擊上圖中的API接入,就可以看到調(diào)用的示例代碼。
在紅框內(nèi)換成自己的API KEY后,直接復(fù)制代碼放到終端即可。
大家看一下Seedream 4.0文生圖的質(zhì)量。
生成3張女孩和奶牛玩偶在游樂園開心地坐過山車的圖片,涵蓋早晨、中午、晚上
除了文生圖外,API還支持圖生圖、多圖融合、組圖輸出等多種玩法,大家可以自己去體驗(yàn)。
點(diǎn)擊【閱讀原文】即可直達(dá),傳送門:https://www.volcengine.com/experience/ark?launch=seedream
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.