網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

剛剛，字節(jié)登頂世界最強(qiáng)圖像AI！一手實(shí)測(cè)原生4K、10圖融合，全網(wǎng)玩瘋

2025-09-12 10:49:00　來源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：桃子犀牛

【新智元導(dǎo)讀】剛剛，豆包·圖像創(chuàng)作模型Seedream 4.0同時(shí)登頂「文生圖」和「圖像編輯」兩項(xiàng)榜單！相比Nano Banana，Seedream 4.0在文生圖的清晰度和美感上優(yōu)勢(shì)較為明顯；在圖像編輯上則難分伯仲，僅小幅領(lǐng)先。

谷歌Nano Banana一夜爆火之后，各種邪修玩法兒，至今讓全網(wǎng)意猶未盡。

等距視角、多圖合成、老照片修復(fù)、3D手辦.......創(chuàng)意腦洞大開，全網(wǎng)玩瘋。

誰曾想，短短半個(gè)月后，大洋彼岸就殺出來了一個(gè)最強(qiáng)逆襲者！

就在剛剛，字節(jié)跳動(dòng)發(fā)布的豆包·圖像創(chuàng)作模型Seedream 4.0，一舉拿下了Artificial Analysis「文生圖」和「圖像編輯」兩大榜單的第一。

一鍵創(chuàng)作+編輯，原生4K分辨率，一次最多上傳10張參考圖。

如今，全網(wǎng)的畫風(fēng)是這樣子的——

左右滑動(dòng)查看

有網(wǎng)友隨手扔了一張糊到爹媽都不認(rèn)的圖，Seedream 4.0直出一張超清版的，簡(jiǎn)直是廢片秒變神作。

生圖不僅是它的強(qiáng)項(xiàng)，Seedream 4.0還具備了超強(qiáng)的知識(shí)和推理能力。

就比如，一邊生圖，一邊解方程；生成的冰激凌配方圖，邏輯清晰；一鍵比較建筑特點(diǎn)，美觀且要點(diǎn)明了......

左右滑動(dòng)查看

這是因?yàn)?，Seedream 4.0首次將「生成圖像」和「圖像編輯」（SeedEdit 3.0），全部整合到單體模型中。

相較于上一代，4.0版本生成文字清晰又準(zhǔn)確，尤其是在中文文字渲染上，效果碾壓GPT-4o、Gemini 2.5 Flash。

比如，我們想把下面這聽飲料上面的字換成「新智元」。

Seedream 4.0給出的結(jié)果，不僅光影正確，而且字體也很有設(shè)計(jì)感。

相比之下，谷歌Nano Banana生成的，除了「新」字之外，可以說是是驢唇不對(duì)馬嘴。

更多對(duì)比如下：

左右滑動(dòng)查看

可以說，Seedram 4.0的橫空出世，一夜之間掩蓋了谷歌「香蕉」所有光芒。

現(xiàn)在，打開「火山方舟體驗(yàn)中心」，就可以免費(fèi)體驗(yàn)4K高清多模態(tài)生圖了！

點(diǎn)擊【閱讀原文】即可直達(dá)，傳送門：https://www.volcengine.com/experience/ark?launch=seedream

一手實(shí)測(cè)，更適合中國寶寶

多圖融合，是最常見的一種玩法兒。

不論是「雙人同框」，還是每日穿搭、模仿火柴人動(dòng)作草圖等等，Seedream 4.0可以全部拿捏。

甚至，一次上傳10張參考圖，它都能以正確的邏輯融合成一張圖。

十圖無縫合成，生成專屬OOTD

就比如，今日份OOTD穿搭，Seedream 4.0就能直接幫你承包了。

讓圖1女孩穿上圖2的穿搭

上傳一張個(gè)人照片，再淘一張穿搭圖，上身效果如何，幾秒就能get了。

令人驚艷的是，照片生成的太自然了，人物一致性非常高，肉眼根本辨別不出是AI生成的。

再換一套簡(jiǎn)約風(fēng)格的，果然人美穿啥都好看。

接下來加大難度，一次上傳八張圖片：一張主角，五張配飾，外加一只杜賓和一輛吉普汽車。

為了讓圖像呈現(xiàn)得更加美觀，提示要求男子站在汽車一旁，狗緊挨著男主。

圖1的男子穿上第2、3、4、5、6張圖的穿搭，站在第八張圖汽車前，第七張圖小狗站在男人身旁

不得不說，Seedream 4.0理解力一絕，還能準(zhǔn)確地給男主穿上衣服，戴上配飾。

隨便一個(gè)pose模板，Seedream 4.0便可以讓任何人做出相同的動(dòng)作。

一位古裝女子和一位畫上的皇帝，做圖3的擺拍，那會(huì)是怎樣的效果？

將圖1、圖2合進(jìn)一張圖里，參考圖3姿勢(shì)

快看，這張合照堪稱「天作之合」，真是挑不出一點(diǎn)毛病，比拍照還真。

再比如，自己想要一張和霉霉合照，Seedream 4.0就可以幫你實(shí)現(xiàn)愿望。

圖1和圖2女生合拍，兩人表現(xiàn)自然一些，背景是上海東方明珠夜景

上傳兩張圖后，一句話，即可無縫合成。

可以看到，照片中人物的衣服、頭發(fā)顏色等細(xì)節(jié)非常一致，而且動(dòng)作自然，沒有出現(xiàn)人物失真的情況。

現(xiàn)場(chǎng)手繪一個(gè)「火柴人」，就讓犬夜叉和殺生丸來一個(gè)打斗擺拍。

讓圖1和圖2兩個(gè)人，模仿圖3的姿勢(shì)

沒想到，就這么隨筆一畫，讓Seedream 4.0就讓動(dòng)漫人活靈活現(xiàn)了。

還有3D物理世界小人，Seedream 4.0也可讓其動(dòng)作1:1復(fù)刻。

圖1女生做圖2的動(dòng)作

連續(xù)生圖，淘汰制片人？

想連續(xù)做動(dòng)畫或視頻，缺少靈感？

Seedream 4.0還具備了強(qiáng)大的「連續(xù)生圖」的能力，只要輸入劇情描述，AI即可自動(dòng)生成多個(gè)關(guān)鍵畫面幀。

最后，再借助AI視頻工具，合成動(dòng)態(tài)視頻。

從故事腳本到視覺呈現(xiàn)，一個(gè)人即可輕松搞定Vlog、創(chuàng)意短片，從此制作效率翻倍。

舉個(gè)栗子，你可以讓名畫中的人，在同一時(shí)空下相遇。

圖1的梵高和圖二的蒙娜麗莎，在圖3的一家酒吧里偶遇，然后兩人在圖4露天小餐館暢談，需要環(huán)境的局部特寫，比如酒館的光影，酒杯特寫等。

梵高和蒙娜麗莎在一家酒吧偶遇后，兩人又去戶外小餐館暢聊。

動(dòng)漫連載，下一個(gè)宮崎駿是你

我們?cè)賮碜鲆粋€(gè)動(dòng)漫連環(huán)畫，上傳一張有人物角色的照片。

然后，若是想要指定的畫面，把所有故事分鏡的腳本扔給Seedream 4.0。

保持封面參考圖的繪畫風(fēng)格和封面的主體，下面每句話幫忙生成一句故事分鏡（一共5個(gè)分鏡）：

1. 夏日清晨，小女孩背著繡小熊的布包，牽著卷毛小狗從家門口出發(fā)，門廊竹席上還放著沒喝完的綠豆湯。

2. 兩人走到公園長(zhǎng)椅旁，小狗突然追著粉蝴蝶跑遠(yuǎn)，小女孩舉著剛摘的狗尾草。

3. 路過野菊花叢，小女孩蹲下來摘小黃花，小狗叨起一朵送到她手邊，花瓣上還有露珠。

4. 聽到遠(yuǎn)處賣冰粉的叫賣聲，小女孩牽著小狗跑過去，買了碗紅糖冰粉，用小勺子喂小狗嘗了口。

5. 突然下起小雨，小女孩拉著小狗躲進(jìn)公園的木亭子，小狗縮在她腳邊，用腦袋挨著她。

不一會(huì)兒工夫，五個(gè)分鏡全部出來了。畫面效果非常驚艷，而且人物畫面全部保持一致。

左右滑動(dòng)查看

電影分鏡，堪比好萊塢大片

一直以來，人們都難以相信，一款A(yù)I工具如何能砸掉制片人的飯碗？

當(dāng)你真正體驗(yàn)之后，就會(huì)驚嘆這就是現(xiàn)實(shí)！

接下來，上傳一張女主和一張男主的照片，任何人就可以直接拍出一部短劇。

prompt：參考圖片形象，生成三種影視分鏡：第一幕女主去買帽子；第二幕轉(zhuǎn)角遇到了圖2的帥氣男子；第三幕男主向女主表達(dá)愛慕，兩人微笑。復(fù)古風(fēng)格。

第一幕：女主去買帽子。

值得一提的是，在第一幕畫面生成中，Seedream 4.0還整了一個(gè)高難度——鏡面。

可以看到，女主表情和鏡子中一致，包括帽子、耳釘、珍珠項(xiàng)鏈、衣服等等，和原圖保持高度一致。

第二幕，女主出門轉(zhuǎn)角，偶遇到了男主。

這一幕中，Seedream 4.0放大了視角，營(yíng)造了一種「魔法版」的偶遇，逼真還原了男女主。

第三幕，男主向女主表達(dá)愛慕。

注意看，這里的鏡頭又被拉近，男女主之間的甜蜜溢出了屏幕，一根羽毛成為了他們之間愛情的見證。

是不是感覺情節(jié)太過精彩，還沒有看夠。不如，接下來的故事，就由你們來續(xù)寫～

創(chuàng)意玩法，腦洞大開

除了多圖融合、連續(xù)生圖，Seedream 4.0還有各種本領(lǐng)。

比如，讓它取出漢堡的所有餡料，只保留頂部和底部的面包片。而且，兩個(gè)面包片之間空隙間隔，要與原來的一致。

Remove all the ingredients from the burger and keep only the top and bottom buns. Leave a gap between them, keeping the same spacing as if the fillings were still inside.

一個(gè)只有面包，沒有夾層的漢堡就閃現(xiàn)了。

它還可以生成一個(gè)可愛小狗的桌面手辦。

根據(jù)草圖，生成對(duì)應(yīng)主體的立體搪膠手辦，擺放在深色電腦桌上

除了圖片的生成和編輯外，Seedream 4.0還擁有智能——它真的理解圖片上的內(nèi)容。

比如讓它推斷生成，一張上海東方明珠照片12個(gè)小時(shí)后的樣子。

12個(gè)小時(shí)后，城市展示的景色

模型不僅正確推斷出12小時(shí)后是夜景，而且建筑物的細(xì)節(jié)、角度等也都非常完美的還原。

補(bǔ)全后的4k圖像真的是相當(dāng)清晰。

再比如，給它一個(gè)時(shí)間，然后問1分鐘之后會(huì)顯示什么。

Seedream 4.0也能正確推斷出相應(yīng)的時(shí)間，而且其他參數(shù)也都沒有隨意改動(dòng)。

草圖建模也不在話下。

設(shè)計(jì)師有福了。

根據(jù)草圖，設(shè)計(jì)出完整建筑，并上色

可以看到，模型不僅完美還原出建筑的設(shè)計(jì)細(xì)節(jié)以及外部材料的質(zhì)感，為了方便展示頂部的設(shè)計(jì)，它甚至還改變了視角。

簡(jiǎn)直太貼心了。

還可以反過來玩，將建筑轉(zhuǎn)換成模型，而且是不同的角度。

這都需要模型進(jìn)行很多推理。

把建筑做成不同視角的全景模型，白色的背景，微縮模型，需要四張，不同角度，分別是鳥瞰圖、頂視圖、側(cè)視圖、仰視圖

最近還流行的一種玩法是制作教程。

比如讓Seedream 4.0生成一張牛肉漢堡制作步驟教程圖，繪制在手賬本上。

可以看到最后的教程步驟清晰，實(shí)用性很高。

彩鉛手賬風(fēng)格，出一個(gè)牛肉漢堡制作步驟教程圖，步驟說明要中文，女生手寫可愛字體，繪制在一個(gè)手賬本上

更進(jìn)一步的應(yīng)用是制作信息圖表。

這個(gè)應(yīng)用不僅好玩兒，還更有教育意義——一下子把枯燥的文字知識(shí)變成圖表，讓學(xué)習(xí)的效率指數(shù)型上升。

舉個(gè)栗子：牛頓第二定律。

提示詞：“牛頓第二定律”信息圖表，包括科普文字、示意圖和基礎(chǔ)物理公式，分列進(jìn)行排版

太香了。上學(xué)時(shí)要是有這東西，我的成績(jī)絕對(duì)還能上升兩個(gè)層次。

一鍵接入API

當(dāng)然，作為一家云平臺(tái)，火山引擎也支持API接入，面向開發(fā)者解鎖更多玩法。

在火山引擎拿到自己的API KEY后，只需點(diǎn)擊上圖中的API接入，就可以看到調(diào)用的示例代碼。

在紅框內(nèi)換成自己的API KEY后，直接復(fù)制代碼放到終端即可。

大家看一下Seedream 4.0文生圖的質(zhì)量。

生成3張女孩和奶牛玩偶在游樂園開心地坐過山車的圖片，涵蓋早晨、中午、晚上

除了文生圖外，API還支持圖生圖、多圖融合、組圖輸出等多種玩法，大家可以自己去體驗(yàn)。

點(diǎn)擊【閱讀原文】即可直達(dá)，傳送門：https://www.volcengine.com/experience/ark?launch=seedream

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.