最近,朋友圈和抖音小紅書幾乎被 Nano Banana 刷屏了。這個(gè)香蕉模型似乎要讓 P 圖這個(gè)詞消失,直接給 Gemini 帶來了一千萬的新用戶,火得一塌糊涂。
各路大神的邪修玩法鋪天蓋地,什么 3D 手辦、大佬合影都是基操了。雖然 Nano Banana 強(qiáng)得不行,但在留言區(qū)依然收到不少用戶的疑問和需求。
首先使用門檻就攔住了不少人,甚至比在國(guó)內(nèi)用 ChatGPT 還麻煩一些。在圖片編輯過程,最多人反饋的是 Nano Banana 圖片分辨率不夠高,以及比例高度不可控。
說實(shí)在,我也感覺自己有點(diǎn)吹毛求疵,但沒想到,這些需求真的有人聽了進(jìn)去,并且做了出來,而且還是咱們國(guó)產(chǎn)廠商。
剛剛,火山引擎正式上線豆包?圖像創(chuàng)作模型 Seedream 4.0。
除了具備「超強(qiáng)主體一致性、多圖靈活創(chuàng)作、連續(xù)生圖」等核心能力,Seedream 4.0 還有一個(gè) Nano Banana 也沒有的功能——支持最高 4K 高清圖片輸出。
這也是首個(gè)最高支持 4K 多模態(tài)生圖的模型,目前企業(yè)用戶已經(jīng)可以通過火山方舟搶先體驗(yàn)了。
個(gè)人用戶也不用眼饞,4K 版將于今晚 20:00 首次開放給個(gè)人用戶,搜索「火山方舟體驗(yàn)中心」,即可第一時(shí)間體驗(yàn)。
Seedream 4.0 同時(shí)也在豆包、即夢(mèng)全量上線,最高支持 2K 輸出。
實(shí)際表現(xiàn)如何需要拉出來溜溜。APPSO 提前拿到內(nèi)測(cè)體驗(yàn)了幾天,給它上點(diǎn)比 Nano Banana 更大的強(qiáng)度。
實(shí)測(cè)完后我發(fā)現(xiàn),雖然也不能算完美,但國(guó)產(chǎn)生圖確實(shí)來到了一個(gè)新的階段。
我替蘋果把 iPhone 17 Air 提前發(fā)布了
今晚就是蘋果秋季發(fā)布會(huì)了,不用熬夜看直播,APPSO 先把幫蘋果把 iPhone 17 給上線了
我們用 Seedream4.0 生成了兩款今年大火的 iPhone 17 Air 產(chǎn)品頁面,這可是今年最受關(guān)注的超薄旗艦。
參考 iPhone 16Pro 的官網(wǎng)頁面,替換手機(jī)和相關(guān)文案,保證果味十足
這個(gè)構(gòu)圖似乎有些古板,調(diào)整一下小字 ,再加上 Just 5.5mm thin 這個(gè)最大的亮點(diǎn)。可以看到 Seedream4.0 生成的這版 iPhone 17 Air 將手握機(jī)身的傾角,剛好和字母 A 右邊平行,有點(diǎn)資深設(shè)計(jì)師的審美了。
這次,我們不讓庫(kù)克來發(fā)布產(chǎn)品,有請(qǐng)?zhí)厮估诵螜C(jī)器人來客串一把。還是熟悉的場(chǎng)景,熟悉的 Good Morning(doge)。
這組圖用到了三張參考圖,人形機(jī)器人、iPhone 17 Air ,以及庫(kù)克的現(xiàn)場(chǎng)圖,Seedream4.0 一致性確實(shí)有點(diǎn)東西。
其實(shí)這里還有個(gè)逆天的細(xì)節(jié)容易被忽略,注意看觀察生成圖機(jī)器人頭盔上的反射細(xì)節(jié),原圖是漆黑一片的,也就說, Seedream 4.0 根據(jù)圖 3 的藍(lán)天白云和建筑物背景,推理出機(jī)器人應(yīng)該有的反射,真的太細(xì)了。
不妨再腦洞大開一點(diǎn),據(jù)稱 iPhone 17 Air 就是為了明年折疊屏手機(jī)做準(zhǔn)備。APPSO 用 Seedream4.0 也提前讓大家看看 iPhone 首款折疊手機(jī)的「實(shí)拍圖」。
眼尖的讀者可能已經(jīng)發(fā)覺,是不是跟華為新款的三折疊有點(diǎn)像,沒錯(cuò)我用了它作為參考圖,替換了上蘋果的攝像頭和logo,無論是構(gòu)圖、背景和水印的細(xì)節(jié)都完整保留了。
那干脆整一部蘋果的三折疊,其實(shí)也沒有人知道那一夜,蘋果和華為究竟發(fā)生了什么。
如果是「喬布斯」,他會(huì)怎么發(fā)布這款產(chǎn)品,我們請(qǐng) AI 老喬限時(shí)返場(chǎng)。
熟悉的身影,穿透屏幕的氣場(chǎng),讓我們?cè)俅胃吆簟窤mazing」。
好玩之外,還真能用
Nano Banana 能走紅,除了社交媒體的爆款玩法,更在于它的技術(shù)能「看得見未來」。無論是一致性、局部修改、換色還是多圖結(jié)合,都是能夠直接用在電商、營(yíng)銷、社交媒體等等場(chǎng)景里。
無論技術(shù)有多亮眼,如果不能應(yīng)用到生產(chǎn)力場(chǎng)景,也只是玩具。
下面我們看看 Seeddream 4.0 在一些實(shí)用場(chǎng)景能不能打。
我們先拿這兩天刷屏的紅月亮,融合到球鞋設(shè)計(jì)中。
我還想看看這款球鞋不同角度的展示,只需輸入類似「生成一只白色運(yùn)動(dòng)鞋,展示正面、側(cè)面和俯視視角」的提示詞,不管是用于打樣還是用于設(shè)計(jì)草圖,都直接一步到位。
如果我還想找一個(gè)模特用不同姿勢(shì)展示商品呢?找不到合適的參考照片也沒關(guān)系,直接畫個(gè)火柴人簡(jiǎn)筆畫就行。
Seeddream 4.0 基于手繪圖能有效控制模特姿勢(shì)的一致性,同時(shí)實(shí)現(xiàn)角度的合理變化,在多角度呈現(xiàn)上表現(xiàn)精準(zhǔn)。
像下面這個(gè)案例,我在提示詞里面沒有指定兩個(gè)人的站位,所以在它生成的 4 張照片里面,兩種站位都有,而且效果都很好,它像一個(gè)周到的乙方,如果你需求沒有很明確,那就把可能的情況都考慮到并把成品給你挑選。
▲ 提示詞:將圖1男子和圖2女子合進(jìn)一張畫面,參考圖3姿勢(shì)
如果說擁抱這種動(dòng)作太簡(jiǎn)單了,我們直接來一個(gè)舉高高的動(dòng)作,這次再指定多一張背景圖片。
▲ 提示詞:將圖3和圖1合進(jìn)一張畫面,參考圖2姿勢(shì),圖1是被舉起來的那個(gè)小孩;同時(shí)背景使用圖4。圖四的背景是來自浪浪山,兩個(gè)角色是羅小黑和他的師傅。
四個(gè)人的參考圖,Seedream 4.0 同樣可以很好的處理,保持和簡(jiǎn)筆畫的姿勢(shì)一致。
▲ 提示詞:把圖一的四個(gè)角色(西游記里面的師徒四人,沙僧、唐僧、豬八戒、孫悟空)按照?qǐng)D二的姿勢(shì)(疊羅漢)排布,沙僧、孫悟空和豬八戒在下面,唐僧在上面。
如果還想給模特更換妝造,我們發(fā)現(xiàn) Seeddream 4.0 也能準(zhǔn)確把握不同發(fā)型的特質(zhì):長(zhǎng)直發(fā)的柔順、盤發(fā)的干練以及卷發(fā)的弧度,全部都清晰呈現(xiàn)。
同時(shí),背景與人體保持高度一致,未出現(xiàn)邊緣模糊或形變問題,成功實(shí)現(xiàn)了在保留主體特征的基礎(chǔ)上對(duì)妝發(fā)風(fēng)格的精準(zhǔn)轉(zhuǎn)換——省了多少模特妝造費(fèi)用。
最讓我驚喜的要數(shù)線稿生成,線稿通常為簡(jiǎn)潔的線條勾勒,僅包含物體基本輪廓與結(jié)構(gòu),缺乏細(xì)節(jié)、色彩及質(zhì)感。在草圖轉(zhuǎn)渲染功能上,Seeddream 4.0 能將簡(jiǎn)單線稿轉(zhuǎn)化為高質(zhì)量成品圖。
不僅精準(zhǔn)填充豐富色彩,使物體視覺層次分明,還有細(xì)膩的光影處理與材質(zhì)模擬,比如包包的皮質(zhì)紋理、金屬配件光澤等。
它對(duì)于「高質(zhì)量渲染圖」的理解,可謂是逆天,除了靜物,還搭配了人像、場(chǎng)景,你沒想到的,它都替你想到了。
講真,Seeddream 4.0 這次更新后,對(duì)真實(shí)質(zhì)感的處理完全超出我的預(yù)期。
像皮具、金屬的紋理表現(xiàn)已經(jīng)很穩(wěn)了,但當(dāng)我看到它生成人的皮膚紋路時(shí),還是被秀到了。
這個(gè)皮膚紋理、隱約可見的青筋,甚至是手腕上自然的汗毛感,還有光線打在皮膚上的通透效果……所有細(xì)節(jié)都拿捏得非常到位,組合在一起就一個(gè)字:真。
而這組圖的原始參考圖是什么呢——
僅此而已。
細(xì)節(jié)還原仿佛真實(shí)拍攝,完美實(shí)現(xiàn)了真實(shí)世界照片擬合的需求。這都意味著模型能夠適度的「創(chuàng)作」,在參考圖和提示詞給定的范圍內(nèi),給出合理的發(fā)揮。
這種創(chuàng)作能力可以用在更有趣的玩法上,比如只需要一個(gè)矢量圖,就可以給 APPSO 生成一整套完整的周邊設(shè)計(jì)。
▲ 提示詞:參考這個(gè)LOGO,做一套品牌視覺設(shè)計(jì),品牌名稱為 APPSO,包括包裝袋、帽子、紙盒、卡片、手環(huán)、掛繩等。紅色視覺主色調(diào),趣味、簡(jiǎn)約現(xiàn)代風(fēng)格
Seeddream 4.0 的「創(chuàng)作」能力和直接生成樣品的玩法,極大地降低了制作成本。而且效果相當(dāng)不錯(cuò),模型捕捉到了「有趣味、簡(jiǎn)約現(xiàn)代」的核心風(fēng)格,將品牌 LOGO 巧妙地應(yīng)用在手機(jī)殼、卡套、掛繩和帽子上。
還有一點(diǎn)好評(píng)的是,Seeddream 4.0 支持最高 4K 分辨率的輸出,而 2K 分辨率直出只需要幾秒,能在電商等一些場(chǎng)景做到專業(yè)級(jí)輸出,有更大的后期空間。
更多邪修玩法
除此之外,APPSO 還發(fā)現(xiàn)了一些有趣的邪修玩法,也跟大家分享。
最基本的桌面手辦,當(dāng)然是不在話下,我們?cè)囋囎屓宋镒约?,拿著本人的手辦。
▲ 圖片來源:https://x.com/oden_ai_ai/status/1957414144417910924/photo/1
▲ 提示詞:將這張照片制作成一個(gè)角色模型。其后放置一個(gè)印有該角色圖像的盒子,以及一臺(tái)屏幕顯示 Blender 建模過程的電腦。在盒子前方添加一個(gè)圓形塑料底座,角色模型手辦站立在上面。并盡可能設(shè)置為室內(nèi)場(chǎng)景。
▲ 提示詞:照片級(jí)真實(shí)感。 然后照片中的人拿著一個(gè)手辦模型,這個(gè)模型是根據(jù)這張照片的主體人物,制作而成的一個(gè)角色模型,在自己的房間里,很滿意的微笑。房間里的電腦桌上,有一臺(tái)屏幕顯示 blender 建模該模型過程的電腦,同時(shí)有一個(gè)印有該角色圖像的包裝盒子,以及盒子前方有一個(gè)圓形塑料底座。
不僅拿在手里,還能掛在包上,照片的真實(shí)感和一致性保持都非常厲害。
▲ 提示詞:照片級(jí)真實(shí)感。 先將這張照片變成一個(gè)可愛掛件/亞克力材質(zhì)的扁平鑰匙扣/橡膠材質(zhì)的扁平鑰匙扣,掛在 lv 包包/圖二照片的包包上,然后她自己再背著這個(gè)有自己同一個(gè)角色掛件的包。
除了做手辦,我們還拿它來生成了一些攝影風(fēng)格極強(qiáng),但是又保持真實(shí)的照片。你的人生照片攝影師,可能會(huì)是Seedream 4.0 。
除了強(qiáng)大的一致性和多圖編輯能力,Seedream 4.0 還帶來了豐富的世界知識(shí)能力,生圖模型也能推理預(yù)測(cè),深度理解我們的提示詞和圖片,其背后的意圖。
例如我們上傳了一張杯子即將要掉在地上的圖片,然后輸入提示詞「下一秒這個(gè)畫面應(yīng)該是怎么樣的?」
杯子掉在了地上,同時(shí)能看到倒在地上的水,反射了部分杯子,和窗戶的光。
Seedream 4.0 除了知道一秒后會(huì)發(fā)生的事情,我們還能利用它的推理能力,整理自己的房間。
▲ 提示詞:把沙發(fā)上的被子和衣服都疊好
除了能把衣服整整齊齊地疊好,弄得滿是顏料的地板,Seedream 也能在打掃干凈的同時(shí),保持圖片內(nèi)現(xiàn)有元素的一致性。
▲ 提示詞:把這些顏料都收起來,地板擦干凈(雖然這好像是個(gè)桌面)
借助它的推理能力,還有一個(gè)更騷的玩法。
下面這個(gè)案例里,上傳的參考是模特圖,讓Seedream 4.0 把模特衣服的細(xì)節(jié)展示出來,模型接到的指令是細(xì)節(jié)圖——這當(dāng)中的距離,就要靠模型自己去「想明白」。
從結(jié)果來看相當(dāng)不錯(cuò),不僅版型準(zhǔn)確,對(duì)于局部細(xì)節(jié)展示這一指令跟隨也沒有問題。幾乎可以直接上架了。
生成表情包,Seedream 4.0 也是一把好手
參考網(wǎng)友 @op7418 的提示詞,我們也跑出了好幾版關(guān)于 AI 模型的表情包,一次可能不成功,那就多抽幾次卡就好,好在生成速度也夠快。
▲ 提示詞:幫我將角色變成類似圖 1 的白色輪廓貼紙,并添加一個(gè)俏皮白色輪廓短語「XXXX」。
▲ 圖一(左)來自@fenxxxx,圖二(右)
你或許看過《千里江山圖》這幅傳世名作,但你或許還遺漏了億點(diǎn)點(diǎn)細(xì)節(jié)。
同理可得,誰說《步輦圖》里沒有呆萌的 Labubu,以及在《韓熙載夜宴圖》的宴席中,突然出現(xiàn)一只從現(xiàn)代穿越過來的網(wǎng)紅柴犬 Kabosu,我也覺得毫無違和感,
不只是生圖神器,還是創(chuàng)意生產(chǎn)力平臺(tái)
體驗(yàn)下來,如果用一個(gè)詞來形容 Seedream 4.0,那必須是「六邊形戰(zhàn)士」。它像一個(gè)全能的創(chuàng)意總監(jiān) + 高效的制作團(tuán)隊(duì),讓你能快速得到想要的結(jié)果,同時(shí)對(duì)創(chuàng)作流程有更強(qiáng)的掌控感。
快,是第一體感。
基于 DiT-MoE 架構(gòu),Seedream 4.0 的計(jì)算效率比上一代猛增了 10 倍以上,最快 1.8 秒就能生成一張 2K 高清大圖。這種「秒級(jí)」響應(yīng),意味著極低的試錯(cuò)成本。
穩(wěn),則是生產(chǎn)力基石。
Seedream 4.0 的超強(qiáng)主體一致性能力,讓你無論是想給角色換個(gè)場(chǎng)景、換個(gè)畫風(fēng),還是調(diào)整姿勢(shì)視角,都能高度保持原有特征,避免了「畫風(fēng)突變」的尷尬 。
對(duì)于很多電商和品牌設(shè)計(jì)師來說,AI 不再是給一張海報(bào)換個(gè)顏色,而是能參考一個(gè) Logo,一鍵生成全套品牌視覺設(shè)計(jì),從包裝袋到手環(huán),風(fēng)格高度統(tǒng)一 。
品牌規(guī)范開始從一本厚重的 VI 手冊(cè),變成一行行可執(zhí)行的 prompt。
作為我們這樣的內(nèi)容創(chuàng)作者,它能讓你參考一個(gè)角色設(shè)定,批量生成漫畫分鏡或故事繪本,極大地提升內(nèi)容連載的效率和一致。
▲提示詞靈感來自@阿真Irene
而且在 Nano Banana 出來之后,已經(jīng)不少人基于它開發(fā)出了輕量級(jí)的小游戲或?qū)嵱霉ぞ?,我們看到了這類工具讓更多中小開發(fā)者把創(chuàng)意快速變成產(chǎn)品,而且獲得用戶認(rèn)可的可能性。
這幾天 Seedream 4.0 已經(jīng)開始刷屏社交媒體。熱鬧之外,我們也看到,Seedream 4.0 已經(jīng)不滿足于當(dāng)一個(gè)新奇的玩具,而是要成為一個(gè)可規(guī)?;?、可商用的創(chuàng)意生產(chǎn)力平臺(tái)。
文|李超凡、莫崇宇、劉婭、張子豪
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.