不圓 時(shí)令 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
爆火的神秘圖像編輯模型nano-banana,終于脫掉了“香蕉皮”!
就在今天,谷歌官方認(rèn)領(lǐng),并表明這個(gè)模型其實(shí)是Gemini 2.5 Flash Image。
最新一波官方Demo也來了:
還展現(xiàn)出了高超的圖像推理能力:
現(xiàn)在該模型可以在Gemini和Google AI Studio上免費(fèi)使用,同時(shí)API以每張圖像0.039$(折合人民幣0.28¥)的價(jià)格開放。
模型的具體表現(xiàn)如何?一起來看~
出色的圖像編輯能力
官方給出了很多有趣的用法。
除了常規(guī)的修圖方式,它還可以合并最多三張圖片來創(chuàng)造新事物。
生成超現(xiàn)實(shí)藝術(shù),組合不同的照片元素,或無縫融合物體、顏色和紋理。
或者輕松實(shí)現(xiàn)設(shè)計(jì)想法。
還可以用幾張照片生成堪稱電影畫面的連貫劇情故事。
而在官方實(shí)錘之前,網(wǎng)友們也早就被nano-banana的各種私家case吸引,開啟瘋狂討論。
比如說精準(zhǔn)改變面部表情和天氣。
或者讓禿頭男人重新?lián)碛胁煌l(fā)型。
網(wǎng)友表示:PhotoShop岌岌可危。
畢竟這個(gè)“香蕉”不僅可以完成平面圖像的編輯,甚至還可以進(jìn)行2D到3D的轉(zhuǎn)換。用戶只需提供一張普通的2D圖片,系統(tǒng)就可自動(dòng)生成相應(yīng)的3D視角,每一個(gè)角度都是恰到好處、和諧統(tǒng)一。
最最最牛的是,它竟然還可以進(jìn)行圖像推理。勾股定理so easy,計(jì)算角度手拿把掐,識(shí)別圖像里的水母結(jié)構(gòu),竟然也是瞬間反應(yīng),堪稱你畫我猜AI版。
說實(shí)話,最讓我佩服的是,當(dāng)我們要求此“香蕉”給出一個(gè)人從A到B的方案時(shí),它竟然直接生成一個(gè)梯子!
好好好,圖像編輯器真的能思考了。
我們自己也實(shí)測了一下這款模型,發(fā)現(xiàn)它確實(shí)很有意思:
給它一只貓貓,貓能環(huán)游世界。
提示詞:以這只貓為主角,生成旅游照。
提示詞:讓貓貓去故宮拍張自拍照。
如果不想做真實(shí)場景,讓林黛玉和孫悟空成為漫威英雄并肩戰(zhàn)斗也就一句話的事兒~
另外,它對光影的細(xì)節(jié)理解也相當(dāng)真實(shí)。
提示詞:一根香蕉被放在廚房臺(tái)面上,旁邊有水杯、刀具和切菜板,陽光從窗戶照進(jìn)來,香蕉投下自然陰影。
可以看到生成結(jié)果還是很不錯(cuò)滴,陽光透過水杯折射的影子以及旁邊植物的影子都還算合理。
它還能夠很好地抓取角色特征,不出意外地改變角色主體:
如果那一年,工藤新一喝下的并不是縮小藥水,而是……
神秘香蕉模型
Nano Banana最初出現(xiàn)在一個(gè)名為LMArena的網(wǎng)站上,這是一個(gè)讓不同AI模型匿名進(jìn)行“戰(zhàn)斗模式”競賽的地方。
而讓Nano-banana爆火的原因無他,表現(xiàn)實(shí)在太好了。
這又是一個(gè)SOTA級別的圖像編輯模型——而且在一開始沒有任何官方文檔。
不過在官方宣布之前,已經(jīng)有一些人猜到了這是谷歌家族的一員。
一方面,該模型的表現(xiàn)與Gemini近期發(fā)布的多模態(tài)版本相似,這樣出色的性能很難是車庫團(tuán)隊(duì)的產(chǎn)品。
另一方面,它的發(fā)布策略——匿名發(fā)布、無品牌標(biāo)識(shí)、讓用戶群體自行探索——與DeepMind早期在匿名測試平臺(tái)上評估大語言模型的方式如出一轍。
還有一點(diǎn)額外原因:一些與谷歌有關(guān)聯(lián)的開發(fā)者在社交媒體上發(fā)了奇怪的香蕉內(nèi)容
有網(wǎng)友問到Google為什么要選擇秘密發(fā)布,官方給出了這樣的解釋:
正在為全球規(guī)模的發(fā)布做準(zhǔn)備工作。
網(wǎng)友:何時(shí)發(fā)布完整版本
既然官方都那樣說了,網(wǎng)友們也坐不住了。
紛紛表示:那我們能用完整版了嗎?
不過,雖然這個(gè)模型在圖像生成的表現(xiàn)確實(shí)很好,但并不意味著它沒有問題——
尤其是在大公司的服務(wù)政策下,很容易出現(xiàn)一些讓人比較抓狂的情況:
有網(wǎng)友認(rèn)為,這是一個(gè)非常有趣的營銷方式,并且確實(shí)達(dá)到了他們想要的效果。
感興趣的朋友也可以去試一下這個(gè)香蕉,哦不,這個(gè)Gemini 2.5 Flash Image。
參考鏈接:
[1]https://x.com/googleaistudio/status/1960344388560904213
[2]https://x.com/OfficialLoganK/status/1960343135436906754
[3]https://aistudio.google.com/prompts/new_chat?model=gemini-2.5-flash-image-preview
[4]https://techcrunch.com/2025/08/26/google-geminis-ai-image-model-gets-a-bananas-upgrade/
[5]https://deepmind.google/models/gemini/image/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.