夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

圖像世界的信息熵:從噪聲中雕刻藝術(shù)

0
分享至

你面前有兩張圖片:

一張是桌面上的蘋(píng)果;另一張是人聲鼎沸的農(nóng)貿(mào)市場(chǎng)。視覺(jué)上,我們一眼就能感知后一張畫(huà)面信息更多、更復(fù)雜。


有一個(gè)數(shù)字能直接量化這兩張圖的信息多少,它就是信息熵(Information Entropy)。你應(yīng)該已經(jīng)猜到,農(nóng)貿(mào)市場(chǎng)圖的信息熵遠(yuǎn)遠(yuǎn)高于蘋(píng)果圖。

在圖像世界中,信息熵能衡量畫(huà)面的豐富程度與分布狀態(tài),直接影響我們的感官體驗(yàn),也貫穿于AI生成圖像的過(guò)程,決定著AI的創(chuàng)作風(fēng)格。

圖像世界中的信息熵

要弄清這個(gè)數(shù)字的來(lái)歷,得回到 1948 年。信息論之父克勞德·香農(nóng)提出了這個(gè)改變通信世界的概念:信息熵(也稱香農(nóng)熵),它衡量一個(gè)信息源的不確定性。

從數(shù)學(xué)表達(dá)來(lái)看,這個(gè)不確定性等于所有可能結(jié)果的發(fā)生概率與該結(jié)果信息量的加權(quán)平均:


其中,單個(gè)結(jié)果的信息量為:


將兩式結(jié)合,就得到信息熵的標(biāo)準(zhǔn)公式:


由此可見(jiàn),信息熵由結(jié)果的數(shù)量和概率共同決定,可能性越多、分布越均勻,熵值就越大。

舉個(gè)例子:拋一枚均勻硬幣時(shí)有兩個(gè)等可能結(jié)果,根據(jù)香農(nóng)熵公式,熵就是H=1 bit;擲一枚骰子有6個(gè)等可能結(jié)果,熵便上升為H= log26 ≈2.585 bit;在一本 5萬(wàn)詞的大詞典中隨機(jī)選擇一個(gè)詞,結(jié)果的不確定性大大增加,熵也飆升到H = log250000 ≈15.6 bit。

放到圖像的世界里,道理也完全一樣。

一張圖像可以看作由無(wú)數(shù)個(gè)像素組成,每個(gè)像素值(亮度、顏色)就是一個(gè)結(jié)果,統(tǒng)計(jì)所有結(jié)果的概率分布就能計(jì)算出整張圖的信息熵。像素分布不確定性越高,畫(huà)面越復(fù)雜,信息熵就越高。

比如一大片藍(lán)天,幾乎沒(méi)有顏色變化和細(xì)節(jié),像素值高度一致,畫(huà)面單調(diào)且可預(yù)測(cè),熵就很低。


但在一張色彩斑斕、細(xì)節(jié)繁復(fù)的珊瑚礁照片中,像素值覆蓋了大量可能性,包含不同色彩層次、形狀、紋理、光影等,像素的不確定性大大飆升,熵也就更高。


圖像壓縮 ≈ 信息熵的逼近

在圖像壓縮中,信息熵的作用尤其直觀。

壓縮的本質(zhì)就是去除冗余信息,信息熵則告訴你壓縮的極限。

圖像存儲(chǔ)的常用單位是bpp(bits per pixel),表示一張圖中每個(gè)像素需要多少比特來(lái)存儲(chǔ)。對(duì)無(wú)損壓縮來(lái)說(shuō),理論上它的最低值會(huì)接近圖像的信息熵。

香農(nóng)源編碼定理告訴我們:最省空間的編碼長(zhǎng)度下限就是信息熵,最多也只會(huì)多 1 bit。比如一張熵為5bpp的灰度圖,那就算用最好的無(wú)損壓縮也只能壓到接近5bpp。

這也是為什么低熵圖像更容易被壓縮。比如藍(lán)色天空,大部分像素完全相同,算法只需記錄同一顏色的重復(fù)次數(shù),文件就能壓到極小;而在細(xì)節(jié)繁瑣的珊瑚礁圖中,像素差異極大,冗余度低,壓縮空間自然有限。

美學(xué)中的黃金區(qū)間

審美的底層規(guī)律,也能用信息熵來(lái)解釋。

Berlyne的審美復(fù)雜度假說(shuō)指出:我們對(duì)畫(huà)面的喜好程度與畫(huà)面復(fù)雜度呈倒 U 型關(guān)系:圖像信息處在中等復(fù)雜度最受歡迎。


過(guò)于簡(jiǎn)單會(huì)顯得單調(diào)乏味,過(guò)于復(fù)雜又會(huì)讓大腦負(fù)荷過(guò)重。

信息熵恰好量化了這種復(fù)雜度:它衡量了畫(huà)面中像素分布的不確定性。能吸引注意力的作品,往往是熵被調(diào)控得很好的結(jié)果,在單調(diào)與混亂之間找到了一個(gè)合適點(diǎn)。

評(píng)估AI圖像質(zhì)量時(shí)也會(huì)用到信息熵。比如Inception Score用相對(duì)熵來(lái)衡量圖的清晰度和多樣性、基于CLIP的美學(xué)模型里,研究者也會(huì)加上熵相關(guān)的指標(biāo)來(lái)輔助打分。

這種「黃金熵」偏好并不僅限于視覺(jué),還出現(xiàn)在音樂(lè)、建筑、文學(xué)等領(lǐng)域。從建筑的裝飾密度風(fēng)格,到流行歌曲的旋律變化,人類感官似乎一直在追尋一種信息量剛剛好的美感。

在人類的眼里,信息熵決定了畫(huà)面的復(fù)雜度和觀感;在AI的世界里,它同樣決定著創(chuàng)作的節(jié)奏和風(fēng)格?,F(xiàn)在很流行的AI繪圖,創(chuàng)作過(guò)程其實(shí)就是一場(chǎng)熵空間的探索。

AI生圖中的熵軌跡

直覺(jué)上,你可能覺(jué)得AI畫(huà)畫(huà)是從一張白紙開(kāi)始,但事實(shí)恰好相反。

想象把一滴染料滴進(jìn)水中,顏色會(huì)迅速?gòu)募袪顟B(tài)向四周擴(kuò)散,直到均勻分布,這就是一個(gè)典型的熵增過(guò)程。AI生圖的正向擴(kuò)散過(guò)程與之十分類似。


當(dāng)今主流的AI生圖方法是一類稱為擴(kuò)散模型 (Diffusion Model)的概率生成模型,它的工作思路可以總結(jié)為:先破壞再重建。

擴(kuò)散模型的圖像生成任務(wù)分為兩個(gè)過(guò)程:正向擴(kuò)散和反向擴(kuò)散。

在訓(xùn)練階段,模型進(jìn)行正向擴(kuò)散:把一張清晰的訓(xùn)練圖像逐步加入隨機(jī)噪聲,直到圖像完全變成隨機(jī)噪聲。這一步就是在模擬熵增,就像染料擴(kuò)散的過(guò)程,從有序走向無(wú)序。模型能通過(guò)這個(gè)破壞的過(guò)程學(xué)明白圖像在加噪的每一步會(huì)丟失哪些結(jié)構(gòu)信息。

當(dāng)模型搞懂了這個(gè),也就擁有了從完全混亂的高熵狀態(tài)里生成全新圖像的本事。于是在生成階段,模型就能夠從隨機(jī)噪聲開(kāi)始,進(jìn)行反向擴(kuò)散,一步步去掉噪聲、恢復(fù)結(jié)構(gòu),直到得到清晰的成品圖像。


▲ 圖 / Denoising Diffusion Probabilistic Models(Ho et al., 2020)

那么,為啥要先把一張圖弄成雪花噪聲,再讓模型慢慢復(fù)原?

其實(shí),擴(kuò)散模型「先升熵,再降熵」的策略有三個(gè)很實(shí)在的原因:

1. 讓模型學(xué)會(huì)考慮全局

先升熵相當(dāng)于打亂局部關(guān)系,迫使模型從全局結(jié)構(gòu)入手。如果直接從空白開(kāi)始畫(huà),模型很容易陷入先畫(huà)局部再拼接的思路,最后拼起來(lái)各種比例失調(diào)。就好比建筑師畫(huà)設(shè)計(jì)圖,也是從整體藍(lán)圖入手去刻畫(huà)細(xì)節(jié)。

2. 任務(wù)拆分,更容易學(xué)

讓 AI一口氣畫(huà)出一幅高清大圖就像讓廚師一次做個(gè)滿漢全席,容易翻車。把生圖任務(wù)分成多次輕微修復(fù),通過(guò)一步步降噪完成,成功率更高。

3. 隨機(jī)起點(diǎn),更多驚喜

如果每次都從同一個(gè)空白開(kāi)始,結(jié)果會(huì)很容易千篇一律。但若從隨機(jī)噪聲開(kāi)始,就像雕塑家每次都在不同形狀的石頭上雕刻,同一個(gè)主題能做出不同版本,更能帶來(lái)意外的靈感。

在 AI繪圖中,信息熵還可以理解為畫(huà)面生成過(guò)程里的自由度,影響著畫(huà)面是規(guī)整可控,還是天馬行空。熵高時(shí),模型在每一步都有更大發(fā)揮空間,結(jié)果更有想象力,但也更不可控;熵低時(shí),生成會(huì)更穩(wěn)定、更可預(yù)測(cè)。

常見(jiàn)的兩個(gè)「控熵」旋鈕是:

  • 噪聲隨機(jī)性(溫度、chaos 等):隨機(jī)性調(diào)高,自由發(fā)揮的空間更高。

  • 提示詞約束力度(CFG 等):約束強(qiáng)時(shí),模型會(huì)更緊地貼合提示詞,結(jié)果更接近你的想法;約束弱,模型會(huì)更放飛自我。

以MidJourney為例,chaos參數(shù)就是在調(diào)模型發(fā)揮的自由度。中低chaos時(shí),效果完全在預(yù)期內(nèi),高chaos時(shí)模型就開(kāi)始玩抽象了。

這是我用同一指令,賦不同chaos值時(shí)的結(jié)果:

指令:

a bouquet of flowers in a vase
(花瓶中的一束花)

低 chaos(30):結(jié)果規(guī)整、符合想象,花朵顏色和排列都中規(guī)中矩。


高 chaos(100):結(jié)果混亂程度高,充滿意外,比如花束被融入華麗金屬器皿,還搭配了裝飾性的小鳥(niǎo)和珠寶,完全跳出了普通花瓶的框架。


這也是為什么,同樣一句提示,有時(shí)AI畫(huà)得嚴(yán)絲合縫,有時(shí)卻能給你完全沒(méi)想到的驚喜,這正是熵的大小在起作用。

指令是如何引導(dǎo)圖像熵的?

指令就像模型在熵空間游走的導(dǎo)航,能大大壓縮不確定性。

比如:當(dāng)你輸入“一場(chǎng)漫步”,到“一只穿著宇航服的貓?jiān)谠虑蛏下健保?提示信息的限定大大縮小了模型的搜索空間,讓生成結(jié)果從無(wú)數(shù)可能性收斂到一個(gè)更明確范圍。

信息論上,這種從無(wú)條件到有條件的收斂就對(duì)應(yīng)熵的減少:條件熵 H(X|Y)小于無(wú)條件熵 H(X),因?yàn)樘崾驹~ Y 提供了額外信息,大大減少了不必要的隨機(jī)性。

不過(guò)提示詞也不是越詳細(xì)越好。過(guò)于嚴(yán)格的提示會(huì)限制發(fā)揮,可能導(dǎo)致畫(huà)面缺乏新意,過(guò)于寬泛的提示又會(huì)讓熵過(guò)高,缺乏可控性。一個(gè)好的指令既給足指導(dǎo)方向,又保留一定自由度。

從熵到美,機(jī)器的創(chuàng)作本質(zhì)上是一種在混亂中重建秩序的過(guò)程。信息熵就像是機(jī)器創(chuàng)作中尋找平衡的指南針,既能引導(dǎo)生成過(guò)程收斂到清晰的主題,又能保留必要的隨機(jī)性,讓作品擁有出人意料的生命力。

或許,正是這種在無(wú)序中尋秩序的能力,讓機(jī)器的創(chuàng)作與人類的直覺(jué)在某一瞬間產(chǎn)生了共鳴。


end

參考資料:

[1] Shannon Source Coding Theorem. MacKay, D. J. C. (2003). Information Theory, Inference, and Learning Algorithms. Cambridge University Press.

[2] MidJourney Documentation – Chaos Parameter. (2023). https://docs.midjourney.com

[3] Berlyne, D. E. (1970). Novelty, complexity, and hedonic value. Perception & Psychophysics, 8, 279–286. https://doi.org/10.3758/BF03212593

[4] Ho, J., Jain, A., & Abbeel, P. (2020). Denoising Diffusion Probabilistic Models. Advances in Neural Information Processing Systems (NeurIPS 2020). https://arxiv.org/abs/2006.11239

[5] Inception Score. Salimans, T., Goodfellow, I., Zaremba, W., Cheung, V., Radford, A., & Chen, X. (2016). Improved Techniques for Training GANs. Advances in Neural Information Processing Systems, 29. https://arxiv.org/abs/1606.03498

[6] Radford, A., Kim, J. W., Hallacy, C., et al. (2021). Learning Transferable Visual Models From Natural Language Supervision (CLIP). Proceedings of the 38th International Conference on Machine Learning (ICML 2021). https://arxiv.org/abs/2103.00020

來(lái)源:DataCafe

編輯:小咕咕

轉(zhuǎn)載內(nèi)容僅代表作者觀點(diǎn)

不代表中科院物理所立場(chǎng)

如需轉(zhuǎn)載請(qǐng)聯(lián)系原公眾號(hào)

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
不要被館長(zhǎng)的暗獨(dú)給蒙蔽了!

不要被館長(zhǎng)的暗獨(dú)給蒙蔽了!

談芯說(shuō)科技
2025-10-02 21:02:07
鷹獅來(lái)了,俄羅斯還能夠打贏戰(zhàn)爭(zhēng)嗎?

鷹獅來(lái)了,俄羅斯還能夠打贏戰(zhàn)爭(zhēng)嗎?

史政先鋒
2025-09-30 13:12:55
青島樓市迅雷不及掩耳,青島待售二手房從115246套變成了115155套

青島樓市迅雷不及掩耳,青島待售二手房從115246套變成了115155套

有事問(wèn)彭叔
2025-10-02 21:30:14
超鐵的鐵哥們!欠中國(guó)81億全額還清,還贈(zèng)送了一份百億能源大禮!

超鐵的鐵哥們!欠中國(guó)81億全額還清,還贈(zèng)送了一份百億能源大禮!

Hi科普啦
2025-10-02 09:18:16
1962年中印邊境戰(zhàn)前夕,毛主席獨(dú)排眾議的180分鐘:打,必須打!

1962年中印邊境戰(zhàn)前夕,毛主席獨(dú)排眾議的180分鐘:打,必須打!

萊克
2025-07-22 16:10:51
白應(yīng)蒼或判死刑!囚服出鏡明顯發(fā)福,講述白家的榮耀史,沒(méi)了威風(fēng)

白應(yīng)蒼或判死刑!囚服出鏡明顯發(fā)福,講述白家的榮耀史,沒(méi)了威風(fēng)

體制內(nèi)老陳
2025-07-12 12:56:42
iPhone16ProMax售價(jià)大跳水,512GB跌價(jià)2301元,17Pro突然不香了

iPhone16ProMax售價(jià)大跳水,512GB跌價(jià)2301元,17Pro突然不香了

科技阿維
2025-10-02 19:32:31
這是特朗普的驚天豪賭,美國(guó)開(kāi)始大變天!

這是特朗普的驚天豪賭,美國(guó)開(kāi)始大變天!

一個(gè)壞土豆
2025-10-02 18:50:36
楊振寧終于揭示底牌,翁帆無(wú)奈選擇獨(dú)自踏上新旅程!

楊振寧終于揭示底牌,翁帆無(wú)奈選擇獨(dú)自踏上新旅程!

元爸體育
2025-10-02 15:59:53
檢查組暗訪,當(dāng)場(chǎng)下達(dá)整改通知書(shū)

檢查組暗訪,當(dāng)場(chǎng)下達(dá)整改通知書(shū)

新京報(bào)政事兒
2025-10-02 23:18:06
歐盟27國(guó)全部加入聯(lián)盟,焊死光刻機(jī)研發(fā)大門(mén),國(guó)產(chǎn)替代已應(yīng)驗(yàn)預(yù)言

歐盟27國(guó)全部加入聯(lián)盟,焊死光刻機(jī)研發(fā)大門(mén),國(guó)產(chǎn)替代已應(yīng)驗(yàn)預(yù)言

薦史
2025-10-02 19:28:28
聯(lián)合國(guó)前主席稱:中國(guó)人的習(xí)慣,世界上沒(méi)有一個(gè)國(guó)家能夠?qū)W得來(lái)

聯(lián)合國(guó)前主席稱:中國(guó)人的習(xí)慣,世界上沒(méi)有一個(gè)國(guó)家能夠?qū)W得來(lái)

通文知史
2025-10-02 19:00:03
在金正恩治理下,朝鮮富人們居住的高檔小區(qū):風(fēng)景絕佳,商鋪眾多

在金正恩治理下,朝鮮富人們居住的高檔小區(qū):風(fēng)景絕佳,商鋪眾多

明史專家
2025-09-26 19:53:12
母親46歲生下她,父親劉德華用億萬(wàn)富養(yǎng),如今13歲成了這般模樣

母親46歲生下她,父親劉德華用億萬(wàn)富養(yǎng),如今13歲成了這般模樣

白面書(shū)誏
2025-09-25 18:04:54
俄議員呼吁民眾不要依賴養(yǎng)老金,老人要學(xué)會(huì)“自給自足”

俄議員呼吁民眾不要依賴養(yǎng)老金,老人要學(xué)會(huì)“自給自足”

桂系007
2025-10-02 03:42:38
小熊電器炸了,副總套現(xiàn)400萬(wàn)

小熊電器炸了,副總套現(xiàn)400萬(wàn)

樂(lè)居財(cái)經(jīng)官方
2025-10-03 09:00:09
江蘇一酒店坍塌:4家正舉行婚宴,新娘流血逃生,傷亡情況披露

江蘇一酒店坍塌:4家正舉行婚宴,新娘流血逃生,傷亡情況披露

博士觀察
2025-10-02 17:41:50
《寂靜嶺2》性感護(hù)士雕像展出!大雷黑絲讓人心曠神怡

《寂靜嶺2》性感護(hù)士雕像展出!大雷黑絲讓人心曠神怡

游民星空
2025-10-02 19:20:08
中國(guó)第一巨人鮑喜順:不聽(tīng)醫(yī)生勸告非要生子,現(xiàn)在兒子長(zhǎng)到多高?

中國(guó)第一巨人鮑喜順:不聽(tīng)醫(yī)生勸告非要生子,現(xiàn)在兒子長(zhǎng)到多高?

丹妮觀
2025-10-02 11:59:10
哈馬斯是什么?誰(shuí)在領(lǐng)導(dǎo)它?為什么它不投降?

哈馬斯是什么?誰(shuí)在領(lǐng)導(dǎo)它?為什么它不投降?

小港哎歷史
2025-10-02 13:55:17
2025-10-03 11:23:00
中科院物理所 incentive-icons
中科院物理所
愛(ài)上物理,改變世界。
9427文章數(shù) 136305關(guān)注度
往期回顧 全部

科技要聞

特斯拉Q3交付超預(yù)期,股價(jià)高開(kāi)低走大跌

頭條要聞

普京回應(yīng)"俄羅斯計(jì)劃攻擊北約"言論:放松 睡個(gè)好覺(jué)

頭條要聞

普京回應(yīng)"俄羅斯計(jì)劃攻擊北約"言論:放松 睡個(gè)好覺(jué)

體育要聞

四冠中鋒,比所有人更早開(kāi)始新賽季

娛樂(lè)要聞

大灣區(qū)晚會(huì)4天后,內(nèi)娛尷尬現(xiàn)狀全暴露

財(cái)經(jīng)要聞

國(guó)家出手!三大世界級(jí)城市群定了

汽車要聞

元戎啟行9月合作車型 交付量突破3萬(wàn)臺(tái)

態(tài)度原創(chuàng)

游戲
健康
旅游
手機(jī)
軍事航空

大話西游手游師貢銀兩不夠怎么辦?這些獲取途徑你都了解嗎

內(nèi)分泌科專家破解身高八大謠言

旅游要聞

熱聞|清明假期將至,熱門(mén)目的地有哪些?

手機(jī)要聞

摩根士丹利:新款iPhone 17系列需求超預(yù)期 唯有Air表現(xiàn)遜色

軍事要聞

九三閱兵前夕受閱部隊(duì)集結(jié)畫(huà)面首次公開(kāi)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 奇米7777手机在线| 久久精品国产亚洲一区二区三区 | 熟女舒服好爽av| 国产片一区二区三区视频| 蜜桃av免费观看| 人妻体内射精一区二区三四| 国产在线操APP| 亚洲av无码一区二区二三区入口| 亚洲一二区在线视频播放| 亚洲五码在线播放| 视频一区精品自拍| 少妇无码在线| 亚洲国产成人精品无码影院| 亚洲AV无码久久久久网站蜜桃| 亚洲国产成人一区二区精品区| 国产一区二区在线有码| 高清乱码一卡二卡插曲| 风韵丰满熟妇啪啪区99杏| av男人的天堂高清无码| 荡妇淫娇妻视频| 波多野结衣在线播放一区| 绯色av一二三区在线观看| 亚洲男同志网站| 18禁止进入1000部高潮网站| 精品人妻久久久久久888| 亚洲69视频| 无码人妻视频一区二区三区| 国产熟女久久精品视频| 亚洲熟妇无码AV不卡在线| 久久精品噜噜噜成人| 又爽又黄又无遮挡的视频| 西西人体444www高清大胆| 国产高清ⅤideOssex| 中文字幕肉感巨大的乳专区| 久久久久国产Av无码专区| 99在线成人网| 中文字幕无线码在线观看| av棋牌网站免费在线| 手机在线视频你懂的| 亚洲国产精品特色大片观看完整版| 成人WWWWW免费观看|