夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

南理工提出FMC-DETR:巧用“頻率解耦”,航拍小目標(biāo)檢測精度飆升8.2% AP50

0
分享至

在廣闊的航拍圖像中,要準(zhǔn)確地找出那些只占了幾個像素點的微小目標(biāo),比如遠處的車輛、行人,無疑是一項極具挑戰(zhàn)性的任務(wù)。這就像是在一幅巨大的畫卷中“找茬”,不僅考驗眼力,更考驗對整個畫面的理解能力。這項技術(shù)在自然資源監(jiān)測、交通管理、無人機搜救等領(lǐng)域至關(guān)重要。

目前的方法在處理這類問題時,常常陷入一個兩難的境地:為了看清微小目標(biāo)的細節(jié),需要依賴網(wǎng)絡(luò)淺層的、高分辨率的特征;但為了判斷這個小目標(biāo)到底是什么,又需要網(wǎng)絡(luò)深層的、包含全局信息的上下文。如何有效地融合這兩者,一直是個難題。

最近,來自南京理工大學(xué)的研究者們提出了一種全新的框架 FMC-DETR,巧妙地從“頻域”入手,解決了這個難題。在他們的新論文 《FMC-DETR: Frequency-Decoupled Multi-Domain Coordination for Aerial-View Object Detection》 中,他們通過解耦不同頻率的信息,實現(xiàn)了對航拍小目標(biāo)前所未有的精準(zhǔn)檢測。

  • 論文標(biāo)題 : FMC-DETR: Frequency-Decoupled Multi-Domain Coordination for Aerial-View Object Detection

  • 作者 : Ben Liang, Yuan Liu, Bingwen Qiu, Yihong Wang, Xiubao Sui, Qian Chen

  • 機構(gòu) : 南京理工大學(xué)

  • 論文地址 : https://arxiv.org/abs/2509.23056

  • 代碼倉庫 : https://github.com/bloomingvision/FMC-DETR

問題的核心:局部細節(jié)與全局上下文的“兩難全”

在信號處理中,我們知道圖像的高頻部分對應(yīng)著邊緣、紋理等細節(jié)信息,而低頻部分則對應(yīng)著輪廓、背景等全局結(jié)構(gòu)信息。

對于航拍小目標(biāo)檢測:

  • 高頻細節(jié) 至關(guān)重要,因為目標(biāo)本身就很小,所有可用的視覺線索都包含在這些高頻信息里。

  • 低頻上下文 同樣不可或缺,它能幫助模型判斷一個“小點”究竟是路燈、是車,還是噪聲。

現(xiàn)有方法往往在網(wǎng)絡(luò)深層才進行上下文融合,此時淺層的細節(jié)信息已經(jīng)丟失很多?;蛘咴谌诤蠒r,全局信息(低頻)會“污染”或“模糊”掉寶貴的局部細節(jié)(高頻),導(dǎo)致性能瓶頸。

FMC-DETR:從頻域入手,解耦多域協(xié)同

FMC-DETR的核心思想,就是 頻率解耦(Frequency-Decoupled)。它不再將不同尺度的特征簡單混合,而是先在頻域上將它們分離開,有針對性地處理,最后再進行高效的多域協(xié)同(Multi-Domain Coordination)。


整個框架主要由三個創(chuàng)新模塊構(gòu)成:

1. WeKat骨干網(wǎng) (Wavelet Kolmogorov-Arnold Transformer)

這是一個全新的骨干網(wǎng)絡(luò),也是實現(xiàn)頻率解耦的關(guān)鍵。它包含兩大“神器”:

  • 小波變換 (Wavelet Transform) :在網(wǎng)絡(luò)的淺層特征上,作者創(chuàng)新性地引入了級聯(lián)小波變換。小波變換是信號處理中一種強大的工具,能完美地將信號分解為高頻和低頻部分。這樣一來,模型就可以在不破壞高頻細節(jié)(保留小目標(biāo))的前提下,單獨增強低頻的全局上下文感知能力。

  • Kolmogorov-Arnold網(wǎng)絡(luò) (KANs) :這是近期非?;馃岬囊环N新型神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),理論上比傳統(tǒng)的多層感知機(MLP)具有更強的非線性建模能力。作者用它來替代傳統(tǒng)Transformer中的MLP,從而能更自適應(yīng)地對多尺度特征之間的復(fù)雜依賴關(guān)系進行建模。

2. 輕量級跨階段局部融合 (CPF)

這個模塊用于高效地融合來自不同階段的特征,它通過局部融合的方式,減少了冗余計算,提升了多尺度特征的交互效率。


3. 多域特征協(xié)同 (MDFC)

這是最后的“總指揮”。它將來自空間域(原始像素)、頻率域(小波處理后)和結(jié)構(gòu)先驗(模型學(xué)到的)的信息進行統(tǒng)一,實現(xiàn)優(yōu)勢互補,最終在保留細節(jié)和增強全局感知之間取得完美平衡。


更少參數(shù),更高精度:SOTA級的檢測性能

FMC-DETR不僅設(shè)計巧妙,實際效果也相當(dāng)驚人。在極具挑戰(zhàn)性的VisDrone等航拍數(shù)據(jù)集上,它以更少的參數(shù)量,取得了當(dāng)前最先進(SOTA)的性能。

與基線模型相比,F(xiàn)MC-DETR在VisDrone數(shù)據(jù)集上,將整體檢測精度(AP)提升了 6.5%,將在小目標(biāo)上更為關(guān)鍵的AP50指標(biāo)提升了 8.2%


從下面的可視化熱力圖對比中,我們可以直觀地看到FMC-DETR的優(yōu)勢。對于密集的小目標(biāo)(如車輛),基線模型的注意力(亮區(qū))非常分散,而FMC-DETR的注意力則能精準(zhǔn)地聚焦在每一個目標(biāo)上,從而實現(xiàn)了更準(zhǔn)確的檢測,減少了漏檢和誤檢。


與基線模型在不同數(shù)據(jù)集上的定性比較:



從中大家也可以看到此類小目標(biāo)檢測的難度的確不小。

FMC-DETR的成功,為應(yīng)對計算機視覺中的多尺度問題,特別是小目標(biāo)檢測,提供了一個全新的、極具潛力的思路。作者也提供了代碼倉庫,期待后續(xù)代碼的放出。

將信號處理中的頻域分析思想引入到目標(biāo)檢測,大家覺得這個方向還有哪些潛力可挖?歡迎在評論區(qū)分享你的看法!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
30分鐘賺2億美金,“特朗普交易”的新紀(jì)錄

30分鐘賺2億美金,“特朗普交易”的新紀(jì)錄

虎嗅APP
2025-10-12 05:17:07
原來12306候補不是“等別人退票”!購票冷知識,每次搶票都能用

原來12306候補不是“等別人退票”!購票冷知識,每次搶票都能用

振華觀史
2025-10-09 17:24:35
稀土是啥?為啥是中國王牌?

稀土是啥?為啥是中國王牌?

混知
2025-10-13 14:10:58
王勵勤也沒想到,劉國梁卸任乒協(xié)主席5個月,竟已過上理想生活

王勵勤也沒想到,劉國梁卸任乒協(xié)主席5個月,竟已過上理想生活

張黿鹵說體育
2025-10-11 06:04:05
不要讓孩子獨自一個人在房間里寫作業(yè)

不要讓孩子獨自一個人在房間里寫作業(yè)

瑞秋三思
2025-10-10 12:33:03
陷入愛河無法自拔,亞馬爾養(yǎng)傷期間繼續(xù)和女友大秀恩愛!

陷入愛河無法自拔,亞馬爾養(yǎng)傷期間繼續(xù)和女友大秀恩愛!

田先生籃球
2025-10-12 23:06:38
盧旺達總統(tǒng)放話 “不當(dāng)柬埔寨”,學(xué)中國30年成 “非洲深圳”

盧旺達總統(tǒng)放話 “不當(dāng)柬埔寨”,學(xué)中國30年成 “非洲深圳”

窺史
2025-09-29 20:46:04
“單身聲明”翻車?田栩?qū)幍叵萝噹鞝渴峙颜掌毓?>
    </a>
        <h3>
      <a href=橙星文娛
2025-10-13 16:36:58
十五年員工發(fā)聲:如果娃哈哈收歸國資,那還是愿意留下來的

十五年員工發(fā)聲:如果娃哈哈收歸國資,那還是愿意留下來的

映射生活的身影
2025-10-12 18:52:00
真是同命相連!巴薩耽誤了羅克,皇馬也要毀了恩德里克節(jié)奏?

真是同命相連!巴薩耽誤了羅克,皇馬也要毀了恩德里克節(jié)奏?

田先生籃球
2025-10-12 18:41:15
【熱身】U16國少0比2朝鮮U16

【熱身】U16國少0比2朝鮮U16

體壇周報
2025-10-13 21:19:26
新一代操作系統(tǒng)來了,普通人三分鐘就造出一個App!

新一代操作系統(tǒng)來了,普通人三分鐘就造出一個App!

碼農(nóng)翻身
2025-10-10 09:01:52
出圈還看王世堅

出圈還看王世堅

屠龍喬治
2025-10-13 13:31:40
收評:科創(chuàng)50指數(shù)低開高走漲1.4% 稀土永磁、芯片股逆勢大漲

收評:科創(chuàng)50指數(shù)低開高走漲1.4% 稀土永磁、芯片股逆勢大漲

財聯(lián)社
2025-10-13 15:03:11
不到4年干出308億!你知道廈門這家“年輕有色金屬巨頭”嗎?

不到4年干出308億!你知道廈門這家“年輕有色金屬巨頭”嗎?

閩商報
2025-10-13 15:04:20
1年賣了14輛車虧了10億元,眾泰汽車公告:副總裁尹雪峰被免職

1年賣了14輛車虧了10億元,眾泰汽車公告:副總裁尹雪峰被免職

瀟湘晨報
2025-10-13 16:51:15
司美格魯肽吃出副作用?美團:相關(guān)訂單全額退

司美格魯肽吃出副作用?美團:相關(guān)訂單全額退

第一財經(jīng)資訊
2025-10-13 16:14:11
諾貝爾經(jīng)濟學(xué)獎揭曉:3名經(jīng)濟學(xué)家獲獎,表彰其“對創(chuàng)新驅(qū)動型經(jīng)濟增長的闡釋”

諾貝爾經(jīng)濟學(xué)獎揭曉:3名經(jīng)濟學(xué)家獲獎,表彰其“對創(chuàng)新驅(qū)動型經(jīng)濟增長的闡釋”

澎湃新聞
2025-10-13 17:52:33
價格大跳水,暴跌80%!深圳人可以撿漏了...

價格大跳水,暴跌80%!深圳人可以撿漏了...

深圳好玩
2025-10-13 12:36:10
想吃棒棒糖嗎?

想吃棒棒糖嗎?

貴圈真亂
2025-10-13 13:03:36
2025-10-13 23:08:49
算法與數(shù)學(xué)之美 incentive-icons
算法與數(shù)學(xué)之美
分享知識,交流思想
5160文章數(shù) 64593關(guān)注度
往期回顧 全部

科技要聞

楊強院士:AGI真正到來時 人與AI將和諧共生

頭條要聞

媒體:出現(xiàn)燃油泄漏 二戰(zhàn)日軍幽靈艦隊成為"定時炸彈"

頭條要聞

媒體:出現(xiàn)燃油泄漏 二戰(zhàn)日軍幽靈艦隊成為"定時炸彈"

體育要聞

29+12后24+10:韋爾生涯第二年沖MIP

娛樂要聞

王詩齡16歲生日:李湘王岳倫同框

財經(jīng)要聞

2025諾貝爾經(jīng)濟學(xué)獎:創(chuàng)新、毀滅與增長

汽車要聞

小米SU7高速碰撞后起火 事發(fā)前速度或超200km/h

態(tài)度原創(chuàng)

親子
時尚
房產(chǎn)
手機
公開課

親子要聞

西方的醫(yī)療思路真的很不一樣

伊姐周日熱推:綜藝《向往的生活-戲如人生》;電視劇《貍貓書生第二季》......

房產(chǎn)要聞

全國首個!三亞超級IP+1!HelloKitty真的來了!

手機要聞

谷歌Pixel 10系列手機App頻繁崩潰,用戶遭遇“無響應(yīng)”困擾

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關(guān)懷版 国产成人无码一区二区三区| 成人A毛片免费播放| 12孩岁女www免费观看| 久久精品国产亚洲AV无码偷窥| 天堂在线www天堂在线| 中文字幕一区二区三区AⅤ吉川| 国产精品久久久福利| 蜜桃AV一区在线| 国产国拍亚洲精品永久69| 亚洲AⅤ免费在线观看| 国产亚洲精品在天天在线麻豆 | 人人干人人操AV| 在线欧美国产| 欧美性受xxxx视频| 少妇精品毛片| 白浆av 会所| 殴美激情在线88AV视频| 日本免费人成在线观看网站| 亚洲成a人片在线观看www| 欧美无人区码一码二码三码的区别| 性满足bbwbbwbbw| 精品在线视频免费| 欧美日韩在线亚洲综合国产人| 国产美女久久久亚洲综合| 天堂资源在线| 波多野结衣办公室33分钟| 亚洲av无码成人网站www| 中文字幕乱码亚洲影视| xxx性韩国| 久久不见久久见免费影院| 精品久久一区二区三区蜜桃 | 毛片网站完整版| 精品九九九在线观看| 色综合天天综合网中文伊| 日日摸日日碰夜夜爽201| 亚洲成人影视精品网址大全| 免费牲交视频| 国产午夜福利久久精品| 成人一区二区成人| 蜜乳一区二区三区四区在线观看 | MEIXXXX|