夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek新論文被稱“硅基生命進化論”,海量文字壓縮成圖,模仿人腦重塑AI視覺記憶邊界,贏硅谷大佬力挺

0
分享至



出品|搜狐科技

作者|鄭松毅

DeepSeek再次“低調(diào)”震驚世界!

他們新發(fā)布并開源的OCR模型,從根本上改變了AI游戲規(guī)則。Github開源項目DeepSeek-OCR,一夜收獲超4k星。相關論文(《DeepSeek OCR:上下文光學壓縮》)解釋了這一研究成果。

很多人好奇,什么是OCR?

傳統(tǒng)OCR如同“文字掃描儀”,通過光學技術將圖像中的文字提取轉(zhuǎn)換為計算機和人都能理解的格式。比如,在將大量票據(jù)、證件、表單等數(shù)據(jù)電子化時,OCR發(fā)揮關鍵作用。

但DeepSeek卻反其道而行之——將文本信息“繪制”為視覺圖像,再通過視覺模型實現(xiàn)高效理解。如此創(chuàng)新嘗試就是為了解決大模型的核心痛點——處理長文本時面臨的計算挑戰(zhàn)。

效果有多驚艷?10頁密密麻麻的文本報告,被壓縮成一張圖片,AI能夠一眼讀懂它。這樣的信息處理效率意味著大幅降低了計算復雜度,用最直接的方式節(jié)約成本。

論文發(fā)布后,意料之內(nèi)的好評如潮,有網(wǎng)友直接將其稱為“硅基生命進化論”。

最近還在銳評AI發(fā)展的OpenAI創(chuàng)始團隊成員、特斯拉前AI總監(jiān)Karpathy,對DeepSeek新成果直言喜愛,并指出“早就該讓視覺成為AI核心,而非依賴爛透了的文本分詞器?!?/p>

更有業(yè)內(nèi)大佬感嘆,“當文本能被轉(zhuǎn)化為視覺可理解的結構,語言與視覺的統(tǒng)一或許不再是理論。這可能是通往 AGI(通用人工智能)的關鍵一步?!?/p>


DeepSeek新研究:

把大量文字壓縮到圖片,讓模型直接看圖理解

本質(zhì)上來說,DeepSeek-OCR是將視覺與語言模態(tài)深度融合,通過“視覺-文本壓縮”建立自然映射關系,為多模態(tài)大模型提供了新的技術路徑。

之前的大模型可以說是“帶著腳銬的舞者”,雖有強大的語言理解能力,卻被低效的信息輸入方式嚴重束縛。

拿模型閱讀長篇文本來說,每頁財報、論文都包含數(shù)千個token,傳統(tǒng)方式下只能逐字逐句識別,導致計算量爆炸。這種低效作業(yè)讓大模型在法律、金融等領域的應用舉步維艱。

而DeepSeek這次用到了一個巧妙思維——既然一張圖片能裝下成千上萬的文字,那是不是大量文字信息也能被壓縮到一張圖片里,讓模型直接看圖理解就好了。

為實現(xiàn)這一設想,DeepSeek為OCR模型配備了三件套——圖像編碼器、映射層和文本解碼器。其中,圖像編碼器DeepEncoder(負責把圖片轉(zhuǎn)成高度壓縮的視覺token)參數(shù)為380M,文本解碼器(負責從壓縮的視覺token里重建文字)是一個deepseekv2-3b的模型,參數(shù)為3B。

整體訓練數(shù)據(jù)由4部分組成,包括OCR1.0數(shù)據(jù)(傳統(tǒng)OCR任務,如圖像OCR和文檔OCR)、OCR2.0數(shù)據(jù)(復雜圖像解析任務,如幾何、圖表等)、通用視覺數(shù)據(jù)(用于注入通用圖像理解能力)、及純文本數(shù)據(jù)(用于確保模型的語言能力)。

別看模型參數(shù)不大,但就研究結果發(fā)現(xiàn),當文本壓縮率小于10倍時,模型OCR解碼準確率高達97%,及時壓縮率高達20倍時,準確率依舊能保持在60%。在A100-40G顯卡環(huán)境下,單日可生成超過20萬頁的模型訓練數(shù)據(jù)。

也就是說,如果普通 OCR 需要 10,000 個 token 才能讀完整篇文檔,這個模型可能只用 1,000 個就能搞定,且能高準確度地理解信息。

受益于訓練數(shù)據(jù)多樣性,論文提到DeepSeek-OCR不僅能識別文字,還能理解文檔布局、圖表結構。從某種角度說,這已經(jīng)不是傳統(tǒng)的OCR,而更接近“文檔理解引擎”。

論文中提到的一個基準叫OmniDocBench,就是專門用來測試復雜文檔理解能力的。DeepSeek-OCR 在這個基準上,用更少的視覺 token 數(shù)量就超過了 GOT-OCR 2.0 和 MinerU 2.0,這倆都是目前較頂尖的開源 OCR 模型,可謂十分能打。



讓AI記憶模式更像人類

在論文中,DeepSeek還談到了一直困擾業(yè)界的AI“記憶”和“遺忘”機制。

深度學習模型的記憶以分布式參數(shù)形式存儲,這種非結構化存儲導致傳統(tǒng)神經(jīng)網(wǎng)絡在學習新任務時,舊知識的參數(shù)空間會被新知識覆蓋,模型無法做到像人類一樣進行連貫推理。

而DeepSeek的想法是,通過視覺-文本壓縮范式和動態(tài)分層遺忘機制,讓AI“記住該記住的,忘記該忘記的”。

其核心思路是將文本信息轉(zhuǎn)化為視覺token,通過光學壓縮實現(xiàn)高效記憶管理,同時模擬人類遺忘曲線動態(tài)調(diào)整信息留存。


在這個過程中,核心組件DeepEncoder發(fā)揮關鍵作用,50-100個視覺tokens即可還原1000字文本,實現(xiàn)近 10 倍的計算量節(jié)省。

這種壓縮并非簡單的信息降維,而是通過“注意力機制+結構化訓練”,優(yōu)先保留對模型推理最關鍵的信息。類似人類閱讀時“先抓標題再看細節(jié)”的認知模式,去除不重要的信息噪聲。

關于如何讓模型的記憶模式更像人類,研究者做了進一步解釋:對于近期記憶,可以將其渲染成高分辨率圖像,用多token數(shù)量保留高保真信息。而對于遠期記憶,可以縮放成更小、更模糊的圖像,用少量token來保留信息,從而實現(xiàn)信息的自然遺忘和壓縮。

雖然當前還僅是研究前期探索階段,但DeepSeek的創(chuàng)新思路,確實讓AI越來越像人類了。


三名作者

本篇論文共有3名作者:Haoran Wei、Yaofeng Sun、Yukun Li。

論文一作Haoran Wei曾主導開發(fā)爆火項目GOT-OCR2.0,此次的DeepSeek-OCR也可以說是延續(xù)了此前項目的創(chuàng)新技術路徑。根據(jù)此前論文信息顯示,Haoran Wei還曾就職于階躍星辰。


Yaofeng Sun畢業(yè)于北京大學圖靈班計算機科學專業(yè),于2023年加入DeepSeek,先后參與DeepSeek-r1、DeepSeek-v3、DeepSeek-v2等模型的研究。


Yukun Li也參與了包括DeepSeek-v2/v3在內(nèi)的多款模型研究,谷歌學術論文引用量近萬。




運營編輯 |曹倩審核|孟莎莎




特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
18道通緝令,臺獨勢力被追捕,統(tǒng)一真要來了?

18道通緝令,臺獨勢力被追捕,統(tǒng)一真要來了?

策略述
2025-10-29 19:21:17
白云機場都快成廣州的奢侈品賣場了

白云機場都快成廣州的奢侈品賣場了

源Sight
2025-10-28 19:47:48
江蘇的省會可能選錯了?

江蘇的省會可能選錯了?

今日搞笑分享
2025-10-29 12:32:07
奧委會跪求中國辦2036年奧運?中國:2036年會在臺北舉行嗎

奧委會跪求中國辦2036年奧運?中國:2036年會在臺北舉行嗎

丁丁鯉史紀
2025-10-29 08:24:39
定居臺灣的叔叔回大陸,顯擺自己住50平豪宅,我:叔來我家看看嗎

定居臺灣的叔叔回大陸,顯擺自己住50平豪宅,我:叔來我家看看嗎

小秋情感說
2025-10-28 14:27:04
安徽多地反腐:5人被查,2人同日被雙開

安徽多地反腐:5人被查,2人同日被雙開

鳳凰網(wǎng)安徽
2025-10-29 18:25:33
當上中層才明白:領導最喜歡的不是能力強、工作努力的人

當上中層才明白:領導最喜歡的不是能力強、工作努力的人

德魯克博雅管理
2025-10-28 17:06:38
善惡有報,花17億買“樓”害人的張庭夫婦,如今終為貪婪付出代價

善惡有報,花17億買“樓”害人的張庭夫婦,如今終為貪婪付出代價

洲洲影視娛評
2025-10-29 19:32:07
馬上就要消失的行業(yè),不是幼師,也不是醫(yī)生,而是“失業(yè)三寶”!

馬上就要消失的行業(yè),不是幼師,也不是醫(yī)生,而是“失業(yè)三寶”!

阿燕姐說育兒
2025-10-27 15:16:59
線下偶遇李宇春,她脖子帶的大金項鏈好吸引人啊,打扮也是酷酷的

線下偶遇李宇春,她脖子帶的大金項鏈好吸引人啊,打扮也是酷酷的

草莓解說體育
2025-10-29 12:45:50
一場盛大而哀傷的告別:再見,許紹雄

一場盛大而哀傷的告別:再見,許紹雄

情感大頭說說
2025-10-29 01:40:00
就在今天!10月29日凌晨,中超傳來上港隊、山東魯能、韓鵬消息

就在今天!10月29日凌晨,中超傳來上港隊、山東魯能、韓鵬消息

皮皮觀天下
2025-10-29 04:50:06
千億夢破碎!從62億營收到日虧百萬,為什么降價認慫也救不了西貝

千億夢破碎!從62億營收到日虧百萬,為什么降價認慫也救不了西貝

墜入二次元的海洋
2025-10-28 09:11:16
三分9中0!火箭的首發(fā)核心??!曝將交易來總冠軍控衛(wèi)

三分9中0!火箭的首發(fā)核心?。∑貙⒔灰讈砜偣谲娍匦l(wèi)

籃球?qū)崙?zhàn)寶典
2025-10-29 19:42:10
胡歌直言無法走出母親去世陰影,直到好友稱夢到母親在西藏墨脫的船上:曾前往墨脫緬懷,盡管什么也沒找到,但釋懷了

胡歌直言無法走出母親去世陰影,直到好友稱夢到母親在西藏墨脫的船上:曾前往墨脫緬懷,盡管什么也沒找到,但釋懷了

極目新聞
2025-10-29 19:44:37
局勢惡化,美軍南海墜機后,日本開始頂上,馬科斯逼中國上法庭

局勢惡化,美軍南海墜機后,日本開始頂上,馬科斯逼中國上法庭

時時有聊
2025-10-29 16:45:16
阿根廷又獲頂級中鋒!1米9的攻城錘,超越小蜘蛛!9場8球領跑金靴

阿根廷又獲頂級中鋒!1米9的攻城錘,超越小蜘蛛!9場8球領跑金靴

球場沒跑道
2025-10-28 23:11:32
韓國智庫:中國可以拒絕進口美國大豆,韓國也可以不買中國大白菜

韓國智庫:中國可以拒絕進口美國大豆,韓國也可以不買中國大白菜

我心縱橫天地間
2025-10-29 15:49:19
呼市四區(qū)降價狠的小區(qū),有人虧掉一輛BBA,都是8090購房者

呼市四區(qū)降價狠的小區(qū),有人虧掉一輛BBA,都是8090購房者

科學發(fā)掘
2025-10-29 14:16:55
保時捷墜入至暗時刻

保時捷墜入至暗時刻

華爾街見聞官方
2025-10-28 18:34:02
2025-10-29 20:32:49
搜狐科技 incentive-icons
搜狐科技
搜狐科技官方賬號
4555文章數(shù) 9161關注度
往期回顧 全部

科技要聞

英偉達GTC:黃仁勛撒錢、造芯、造夢

頭條要聞

報道稱中國在本收獲季首次從美國購買大豆 外交部回應

頭條要聞

報道稱中國在本收獲季首次從美國購買大豆 外交部回應

體育要聞

歐美又破防!中國運動員等結果時展示導彈玩偶 國際滑聯(lián):已調(diào)查

娛樂要聞

她二婚嫁給許紹雄,恩愛40年不離不棄

財經(jīng)要聞

美聯(lián)儲今夜必降息?三大懸念即將揭曉

汽車要聞

自信大廠做派 全新瑞虎8詮釋什么是穩(wěn)中進化

態(tài)度原創(chuàng)

房產(chǎn)
藝術
教育
手機
時尚

房產(chǎn)要聞

36億高調(diào)入場!又一央企,重倉海南!

藝術要聞

他的畫讓你感受到水墨的絕美,快來看看!

教育要聞

媽媽,我不敢打回去:那個晚上,我找到了比拳頭更厲害的東西

手機要聞

iQOO Neo11明天登場 產(chǎn)品經(jīng)理:中端性能旗艦的唯一選擇

原來做自媒體的“成功心法”都是同一個

無障礙瀏覽 進入關懷版 黄色视频在线观看无码| 国产午夜福利内射青草| 邻居少妇张开腿让我爽了一夜| 国产精品亚洲一区二区三区| 起码影视第四色| 亚洲天堂在线观看完整版| 黄色毛片俄罗斯版| 美腿丝袜亚洲综合在线视频| 精品无码人妻久久久久久| 亚洲熟妇丰满xxxxx| 国产精品中文字幕av| 人妻午夜视频| 成人免费一二区| 九一传媒精品国产AV| 日日添夜夜操试看一二区| 苍井空第一次激励高潮| 少妇人妻诗雨系列无删减| 国产无码成人电影| 国产精品一二三区视频| 国产一区二区三区高清在线观看| 国产做a爱视频免费无遮挡| 综合狠狠激情| 国产精品成人观看视频国产奇米| 日韩精品中文字幕人妻| 午夜理论电影在线观看亚洲| 久久亚洲精品无码av| 欧美丰满少妇xxxx性| 亚洲天天影院色香欲综合| 天美国产AV电影| 中文字幕av一区乱码| 天天摸天天做天天爽2019| 青青草人人操人人摸| 六月婷婷综合网| 婷婷久久香蕉五月综合| 秋霞网鲁丝片| 奶头挺立呻吟高潮视频| 久久夜夜免费视频| 手机看片国产AV一区| 女高潮大叫喷水抽搐| 亚洲精品久久激情国产片| 麻豆精品秘 国产传媒AV|