夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

DeepSeek開源的新東西到底強在哪?我?guī)湍阏覍<覇柫藛?/h1>
0
分享至



本周,DeepSeek 新開源的 DeepSeek-OCR 在開源社區(qū)的熱度持續(xù)發(fā)酵。

人們興奮的點是:它不僅是一款新的光學字符識別模型,還更像是一次對 “ 大模型記憶機制 ” 的重新設計。

在 DeepSeek-OCR 的架構(gòu)中,圖像不再只是文字的載體,而是成為一種語義壓縮的中間語言。文字被渲染成圖像后,經(jīng)由 DeepEncoder 轉(zhuǎn)換為緊湊的視覺表征;這些視覺 token 既可以通過 DeepSeek 3B-MoE 模型還原為原始文本(這也是標準的 OCR 機制),也可以與其他輸入 token 與 prompt 結(jié)合,執(zhí)行問答、摘要、檢索等復雜任務。

通俗來說,就是我們可以把大量文字打包壓縮成一張圖片來節(jié)省空間,等需要使用的時候再解壓出來,甚至在一部分使用場景中,你甚至不需要解壓,直接用壓縮包就可以達成目的。



DeepSeek-OCR 模型架構(gòu)。圖源:
https://github.com/deepseek-ai/DeepSeek-OCR/blob/main/DeepSeek_OCR_paper.pdf

即便在 10× 壓縮比的條件下,模型的文本還原精度仍可達 97%。隨著大模型逐漸向越來越復雜的場景嵌入,上下文長度資源遠不夠用甚至越來越不夠用,而基座模型在此參數(shù)上升級頗為緩慢的當下,DeepSeek-OCR 的發(fā)布瞬間帶來很大的想象空間。

研究團隊甚至還進一步提出 “ 遺忘機制 ” 的構(gòu)想,模型可依據(jù)信息的 “ 時序遠近 ”,在視覺壓縮階段主動衰減細節(jié),從而實現(xiàn)一種類人記憶式的上下文管理。

那么,視覺 token 為何能在信息量不損失太多的情況下,比文本 token 少一個數(shù)量級?模型記憶能否完全用視覺邏輯來替代?DeepSeek-OCR 是否為解決大模型上下文長度受限的問題提供了一條現(xiàn)實可行的途徑?DeepSeek-OCR 反映了多模態(tài)大模型的什么發(fā)展趨勢?

帶著這些問題,知危與 Sand.ai 聯(lián)合創(chuàng)始人、首席科學家、《 Swin Transformer 》作者張拯進行了簡單的對話。

知危:

同一段輸入,為什么視覺 token 可以比文本 token 的數(shù)量少得多,有沒有直觀或本質(zhì)的解釋?

張拯:

有兩種觀點。第一種,視覺是一個 2D 表達,因此可以比 1D 的表達更高效。

第二種,高效的原因不是視覺 v.s. 文本,而是兩邊采用的 token 表達方式不同:做視覺表達的時候,我們是在一個高維的連續(xù)空間中做信息壓縮( 把 image patch 映射為一個高維特征 ),之前 LLM 里常用的 tokenizer( 把文本數(shù)據(jù)向量化的工具,通俗理解是一種把自然語言翻譯為機器能理解的語言的工具 )則實際上可以被認為是在一個一維空間中做壓縮( 把文本映射為 id )。高維連續(xù)空間本來就有更好的表達能力,因此可以用更少的 token 數(shù)量來表達更多信息。其實文本也可以做成連續(xù)表達,來大幅度減少文本 token,但是目前應該沒有被很廣泛地用到 LLM 里。

這兩種觀點,我 buy-in 第二種。

知危:

DeepSeek-OCR 相比過往的 OCR 模型,除了效率提升方面,還有哪些獨創(chuàng)性?

張拯:

我最近沒有特別研究過 OCR 模型的進展,但基于我看過的一些信息,我覺得 DeepSeek-OCR 的技術(shù)本身好像并沒有非常特別的部分。但是在觀點上,“ 把視覺作為文本長上下文的壓縮介質(zhì) ”,這個 idea 還是很棒的。這個 idea 有路線上的啟發(fā)意義,相較于現(xiàn)在的多模態(tài)模型,DeepSeek-OCR 會使用兩種不同的 tokenizer 機制,這種路線也許會啟發(fā)更好的多模態(tài)模型設計方案。

知危:

這項技術(shù)對于基礎模型上下文長度難以擴展的當下,可以帶來多大的成本效益?對上下文工程的優(yōu)化有哪些好處?

張拯:

理論上最多能拿到 N^2 倍的收益,N 是 Vision Token 相較于 Text Token 的壓縮率。對于上下文工程的優(yōu)化,最大的好處應該就是不用那么仔細地管理上下文長度了。

知危:

DeepSeek 設想的遺忘機制是否過于簡化?忽略了語義的重要性排序?

張拯:

這種設想肯定還是很初步的,但是也能腦洞出很多改進的空間,比如語義重要的部分可以渲染成更大的字體?

知危:

Andrej Karpathy 認為視覺 token 有潛力可以完全替代文本 token,因為信息壓縮、多模態(tài)、可雙向注意力處理、無需 tokenizer 等優(yōu)勢,您怎么看?

張拯:

大部分都同意,但是 “ 可雙向注意力處理 ” 這里有待探討,“ 可雙向注意力處理 ” 很大程度上和 training objective( 訓練目標 )有關(guān)。

另外,如果后面都是處理視覺 token 了,是不是有機會讓模型能在一個 2D 的空間里做思考?從而帶來更高效的推理( 類似 GPT-4o 的 thinking with image )?這個我覺得還是挺有意思的。

知危:近期 Meta 也提出了一個無需 tokenizer 的模型架構(gòu) Byte Latent Transformer ,可以跳過 tokenization ,直接學習原始字節(jié)流。結(jié)合以上討論和領(lǐng)域現(xiàn)狀,您認為這體現(xiàn)了多模態(tài)大模型的哪些發(fā)展趨勢?

張拯:

宏觀一點來看,不同模態(tài)模型的范式還是有機會持續(xù)進化的。

更細節(jié)一點的話,我初步想到的有兩個:

  • 現(xiàn)在的多模態(tài)大模型的主流做法基本上可以認為在捏合各種不同的模態(tài)的模塊,整個訓練 pipeline 其實還是有點復雜( 不優(yōu)雅 )的。大家肯定希望有更簡單、更統(tǒng)一的方式來處理。類似 DeepSeek-OCR 這樣的工作對我們開發(fā)更好的多模態(tài)模型范式還是挺有啟發(fā)的。
  • 離散表達和連續(xù)表達之間的關(guān)系,以及是否有更好的組合方式,可能也挺重要的。

( 對話全文完 )

總體來看,DeepSeek-OCR 更多是基于效率上的大幅提升啟發(fā)了一個新的路線。

當模型的 “ 思考空間 ” 從一維文本拓展至二維視覺,思考和推理也可能變得更加高效和簡潔。而在技術(shù)層面,則指向當前多模態(tài)大模型領(lǐng)域正等待一把 “ 奧卡姆剃刀 ” 簡化模型范式的時刻。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
地產(chǎn)央企大悅城即將正式退市

地產(chǎn)央企大悅城即將正式退市

第一財經(jīng)資訊
2025-11-18 00:11:41
張繼科"炮轟"劉國梁,2017年換教練不提前說,誰會高三換語文老師

張繼科"炮轟"劉國梁,2017年換教練不提前說,誰會高三換語文老師

查爾菲的筆記
2025-10-12 17:15:34
陳賡曾3次入朝,戰(zhàn)后美軍直言:他根本就不是來打仗的,為何?

陳賡曾3次入朝,戰(zhàn)后美軍直言:他根本就不是來打仗的,為何?

丞丞故事匯
2025-10-29 13:40:49
江西棄嬰被加拿大夫婦收養(yǎng),獲奧運會冠軍后稱:我不會認親生父母

江西棄嬰被加拿大夫婦收養(yǎng),獲奧運會冠軍后稱:我不會認親生父母

卷史
2025-11-08 14:48:31
貝克漢姆的大兒子:一事無成,不如父親帥氣,卻是合格的豪門贅婿

貝克漢姆的大兒子:一事無成,不如父親帥氣,卻是合格的豪門贅婿

科學發(fā)掘
2025-11-16 01:52:52
預祝!杜鋒今晚要沖第3金 宏遠兩將要繼續(xù)爆發(fā) 王洪澤將爆砍20+10

預祝!杜鋒今晚要沖第3金 宏遠兩將要繼續(xù)爆發(fā) 王洪澤將爆砍20+10

郝小小看體育
2025-11-18 11:07:33
珠海拱北口岸附近突發(fā)傷人,嫌犯被當場制服,警方:有多次精神疾病就診史,2人被劃傷

珠海拱北口岸附近突發(fā)傷人,嫌犯被當場制服,警方:有多次精神疾病就診史,2人被劃傷

瀟湘晨報
2025-11-18 09:51:19
近10戰(zhàn)9勝!終于知道火箭為什么會如此厲害,無非就這三點原因!

近10戰(zhàn)9勝!終于知道火箭為什么會如此厲害,無非就這三點原因!

田先生籃球
2025-11-17 16:09:24
曾琦醫(yī)生的事還沒過去,又來個勁爆的!

曾琦醫(yī)生的事還沒過去,又來個勁爆的!

詩意世界
2025-11-11 10:42:51
中國女法官張玲玲,當選聯(lián)合國上訴法庭法官

中國女法官張玲玲,當選聯(lián)合國上訴法庭法官

新京報
2025-11-18 08:48:02
第一家爆雷,河北首富的房企還沒活過來?接著重整!

第一家爆雷,河北首富的房企還沒活過來?接著重整!

花木蘭Channel
2025-11-18 10:23:58
奧運冠軍石智勇奪全運會舉重73公斤級冠軍,賽后宣布退役

奧運冠軍石智勇奪全運會舉重73公斤級冠軍,賽后宣布退役

懂球帝
2025-11-18 11:15:10
汪峰女友森林北公布體檢結(jié)果,自曝小毛病一堆,情緒問題很嚴重

汪峰女友森林北公布體檢結(jié)果,自曝小毛病一堆,情緒問題很嚴重

扒蝦侃娛
2025-11-17 22:25:16
文化工作者要有文化:《澎湖海戰(zhàn)》用“東寧”指代明鄭,是否妥當

文化工作者要有文化:《澎湖海戰(zhàn)》用“東寧”指代明鄭,是否妥當

黃娜老師
2025-11-16 11:24:31
壽命與大便次數(shù)有關(guān)?研究發(fā)現(xiàn):壽命長的人,每天排便在這個次數(shù)

壽命與大便次數(shù)有關(guān)?研究發(fā)現(xiàn):壽命長的人,每天排便在這個次數(shù)

DrX說
2025-10-24 14:15:19
無所不能,湖人隊東契奇在90英尺外投進一記不可思議的超遠三分

無所不能,湖人隊東契奇在90英尺外投進一記不可思議的超遠三分

好火子
2025-11-18 10:51:09
挪威黃金一代!哈蘭德本屆世預賽16球2助攻,厄德高1球7助攻

挪威黃金一代!哈蘭德本屆世預賽16球2助攻,厄德高1球7助攻

懂球帝
2025-11-18 01:30:08
發(fā)小當上公安局長后,竟把我調(diào)去守水庫!三個月后他突然深夜到訪

發(fā)小當上公安局長后,竟把我調(diào)去守水庫!三個月后他突然深夜到訪

呆子的故事
2025-11-14 16:18:57
王思聰新女友被曝光,陪逛街親自拎包,沒懶懶長得漂亮但身材超辣

王思聰新女友被曝光,陪逛街親自拎包,沒懶懶長得漂亮但身材超辣

千言娛樂記
2025-11-17 19:17:51
蜀中無大將?翻開諸葛亮彈劾李嚴的奏章,竟有22位大將卷入內(nèi)斗

蜀中無大將?翻開諸葛亮彈劾李嚴的奏章,竟有22位大將卷入內(nèi)斗

小豫講故事
2025-11-18 06:00:03
2025-11-18 12:48:49

知危 incentive-icons
知危
投資不立危墻之下
498文章數(shù) 1826關(guān)注度
往期回顧 全部

科技要聞

馬斯克破防了!貝索斯62億美金入局"實體AI"

頭條要聞

超市被員工偷到倒閉 收銀員給1700元商品結(jié)賬僅1元

頭條要聞

超市被員工偷到倒閉 收銀員給1700元商品結(jié)賬僅1元

體育要聞

直到退役那天,“海灣梅西”也沒去歐洲踢球

娛樂要聞

曝喻恩泰離婚2年前轉(zhuǎn)移走300箱茅臺?

財經(jīng)要聞

青云租陷兌付危機 集資與放貸的雙面生意

汽車要聞

更加豪華 更加全地形 極石ADAMAS

態(tài)度原創(chuàng)

時尚
教育
親子
房產(chǎn)
數(shù)碼

聽說冷帽是“美女檢驗神器”?

教育要聞

2026高考繳費今日開啟!詳細操作步驟來了?。ǜ嚼U費清單)

親子要聞

帶孩子們?nèi)ビ螛穲?,倆閨女高興壞了,以后有機會一定多陪陪她們!

房產(chǎn)要聞

29.4億!海南“地王”片區(qū),要賣超級宅地!

數(shù)碼要聞

三個月暴漲超3倍:三星16GB DDR5內(nèi)存價格在韓國失控

無障礙瀏覽 進入關(guān)懷版 人妻av中文字幕久久| 奇米影视四色网| 777米奇视频| 国产理论精品| 爱爱无码视频| 久久精品国产精品国产精品污| 在线中文一区字幕对白| 国产亚洲精品无码颜射老妇| 国产成人无码区免费视频| 国产亚洲精品一区二区无| 国产精品久久久久9999爆乳| 亚洲AV综合色区无码区| 日本电影午夜福利| 无码少妇一级AV在公交车不卡| 午夜视频在线观看免费完整版| 精品少妇人妻一区二区三区| 色爱区综合激月婷婷| 无码一级毛片一区二区视频孕妇| 大陆无码一二| 国产97色在线 | 免| 精品无码国产自产在线观看水浒传 | 日日摸日日碰夜夜爽亚洲 | 日本无人区1码2码区别| 中日韩黄色基地一二三区 | 无码一区二区三区精品不卡| 日本添下边视频全过程| 日本成人久久久| 欧美狠狠操女人视频| 国产精品一区二区日韩精品| 狠狠色中文网| 棈品国产乱码久久久久久影片| 亚洲综合一区国产精品| 午夜福利www| 欧美一二三区区黄片| 天天中文色播网| 精品无码久久久久久久动漫| 亚洲码国产精品高潮在线| 人体视频西西| 国产色视频一区二区三区qq号| 中文字幕亚洲综合久久2020| 亚洲日韩中文字幕久热|