智東西AI前瞻(公眾號:zhidxcomAI)
作者 江宇
編輯 漠影
智東西8月6日報道,如果你也有“文檔太多,沒空看”的困擾,這次,ima推出的新功能,或許能為你省下不少閱讀時間。
昨日,ima發(fā)布最新版本,一口氣上線四項(xiàng)能力:生成雙人AI播客、支持文件夾上傳、Xmind腦圖導(dǎo)入、共享知識庫文檔置頂,圍繞知識的整理、理解與調(diào)用做了多項(xiàng)改進(jìn)。
其中,“AI播客對話”功能頗受關(guān)注。用戶只需上傳一份文檔,就能自動生成一段雙人播客,用類似聊天的方式,把文章內(nèi)容講給你聽。不是單調(diào)朗讀,而是真人語氣的討論、解釋與延伸。聽著聽著,你會發(fā)現(xiàn),AI不僅讀懂了文章,還在引導(dǎo)你“聽明白”。
圍繞四項(xiàng)新功能,智東西選取了三類不同風(fēng)格的文章體驗(yàn)了“AI博客”,也同步體驗(yàn)了批量導(dǎo)入與知識庫整理的整體流程,以下是詳細(xì)體驗(yàn)過程。
一、生成AI播客,把長文“聊清楚”講給你聽
在本次更新中,ima推出的“AI播客”與傳統(tǒng)的文本轉(zhuǎn)語音不同,ima采用雙人播客對話形式,將一篇文檔拆解為知識點(diǎn)、疑問與觀點(diǎn),由兩個虛擬角色以“你來我往”的形式進(jìn)行討論,重點(diǎn)不漏、互動真實(shí)、聽感流暢,可定制開場語與配樂,還原聽覺上更自然的學(xué)習(xí)體驗(yàn)。
ima播客生成基于混元大模型,系統(tǒng)會自動抓取文檔中的信息,轉(zhuǎn)化為腳本,再配合擬人語音進(jìn)行演繹。整個過程無需用戶寫稿,只需點(diǎn)擊“生成播客”按鈕,AI即完成從文檔到音頻的內(nèi)容轉(zhuǎn)換。
目前,“AI播客對話”功能支持用戶上傳本地文檔生成播客內(nèi)容,暫不支持通過文章鏈接直接導(dǎo)入,用戶可在PC端或移動端首頁入口使用該功能。
▲PC端入口
▲手機(jī)端入口
由于暫不支持粘貼鏈接導(dǎo)入,用戶需將目標(biāo)內(nèi)容整理為文檔上傳,或從個人知識庫中選擇已有文件。點(diǎn)擊“生成播客”后,系統(tǒng)將在約1–3分鐘內(nèi)完成生成。
智東西使用“生成AI播客”功能,體驗(yàn)了三類不同的文章。整體效果出人意料,不只是把文字轉(zhuǎn)成語音,更像是帶節(jié)奏、有引導(dǎo)的深度對話,AI在“講清楚”之外,還展現(xiàn)出一定的理解力與表達(dá)力。
第一篇是來自歷史大家許倬云的文章——《當(dāng)今時代,如何過真正有力量的生活?》。
https://oss.zhidx.com/af0b077ae37876131d99de65be94a139/68937c00/uploads/2025/08/68930d9d8b5f9_68930d9d873ba_68930d9d87393_%E8%AE%B8%E5%80%AC%E4%BA%91%E3%80%8A%E5%BD%93%E4%BB%8A%E6%97%B6%E4%BB%A3%EF%BC%8C%E5%A6%82%E4%BD%95%E8%BF%87%E7%9C%9F%E6%AD%A3%E6%9C%89%E5%8A%9B%E9%87%8F%E7%9A%84%E7%94%9F%E6%B4%BB%EF%BC%9F%E3%80%8B.m4a
ima的AI博客以一問一答的形式,引導(dǎo)用戶一步步理解文章重點(diǎn)。語氣自然,有停頓、感嘆詞,也能抓住原文的語言風(fēng)格,把字面意思和內(nèi)在含義串聯(lián)起來。原以為只是機(jī)械導(dǎo)讀,實(shí)際聽下來,AI已經(jīng)摸透了作者的邏輯,還能幫用戶“聽明白”問題,“讀進(jìn)去”文章。
第二篇是AI故事計(jì)劃的《一個實(shí)習(xí)生親歷的Manus外遷與裁員》。
https://oss.zhidx.com/a98236e5b665a4d10f83e347732d820b/68937c00/uploads/2025/08/68930fe0a742b_68930fe09291a_68930fe0928e6_%E3%80%8A%E4%B8%80%E4%B8%AA%E5%AE%9E%E4%B9%A0%E7%94%9F%E4%BA%B2%E5%8E%86%E7%9A%84Manus%E5%A4%96%E8%BF%81%E4%B8%8E%E8%A3%81%E5%91%98%E3%80%8B.mp3
ima在引入時加入了事件背景,講故事像說書,有節(jié)奏、有情緒。結(jié)尾的總結(jié)也處理得非常自然,把原文留白的部分做了收束。唯一的小問題是“Manus”這個詞英文發(fā)音不太穩(wěn)定。
第三次體驗(yàn)是來自澎湃新聞有關(guān)“假院士”的系列報道,共三篇文章。
https://oss.zhidx.com/833f65c6a07a904ea12c7ea5f87f6d4a/68937c00/uploads/2025/08/6893112e4e7c1_6893112e41ff0_6893112e41fb7_%E2%80%9C%E5%81%87%E9%99%A2%E5%A3%AB%E2%80%9D%E7%B3%BB%E5%88%97%E6%8A%A5%E9%81%93.mp3
博客對話非常有討論感,能把這些離譜新聞講得清楚,還帶點(diǎn)八卦氛圍。對話里還模擬了卡頓、不熟悉人名等小細(xì)節(jié),有種“真人在讀”的聽感,既能結(jié)合三篇報道講清來龍去脈,也有面對荒誕新聞時的自然反應(yīng)。
整體來看,這個播客功能不僅能讓你“聽內(nèi)容”,更像是和懂文章的朋友一起慢慢聊明白。AI不僅讀懂了,也努力在幫你讀深。
二、從批量導(dǎo)入到知識結(jié)構(gòu),三項(xiàng)功能提升效率
針對資料整理場景,本次ima支持了文件夾上傳能力,但僅限PC端。用戶可一鍵上傳多層級文件夾,系統(tǒng)自動識別文件結(jié)構(gòu),完整保留目錄體系。
相比逐個上傳、手動分類的操作方式,該功能能夠有效簡化前期資料整理步驟,適用于課程筆記、項(xiàng)目文檔、報告合集等成組合類資料的導(dǎo)入,并且導(dǎo)入后的資料仍支持原有的AI閱讀、知識提取等功能。
智東西嘗試上傳包含10篇論文的文件夾,ima能準(zhǔn)確保留原有目錄結(jié)構(gòu),并將文件整體導(dǎo)入至個人知識庫。
每份文檔一經(jīng)上傳均被AI自動解析,用戶可在概覽欄直接查看對應(yīng)的摘要內(nèi)容。
為了支持更多類型的結(jié)構(gòu)化資料,本次ima新增了對Xmind文件的解析與導(dǎo)入功能。用戶可上傳.xmind格式的腦圖,系統(tǒng)將自動識別其內(nèi)容結(jié)構(gòu),并將其中的信息提取為可解析的知識點(diǎn),并支持用戶對腦圖內(nèi)容進(jìn)行修改。
導(dǎo)入后的腦圖也直接納入知識庫進(jìn)行管理與引用,用戶點(diǎn)擊右側(cè)“問知識庫”下方的對話欄,即可調(diào)用AI對其內(nèi)容進(jìn)行提問和總結(jié)。
▲xmind格式可導(dǎo)入
▲ima解析腦圖,支持AI解讀、總結(jié)提取等功能。
在知識庫中,ima還增加了“文檔置頂”能力。用戶可將某些重點(diǎn)或高頻使用的文檔設(shè)置為置頂,固定在共享知識庫的頂部區(qū)域,支持多個文檔同時置頂,排序依據(jù)設(shè)定順序排列。該功能尤其適用于項(xiàng)目協(xié)作、培訓(xùn)資料、標(biāo)準(zhǔn)文檔等場景,可作為快速索引使用。
結(jié)語:從看文件到“講明白”,AI正成為知識的新入口
本輪更新后,ima不再只是“看文件”的工具,而開始承擔(dān)“講內(nèi)容”的角色。從文本到播客、從腦圖到知識庫,AI介入的邊界進(jìn)一步拓寬。
尤其是在AI播客功能中,ima展現(xiàn)出對文本結(jié)構(gòu)、語言節(jié)奏乃至情緒表達(dá)的把握力,不僅講得清楚,還講出了溫度和活人感。相比單向朗讀,它更像是一場“陪你讀懂”的深度對話。
在文檔不斷堆積、注意力高度碎片的當(dāng)下,用“聽”的方式吸收信息,正成為一種越來越自然的需求。更新后的ima,正在提供這樣的新接口。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.