當(dāng)大模型從技術(shù)奇點(diǎn)躍遷為產(chǎn)業(yè)基座,當(dāng)智能體從實驗室走進(jìn)產(chǎn)線診室,人工智能的第三次浪潮正以前所未有的銳度重構(gòu)全球經(jīng)濟(jì)肌理。
中國在這場變革中展現(xiàn)出雙重稟賦:既是擁有超大規(guī)模應(yīng)用場景的試煉場,又在芯片突圍、算法開源等深水區(qū)發(fā)起攻堅。從單點(diǎn)技術(shù)破壁到生態(tài)級創(chuàng)新,從效率工具到新質(zhì)生產(chǎn)力引擎,一條具有東方特色的AI發(fā)展路徑正加速浮現(xiàn)。
7月26日,世界人工智能大會(WAIC 2025)以“智能時代 同球共濟(jì)”為主題,匯聚了來自AI領(lǐng)域的科技巨頭、學(xué)術(shù)先鋒與政策制定者,而這場覆蓋技術(shù)、倫理、藝術(shù)的超級盛宴,昭示著AI已從“產(chǎn)業(yè)變量”進(jìn)化為“文明常量”。
在這場關(guān)于人工智能產(chǎn)業(yè)的盛會上,36氪不僅作為產(chǎn)業(yè)觀察者,更以產(chǎn)業(yè)連接者的角色深度參與,在展館中搭建了“氪星直播間”,以對話的形式,揭秘人工智能產(chǎn)業(yè)進(jìn)階的底層邏輯。
在對談中,百度文庫產(chǎn)品負(fù)責(zé)人鐘昊表示:百度文庫經(jīng)過AI重構(gòu),能夠充分高效理解用戶意圖、滿足用戶需求,一站式、端到端解決用戶問題。百度文庫從最開始就堅持了MoE(混合專家模型)架構(gòu),并通過Genflow進(jìn)行全局調(diào)度,出發(fā)點(diǎn)就是讓 AI 像人一樣學(xué)習(xí)工作,成為人類最好的搭子,幫助用戶更好進(jìn)行內(nèi)容的創(chuàng)作和消費(fèi)。
以下為對談實錄,經(jīng)36氪編輯:
36kr:首先請您介紹一下自己和業(yè)務(wù)的情況吧。
鐘昊:我是百度文庫的產(chǎn)品負(fù)責(zé)人。大家對于百度文庫比較了解的是資料庫屬性,經(jīng)過兩年多的 AI 重構(gòu)后,我們把很多 AI 能力和專業(yè)資料內(nèi)容做了很好的結(jié)合。現(xiàn)在百度文庫是一站式 AI 內(nèi)容獲取和創(chuàng)作平臺,有幾百個多模態(tài) AI Agent,可以幫助用戶端到端解決很多創(chuàng)作問題?,F(xiàn)在的百度文庫已經(jīng)煥然一新,大家可以到 APP 或 PC 端網(wǎng)頁體驗。
36kr:這次來WAIC的感受是什么樣?有哪些收獲?
鐘昊:百度文庫網(wǎng)盤今年也有參展。AI 行業(yè)發(fā)展確實迅速。第一,大模型本身在進(jìn)化,不管是文生文、文生圖還是視頻模態(tài),模型邊界比往年大大拓寬,看到很多有意思的應(yīng)用。另外不管是初創(chuàng)企業(yè)還是大公司,在都加大了投入決心,今年是百花齊放的展會,既有共識部分,也有突破邊界的部分。我個人更期望看到更多突破邊界、更有想象力的嘗試,不是很早就陷入局部最優(yōu)或短期共識解法中。
36kr:您印象最深刻的展臺是哪一個?
鐘昊:各個展臺有自己的特色,文庫網(wǎng)盤更多展示的是場景化和端到端解決具體問題,最早我們關(guān)注的是用戶對最終交付的內(nèi)容,無論是AI創(chuàng)作還是AI和人共同創(chuàng)作的內(nèi)容的采納率和使用率。
文庫和網(wǎng)盤的展臺是按用戶場景設(shè)計的,不管學(xué)習(xí)、辦公、生活還是娛樂,不同場景都有文庫、網(wǎng)盤的分場景解決方案,用戶能感受到需求被充分滿足。
36kr:在百度文庫AI重構(gòu)的過程中,您認(rèn)為最大的技術(shù)難點(diǎn)是什么?最好用的 AI 功能是哪一個?
鐘昊:最好用且做得最深的是智能 PPT,我們在國內(nèi)最早做這個能力,現(xiàn)在針對十幾個場景做了深入細(xì)化。用戶不僅能基于指令生成,還可以基于圖片、文檔、素材,甚至授權(quán)的個人網(wǎng)盤內(nèi)容生成 PPT,我們還能支持上傳模板和自定義模板,還能直接生成圖表、數(shù)據(jù)等。
在智能PPT這個場景,我們做得比較深、比較完整,在智能PPT的基礎(chǔ)之上,我們把同樣思路運(yùn)用到很多場景,現(xiàn)在文庫能生成長短文、研報、思維導(dǎo)圖、AI 繪本、海報等。
對于技術(shù)難點(diǎn),文庫的AI重構(gòu),已不限于 AI agent 本身的構(gòu)造,更多是理解用戶意圖,讓 AI 聰明調(diào)度多個 Agent 解決問題。比如一個剛剛?cè)雽W(xué)不久的大學(xué)新生,他需要策劃社團(tuán)活動方案,可能不會明確說要 PPT、海報或策劃文檔,AI 需要基于專業(yè)內(nèi)容和類似場景解決方案,主動給到綜合交付,調(diào)度不同 Agent 完成任務(wù)。
這對技術(shù)的要求會更高,你既要能夠理解用戶,還要深入挖掘 Query 背后的意圖和需求邊界,怎么能高效、合理地為用戶解決問題。這樣更偏場景挖掘、場景需求理解和場景解決方案的能力,有更深的技術(shù)要求,以及讓AI變得更聰明才能做到,同時它底層有需要細(xì)顆粒度、靈活的 Agent,以及 AI 閱讀器、編輯器等基建支持,都是為了完成更綜合的任務(wù)挑戰(zhàn)。
36kr:百度文庫作為國民級產(chǎn)品,經(jīng)歷 AI 原生重構(gòu)后,帶來了哪些顛覆性改變?
鐘昊:最大改變是,過去作為百度文庫資料庫只解決用戶需求的一小部分,用戶來到文庫,找到一篇他需要的內(nèi)容,下載體驗后就結(jié)束了,他的訴求還沒有被完全滿足?,F(xiàn)在文庫不僅能高效找到內(nèi)容,還能從零開始或基于現(xiàn)有內(nèi)容完成綜合任務(wù)。一方面有 AI 實時人機(jī)交互理解需求,另一方面借助 AI 融合編輯器等基建,用戶可邊思考邊創(chuàng)作,調(diào)度 AI 完成任務(wù)。有了這些基建之后,AI能夠幫你全自動地解決,融合編輯器會幫他半自動解決這些過程,用戶無需跨多個軟件,在一個應(yīng)用就能快速完成工作,產(chǎn)品從資料庫變成一站式平臺,這是用戶真正想要的。
36kr:大模型結(jié)合 AI 技術(shù)時,大家會考慮成本、效果、時延等 “不可能三角” 問題,文庫網(wǎng)盤是如何解決的?
鐘昊:百度文庫從重構(gòu)時就采用 MoE 架構(gòu),當(dāng)時行業(yè)流行 Prompt 工程,但我們發(fā)現(xiàn)難以突破模型能力邊界,且會碰到不可能三角問題。我們先結(jié)合具體場景針對性優(yōu)化 Agent,比如智能 PPT、長短文、研報、思維導(dǎo)圖等,在每個場景打磨中找到最佳平衡點(diǎn),再局部解決不可能三角的問題。比如 PPT 配圖時,是生成圖片還是直接調(diào)取文庫內(nèi)容,后者可能又好又快。在一個個分場景的細(xì)節(jié)打磨中,我們逐漸找到了最佳的平衡點(diǎn),以及能讓用戶又快又好獲得高質(zhì)量交付。
在此基礎(chǔ)上,我們推出 GenFlow 調(diào)度中樞,馬上就會推出 2.0 版本。GenFlow能結(jié)合用戶意圖自動調(diào)度 Agent 解決問題,同樣需求用A方案比B方案更 “多快好省”。最底層是 MoE,之上是細(xì)分場景 Agent 打磨,在幾百個場景實現(xiàn)局部最佳平衡,再通過 Genflow 全局調(diào)度。越理解用戶需求和 Query 背后意圖,越能解決問題,基本功在于離場景多近、是否沉下心打磨。
行業(yè)中很多產(chǎn)品遇到了不可能三角的問題,會急著找通用方案解決所有用戶的問題,但這其實很難,在短期內(nèi)找到最優(yōu)平衡點(diǎn),反而要沉下心場景打磨,這很難,但卻離最終目標(biāo)更近。
36kr:其實是在具體場景內(nèi)靈活調(diào)整。
鐘昊:是的,通過PMF 滿足用戶需求,比如文庫的研報能力剛上線時,是解決用戶分析、研究類的需求,我們?nèi)绾伪WC他需要簡單分析的時候,不會生成一篇上萬字的研報?雖然當(dāng)時能力很領(lǐng)先,但這不一定是用戶要的,用戶可能只需要簡單分析,我們就避免生成冗余內(nèi)容,既節(jié)約成本時間,又解決不可能三角問題。很多時候答案在場景細(xì)節(jié)里,愿意沉下心打磨就離目標(biāo)更近。
36kr:其實能做到這一點(diǎn),還是基于百度在AI技術(shù)上的積累。
鐘昊:是的,我們投入最早,最開始就堅持了 MOE 架構(gòu)。作為應(yīng)用端產(chǎn)品,我們在文心系列模型基礎(chǔ)上探索邊界,最終把好食材炒成大餐,不僅靠技術(shù)積淀,更要走進(jìn)用戶和場景,讓技術(shù)積累發(fā)揮最大化。
36kr:GenFlow是怎么把模型轉(zhuǎn)換成生產(chǎn)力的?在多智能體協(xié)作上有什么優(yōu)勢?
鐘昊:我們對GenFlow的最早構(gòu)思,是解決用戶不知道平臺有眾多能力的問題,很多用戶不知道文庫網(wǎng)盤又?jǐn)?shù)百個能力,用戶和AI進(jìn)行交互的時候是帶著訴求來的,極客愛好者會深度探索,但普通用戶沒必要挖掘所有功能,AI 應(yīng)該更主動提供服務(wù),解決用戶prompt描述清楚或找到入口才能使用的問題。我們希望 AI 像人一樣主動工作,在交互的過程中允許你提出更多追問和建議,并行給你解決方案,能夠多線程地去處理很多工作,符合上述特征才算的上是主動的AI。
因此GenFlow 2.0版本即將推出干預(yù)模式、并行模式和主動思考能力,能主動挖掘用戶過往溝通內(nèi)容和記憶庫,了解用戶對話背后的需求,能夠去并行處理N個任務(wù)。
這是我們在行業(yè)當(dāng)中的創(chuàng)新。因現(xiàn)在大多數(shù) AI 是串行解決任務(wù),但人是能夠并行處理工作的,我們認(rèn)為AI也可以,所以我們實現(xiàn)了并行處理,推出干預(yù)模式讓用戶可隨時打斷、補(bǔ)充、修改內(nèi)容,AI了解用戶歷史對話和授權(quán)資料,主動靈活解決問題,過程中能流暢交談,這種主動性的提升,讓GenFlow的技術(shù)能力最大化。我們的出發(fā)點(diǎn)是解決人機(jī)交互問題,落腳點(diǎn)是讓 AI 更主動、全面服務(wù)人。
36kr:展望未來 3 到 5 年,伴隨著技術(shù)越來越成熟,整個行業(yè)會發(fā)生哪些更新的變化?在戰(zhàn)略上是否會有一些新的部署?
鐘昊:未來人機(jī)交互一定會更加深入和全面,會滲透到人類的工作、學(xué)習(xí)、生活、娛樂各個方面,交互方式的邊界也會更加模糊,更多是人類和AI共同完成的。
就像為什么文庫、網(wǎng)盤推出GenFlow一樣,首先我們希望AI能像人一樣思考,學(xué)習(xí)、工作,讓AI成為人類最好的搭子,從布局上來講,我們一直沿著內(nèi)容的主航道布局,從內(nèi)容生產(chǎn)的起點(diǎn)到內(nèi)容消費(fèi)的終點(diǎn),是百度文庫和百度網(wǎng)盤一直在做的事情。我們希望讓 AI 幫助大家更好進(jìn)行內(nèi)容的創(chuàng)作和消費(fèi)。
未來某一天,我們會嘗試新形式的辦公和學(xué)習(xí),不一定需要電腦,可能從口袋里拿出一個設(shè)備,在3-5分鐘就能完成原來一、兩個星期才能完成的工作。
比如在娛樂放松的時候,能很方便地把小說轉(zhuǎn)變成動畫的形式,不需要去逐行讀文字,讓AI實現(xiàn)我們的想象力,我們看很多文學(xué)作品的時候也會有自己的想法,這時候我們又變成了創(chuàng)作者。
這是AI是我最好的幫手,因為我沒學(xué)過繪畫,也不是專業(yè)的剪輯師,但AI可以像一個團(tuán)隊一樣幫我實現(xiàn),最大程度降低創(chuàng)作門檻,讓每一個有創(chuàng)造力的人,都能充分發(fā)揮自己的想法,并且被更多人看到。
AI在理解每一個用戶需求的同時,給他推薦更好的內(nèi)容,同時提升效率,節(jié)省時間,人們通過更低門檻的AI平臺發(fā)揮自己的創(chuàng)想,生產(chǎn)出來的內(nèi)容又被更多人消費(fèi),我非常期待這樣一個新世界。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.