最近,小雷的朋友被 PPT 任務(wù) “纏身”,在群里討論起當(dāng)下 AI 模型生成 PPT 的質(zhì)量問題。小雷本以為這項(xiàng)技術(shù)已相當(dāng)成熟,沒想到仍存在不少漏洞,這也恰好提供了一個(gè)好素材 ——AI 生成 PPT 到底靠不靠譜?
為解答這個(gè)疑問,雷科技篩選了目前國產(chǎn)領(lǐng)域支持生成 PPT 的 4 個(gè) AI 助手,分別是百度文庫、Kimi、夸克 AI、扣子空間,它們搭載的大模型各不相同,但均支持 “一句話生成 PPT” 與 “根據(jù)文檔內(nèi)容生成 PPT” 功能,也就是說,都具備自主生成 PPT 內(nèi)容的能力。
圖源:雷科技
本次實(shí)測便圍繞上述兩個(gè)核心功能展開,向 4 款 AI 輸入相同的文字信息與文檔信息,目的是測試它們自主生成 PPT 內(nèi)容的能力,以及依據(jù)用戶提供內(nèi)容生成 PPT 的能力。小雷選擇了職場常用的 “年終述職報(bào)告” 作為測試場景,為檢驗(yàn) AI 生成是否存在偏差,還在輸入信息中加入了相關(guān)產(chǎn)品數(shù)據(jù)。
為避免爭議,先說明相關(guān)PPT的數(shù)據(jù)均為虛構(gòu),與實(shí)際情況無關(guān)。
PPT 與文章不同,需配合用戶口述呈現(xiàn),因此要求內(nèi)容簡潔明了,每張幻燈片的信息需清晰易懂,重點(diǎn)內(nèi)容必須突出,不能與普通內(nèi)容混雜;同時(shí),PPT 的美觀度也至關(guān)重要,涉及文字排版、圖片排版等細(xì)節(jié),圖文是否匹配更是關(guān)鍵評價(jià)維度。為此,小雷還邀請了十位打工人,讓她們對 4 款 AI 生成的 PPT 進(jìn)行“盲評”。
AI PPT顏值PK:扣子空間贏麻了
測試正式開始,以下這段包含大量銷量數(shù)據(jù)(涵蓋手機(jī)、平板銷量及產(chǎn)品份額等)的文字,將作為統(tǒng)一輸入文本,錄入各 AI PPT 助手的對話框中,以此增加測試難度:
“我是手機(jī)業(yè)務(wù)部門的產(chǎn)品經(jīng)理,本年度手機(jī)總銷量達(dá) 500 萬臺,同比增長 15%,其中高端旗艦系列貢獻(xiàn) 40% 銷量,共計(jì) 200 萬臺;平板銷量突破 50 萬臺,全年銷量預(yù)計(jì)達(dá) 250 萬臺。手機(jī)產(chǎn)品市場份額提升 2 個(gè)百分點(diǎn),增至 18%;平板產(chǎn)品在海外市場份額增長 5%,其中東南亞市場銷量增長 30%。請根據(jù)這些數(shù)據(jù),幫我制作一份 15-20 頁的年終述職報(bào)告 PPT,需支撐至少 8 分鐘的述職時(shí)長。”
所有 AI 生成 PPT 時(shí),均直接選擇其推薦的第一個(gè)模板。美觀度評價(jià)將圍繞 6 個(gè)標(biāo)準(zhǔn)展開:文字美觀度、圖片美觀度、圖文匹配度、圖標(biāo)元素美觀度、易讀易懂性,每個(gè)維度滿分 10 分,總分 60 分。
圖源:雷科技
需說明的是,本次測試僅邀請 10 人參與評價(jià),美觀度等維度存在主觀傾向,大家可當(dāng)作參考,文中也附上了 PPT 原圖供對比。
夸克、扣子空間、百度文庫、Kimi
先看結(jié)論再談體驗(yàn):問卷調(diào)查結(jié)果(表格中為 10 人評分平均值)顯示,在文字美觀度、圖片美觀度及圖標(biāo)元素美觀度這三個(gè)維度,四款 AI 生成的 PPT 差距不大。
圖源:雷科技
可見,這類基礎(chǔ)排版與圖片搭配,大多可通過 “套模板” 的方式完成 PPT 整體構(gòu)建。因此,在基礎(chǔ)文字組織與圖片搭配上,借助模板格式就能實(shí)現(xiàn)較好的觀感。可以看出在「顏值」方面,四款 AI 并未拉開明顯差距。
差距出在 “圖文匹配度” 上:Kimi 與夸克 AI 的表現(xiàn)相當(dāng)一般。Kimi 生成的 PPT 中僅包含一張圖片,盡管圖片邊框、色調(diào)等細(xì)節(jié)經(jīng)過處理,更貼合整體風(fēng)格,但在呈現(xiàn)手機(jī)、平板市場份額的頁面中,搭配的卻是筆記本電腦圖片,匹配度較差;夸克 AI 也存在類似問題 —— 圖片細(xì)節(jié)符合模板風(fēng)格,但圖片選擇與內(nèi)容脫節(jié),因此二者在該維度評分明顯偏低。
圖源:雷科技
而扣子空間在 “數(shù)據(jù)呈現(xiàn)” 與 “易讀易懂性” 兩個(gè)維度的評分,呈現(xiàn)出近乎碾壓的優(yōu)勢。從低分表現(xiàn)看到高分表現(xiàn),才能真正明白差距所在。前文提到,輸入 AI 的文字信息中包含大量數(shù)據(jù),而 PPT 的核心需求是將數(shù)據(jù)置于顯眼位置突出呈現(xiàn) —— 可通過放大高亮、排版分點(diǎn)等方式,用圖表展示則更為簡潔直觀。
但實(shí)際測試中,多數(shù) AI 未能做到這一點(diǎn):大量數(shù)據(jù)與文字混雜,既無放大高亮,也無圖表輔助,觀感極差,無法讓人直觀獲取手機(jī)銷量、產(chǎn)品份額等關(guān)鍵信息。其中,Kimi 的問題最為突出:它只是將深度加工后的文案分點(diǎn)插入 PPT 模板,導(dǎo)致頁面文字信息量過大,且口語化現(xiàn)象嚴(yán)重,完全未區(qū)分需重點(diǎn)突出的數(shù)據(jù),僅按模板格式機(jī)械代入內(nèi)容。
圖源:雷科技
夸克 AI 也存在類似問題,但表現(xiàn)形式不同:它將數(shù)據(jù)分點(diǎn)后套入模板,卻未補(bǔ)充任何輔助信息,頁面僅散落著少量圖標(biāo)與文字;幸好模板本身區(qū)分了字體大小,否則整體觀感會進(jìn)一步下滑。
百度文庫的表現(xiàn)稍好:它將核心數(shù)據(jù)歸納在頁面正上方,以標(biāo)題形式突出,正文部分則加入了深度加工的內(nèi)容。但問題在于,百度文庫出現(xiàn)了明顯的 “AI 幻覺”—— 生成了原文中未提及的數(shù)據(jù),如 “線下門店數(shù)量”“市場滲透率” 等,且未標(biāo)注數(shù)據(jù)來源,這一問題對 PPT 實(shí)用性影響較大。
圖源:雷科技
再看評分最高的扣子空間:4 款 AI 中,僅有「扣子空間」自主生成了圖表,且經(jīng)過深度思考,額外加入了手機(jī)全球銷量分析、未來展望等內(nèi)容,完全符合年終述職報(bào)告的需求。更值得一提的是,扣子空間在補(bǔ)充數(shù)據(jù)時(shí),會明確標(biāo)注來源網(wǎng)址,用戶可直接點(diǎn)擊驗(yàn)證數(shù)據(jù)可靠性,有效避免了虛假數(shù)據(jù)問題。
圖源:扣子空間
其生成的圖表不僅包含用戶提供的數(shù)據(jù),還加入了與華為、OPPO、vivo 等品牌的對比數(shù)據(jù);圖表比例無錯(cuò)誤,格式選擇也十分合理 —— 銷量數(shù)據(jù)用柱狀圖對比,市場份額用餅狀圖呈現(xiàn)。
圖源:雷科技
此外,其他 3 款 AI 均是按輸入文字的順序(先數(shù)據(jù)、后延展內(nèi)容)機(jī)械生成 PPT,邏輯連貫性較差;而扣子空間則展現(xiàn)出 “自主思考” 能力:它將數(shù)據(jù)拆解重組,構(gòu)建了完整的邏輯框架 —— 從全球電子市場態(tài)勢切入,分析本公司手機(jī)銷量與市場競爭關(guān)系,最后呈現(xiàn)年終銷量分析。
圖源:雷科技
整個(gè)過程納入了友商數(shù)據(jù)進(jìn)行對比,結(jié)尾還給出了分析結(jié)果,觀感極佳。不過,扣子空間存在一處小問題:部分圖表出現(xiàn)出框現(xiàn)象,推測是生成尺寸與模板不匹配導(dǎo)致,整體影響不大。由此可見,在數(shù)據(jù)呈現(xiàn)與易讀易懂性上,扣子空間的表現(xiàn)遠(yuǎn)超其他 AI,這是它的核心優(yōu)勢。
用戶上傳文檔生成PPT:百度文庫進(jìn)步明顯
第二部分測試為 “上傳文檔生成 PPT”:小雷準(zhǔn)備了一篇 2000 字的述職報(bào)告(可視為上文文字信息的延伸),內(nèi)容分為 “年度目標(biāo)”“全年成績”“挑戰(zhàn)困境”“未來規(guī)劃”“結(jié)語” 五個(gè)板塊,其中包含與前文相同的數(shù)據(jù)分析。
本次測試旨在觀察:在限制 AI 自由發(fā)揮的前提下,4 款 AI 生成 PPT 的表現(xiàn)如何?
在文檔邏輯的約束下,4 款 AI 生成的 PPT 均未出現(xiàn)明顯邏輯問題,均按演講稿順序構(gòu)建框架,但前文提及的問題不僅依然存在,還因文檔內(nèi)容更豐富而暴露得更明顯。Kimi AI 與夸克 AI “套模板” 的問題依舊突出:Kimi 甚至完全放棄自主生成圖片,所有圖片均沿用模板格式,且與文檔內(nèi)容無關(guān);圖標(biāo)元素與文字排版混亂,完全按模板格式硬套演講稿內(nèi)容,“無重點(diǎn)” 的劣勢被進(jìn)一步放大,使用體驗(yàn)較差。
圖源:雷科技
夸克 AI 的表現(xiàn)與之類似 —— 對比兩款 AI 生成的 PPT,能發(fā)現(xiàn)相同的模板格式,僅做了輕微調(diào)整??淇松瞄L簡約風(fēng)格,但在降低制作復(fù)雜度的同時(shí),也犧牲了內(nèi)容質(zhì)量:頁面依舊平淡無奇,既未突出重點(diǎn),甚至還對普通內(nèi)容進(jìn)行了高亮標(biāo)記,本質(zhì)上就是 “模板提供格式、文檔提供內(nèi)容” 的簡單拼接,無法滿足優(yōu)質(zhì) PPT 的需求。
圖源:雷科技
百度文庫在輸入詳細(xì)文檔后,表現(xiàn)有明顯進(jìn)步:省去了自主補(bǔ)充內(nèi)容的環(huán)節(jié),整體邏輯更清晰,完全按演講稿順序執(zhí)行;同時(shí),它將重點(diǎn)內(nèi)容拆分呈現(xiàn),例如將手機(jī)端銷量與平板端銷量單獨(dú)放在一頁幻燈片中,突出核心信息。可惜的是,百度文庫未通過高亮標(biāo)記或其他方式突出數(shù)據(jù),僅做了統(tǒng)一展示;不過,得益于簡潔的風(fēng)格,數(shù)據(jù)信息未被掩蓋,基本能獨(dú)立完成 PPT 內(nèi)容的展示需求。
圖源:雷科技
扣子空間的表現(xiàn)依舊亮眼:它未自主構(gòu)建邏輯,與百度文庫類似,通過提取關(guān)鍵數(shù)據(jù)單獨(dú)制作頁面,但整體呈現(xiàn)效果更優(yōu) —— 數(shù)據(jù)采用 “放大 + 高亮” 標(biāo)注,圖片排版也不會搶占文字主體地位(通過漸變暗色虛化圖片背景),讓文字信息更突出。同時(shí),扣子空間圖表制作的優(yōu)勢依然明顯,且圖表與圖標(biāo)搭配形成了舒適的視覺效果,無雜亂感;深色底色與同色系字體相得益彰,真正呈現(xiàn)出了優(yōu)質(zhì) PPT 應(yīng)有的質(zhì)感。
圖源:雷科技
結(jié)論:讓AI做好PPT,關(guān)鍵在于用戶指令
在使用 4 款 AI 生成 PPT 后,小雷認(rèn)為:讓 AI 明確需求是關(guān)鍵,指令必須精準(zhǔn) —— 包括排版順序、文字格式、圖片風(fēng)格等,能細(xì)化的需求盡量細(xì)化。當(dāng)前的 AI 模型無法自主預(yù)判用戶需求,必須根據(jù)用戶的分步指令生成內(nèi)容,才能達(dá)到預(yù)期效果。
例如,百度文庫 PPT 助手的 “單頁生成” 功能就很實(shí)用:用戶可通過指定主題內(nèi)容生成單頁 PPT,既能避免邏輯混亂問題(完全按用戶邏輯構(gòu)建),最后串聯(lián)成完整 PPT 即可;同時(shí),單頁生成也讓數(shù)據(jù)檢查更便捷。
而 “數(shù)據(jù)檢查” 這一步至關(guān)重要:使用 AI 生成內(nèi)容時(shí),必須對照正確數(shù)據(jù)反復(fù)核驗(yàn)。當(dāng)前 AI 難以分辨信息真?zhèn)危瑑H通過算法推測生成內(nèi)容,因此扣子空間標(biāo)注數(shù)據(jù)來源的設(shè)計(jì)十分實(shí)用 —— 用戶可直接驗(yàn)證信息準(zhǔn)確性,有效規(guī)避 AI 幻覺。
綜合本次測試來看,扣子空間與百度文庫均具備獨(dú)立生成 PPT 的能力,其中百度文庫需進(jìn)行少量后期修改(如突出數(shù)據(jù)重點(diǎn));而夸克 AI 與 Kimi AI 在 PPT 內(nèi)容構(gòu)建上仍存在明顯短板,期待后續(xù)更新能帶來改進(jìn)。
最后,讓我們以未參與本次測試的豆包 AI 對這些 PPT 的評分,為本次實(shí)測畫上句號。
在豆包AI的評價(jià)中,扣子空間幾乎完勝,也不知道是不是同出一門的原因,看來這AI的情商確實(shí)是高啊。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.