網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

一鍵生成十分鐘長視頻？我發(fā)現(xiàn)了一個(gè)超強(qiáng)的起號(hào)套路。。。

2025-08-06 00:18:17　來源: 差評(píng)XPIN

浙江舉報(bào)

分享至

開源的風(fēng)，終于是從大模型吹到了Agent。

不要說線是歪的，因?yàn)橥ㄍ鵄GI之路注定會(huì)有波折

前幾天，字節(jié)跳動(dòng)旗下的Coze（扣子）平臺(tái)開源了，給本就熱火朝天的 Agent 賽道又加了波猛料。

大家別光顧著吃瓜看熱鬧，其實(shí)這背后在說一件事：時(shí)代變了。

以前大家比的是誰家模型更聰明，所以拼了命把訓(xùn)練參數(shù)做大、把基礎(chǔ)模型做強(qiáng)。

但現(xiàn)在真正的戰(zhàn)場(chǎng)，已經(jīng)轉(zhuǎn)移到了怎么把大模型用好、用到實(shí)處。

說白了，大家都已經(jīng)不滿足做個(gè)簡(jiǎn)單的Agent，而是要看Agent 平臺(tái)怎么讓AI既能穩(wěn)定地調(diào)用各種工具，又能高效地跟外部世界打交道。

要聊明白這事兒，咱們得先看看AI Agent這幾年是怎么進(jìn)化的。

其實(shí)業(yè)界效仿隔壁自動(dòng)駕駛的分級(jí)，也給Agent強(qiáng)度排了個(gè)L1、L2、L3……

最簡(jiǎn)單的L1級(jí)別的AI Agent，其實(shí)就是3年前火起來的以ChatGPt為代表的，一堆大模型對(duì)話助手，在這個(gè)程度，你也就只能把它當(dāng)個(gè)聊天機(jī)器人、信息搜索庫，談不上什么生產(chǎn)力。

后來，它學(xué)聰明了點(diǎn)，學(xué)會(huì)了用些小工具，進(jìn)化成了L2 工作流助手。

L2 級(jí)別的工作流 Agent 就像個(gè)聽話的學(xué)徒，你讓它上網(wǎng)查個(gè)資料、算個(gè)數(shù)，它能照著你設(shè)定好的步驟一步步完成。

但說到底，還是得你這個(gè)當(dāng)師傅的先把流程圖畫好，所以也沒啥特別的。

真正讓人興奮的，是進(jìn)化到L3級(jí)別的推理型Agent。

突出的代表就是年初爆火的Manus，這也是讓 Agent 有了自主思考和規(guī)劃的能力。

這家伙已經(jīng)開始像個(gè)獨(dú)當(dāng)一面的員工了，規(guī)劃個(gè)旅游攻略、寫個(gè)PPT、做點(diǎn)論文草稿，分分鐘把活兒安排得明明白白。

但問題來了，就好比人類的職場(chǎng)一樣，專家員工再牛，也干不了一個(gè)團(tuán)隊(duì)的活兒，所以還是得靠人給一堆員工派活。

但這個(gè)過程的難度，壓根不比你自己干來得輕松，可能活還沒派完，你的CPU先被干燒了。

于是大家就想，能不能組個(gè)Agent團(tuán)隊(duì)，讓AI來分配專業(yè)的AI干專業(yè)的事兒？

結(jié)果業(yè)界經(jīng)過了各種各樣嘗試發(fā)現(xiàn)，這幫看起來牛逼得不行的Agent湊一塊兒，根本沒法合作！

因?yàn)槟銊e看，現(xiàn)在單個(gè)Agent執(zhí)行任務(wù)的成功率挺高，但只要組隊(duì)，成功率就斷崖式下滑。

一個(gè)流程里，每一步都有95%的成功率，聽起來已經(jīng)挺好的了吧，但只要跑上20步，整個(gè)任務(wù)的成功率就直接掉到30%了，是不是有你買足彩1串6、1串7那味兒了。

就在大家為這幫散裝英雄一籌莫展的時(shí)候，前兩天，360集團(tuán)正式發(fā)布的納米AI，好像給出了一種新思路。

納米AI，有些差友可能還不大熟悉，人家是紅衣大叔周鴻祎 360 旗下的AI產(chǎn)品，最近升級(jí)成了“多智能體蜂群”，還號(hào)稱是全球唯一真正進(jìn)化到L4級(jí)別智能體。

昨天，紅衣大叔還特地開了場(chǎng)專場(chǎng)發(fā)布會(huì)，給大家好好聊了聊納米AI如今的變化。

差評(píng)君也去聽完了全程，然后還試用了一波，真覺得有點(diǎn)牛了。

我先不說其他的，就給你看一個(gè)納米AI生成的視頻。

差友們可以猜猜這個(gè)視頻咱花了多少精力，寫了多少提示詞，后期調(diào)整了多少。

我來公布最終的答案，花的精力就是上傳了一張火鍋的照片，提示詞不到100個(gè)字，后期完全沒做任何處理，甚至在納米AI生成視頻的過程中，咱們還去找小發(fā)打了一把王者，游戲結(jié)束回來就看到了上面這個(gè)視頻。

看視頻效果的時(shí)候，背后站了一堆編輯部同事，全在怪叫“牛逼牛逼”，發(fā)群里也像是誤入藕花深處，驚起一灘“666”。。。

當(dāng)然了，我們也找了隔壁Manus做了個(gè)類似的視頻。

盡管Manus調(diào)用了目前最頂級(jí)的Veo3視頻生成大模型，但什么情節(jié)、故事都不存在的，純靠著大模型的基礎(chǔ)能力硬撐畫面。

而且，就像昨天直播里周鴻祎反復(fù)提及的“短視頻起號(hào)”，納米AI主打就是“一句話生成大片”。

你還能用更簡(jiǎn)單的方法生成視頻。

比如咱們常在影視劇刷到的介紹某個(gè)歷史人物生平的視頻，在納米AI里，直接就有一個(gè)專門的Agent叫古人傳記導(dǎo)演，你只需要說一句“于謙的一生”，然后就什么都不用管了。

結(jié)果生成的質(zhì)量也還是相當(dāng)高。

說真的，這擱以前，在一些短視頻賬號(hào)起號(hào)階段，制作類似質(zhì)量的視頻，一般是一個(gè)編導(dǎo)配2-3個(gè)剪輯花半天時(shí)間才能做出來，現(xiàn)在靠著納米AI，點(diǎn)幾下鼠標(biāo)十幾分鐘就有了。。。

而且，咱們這個(gè)是最基礎(chǔ)的測(cè)試（其實(shí)是因?yàn)榇蛲跽?，忘記調(diào)整細(xì)節(jié)了），兩個(gè)視頻完完全全都是納米AI一手導(dǎo)演的。

而且實(shí)際執(zhí)行過程中，你完全可以在視頻風(fēng)格、語音音色、最終腳本等等模塊，進(jìn)行調(diào)整修改，來幫助AI生成更好、更符合你需求的視頻。

是不是已經(jīng)覺得納米AI有點(diǎn)東西了？

昨天直播里，他們還表示，納米AI的多智能體蜂群能在一起連續(xù)工作2個(gè)小時(shí)，執(zhí)行超過1000個(gè)步驟，處理9000萬個(gè)Token（相當(dāng)于幾千萬個(gè)漢字）的信息量，中間不出錯(cuò)、不掉鏈子。

這個(gè)水平大伙可能有點(diǎn)暈，我就這么說吧，以 M 記為代表的L3級(jí)別的智能體，處理的token數(shù)一般只能在百萬級(jí)，換算成生成視頻，一般不超過90秒。

所以昨晚老周在直播間也放出話來：“咱們就是目前唯一一個(gè)能做10分鐘視頻的Agent?！?/p>

為什么納米AI能實(shí)現(xiàn)L3到L4的突破呢？

其實(shí)是因?yàn)樗麄?strong>找了條多智能體并行的新路子。

簡(jiǎn)單來說，納米AI有個(gè)超大智能體工廠，里面有5萬個(gè)L3級(jí)別（也就是和M記同一級(jí)別）的Agent來滿足你的各種需求。

如果你覺得這5萬個(gè)都不行，也能自己再做新的L3級(jí)別Agent進(jìn)去。

這么一來，你手底下就有幾萬個(gè)，未來還能越來越多的Agent幫你干活。

在360智能體工廠的基礎(chǔ)，再加上納米獨(dú)創(chuàng)的L4技術(shù)，才有了史上最長的10分鐘AI視頻。

這套L4技術(shù)說白了，就是在納米多智能體蜂群的平臺(tái)里，給這幫平日里單打獨(dú)斗的Agent們，加裝了一套超級(jí)通訊系統(tǒng)和共享的作戰(zhàn)指揮室。

除了有部門經(jīng)理和項(xiàng)目經(jīng)理互相調(diào)度，各個(gè)賽博牛馬之間也不再有溝通障礙，所有智能體都在同一個(gè)頻道里聊天，一個(gè)眼神就知道對(duì)方想干啥，再也不怕傳話傳歪了。

我們拿前面于謙的視頻舉例，我提示詞只輸入了“于謙的一生”。

納米AI能夠自己思考我要的是啥，比如要的是歷史人物于謙，不是德云社的大爺于謙。

然后根據(jù)這個(gè)思路一點(diǎn)點(diǎn)研究于謙的生平，編寫文案標(biāo)題和相應(yīng)的分鏡腳本，接下來，又會(huì)根據(jù)這些分鏡生成相應(yīng)的圖片，再把圖片生成視頻片段，最后再像一個(gè)后期一樣，把這些片段素材全部整合到一起剪輯成成片。

而且，在這個(gè)執(zhí)行過程中，納米AI能夠最多支持100個(gè)工具同時(shí)調(diào)用。

你可別小看這個(gè)數(shù)字，之前Manus爆火的時(shí)候，網(wǎng)上對(duì)它的詬病最多的就是速度實(shí)在太慢，因?yàn)樗鳛長3級(jí)別的Agent，只能一項(xiàng)命令一項(xiàng)命令的執(zhí)行，調(diào)用上一個(gè)工具，完成需求，才能繼續(xù)思考下一步怎么做，想清楚之后再調(diào)用下一個(gè)工具。

但納米AI的多智能體蜂群完全能夠做到邊想邊干，我這邊還在調(diào)用工具進(jìn)行配音，那邊已經(jīng)在想著調(diào)用大模型生成視頻畫面了，這也大大提升了Agent的執(zhí)行速度。

不僅如此，更絕的是，納米AI為了搞定步驟一多，Agent容易出錯(cuò)雪崩的情況，還做了點(diǎn)安全冗余。

周鴻祎在直播時(shí)透露自家產(chǎn)品用了一套比較暴力的解決方式，那就是用token換正確率。

比如生成某段視頻的分鏡圖片時(shí)，單智能體不是容易出錯(cuò)嗎？

但納米AI可以多智能體并行操作，那我每個(gè)畫面都同時(shí)找三四個(gè)畫手一起畫，加一個(gè)把關(guān)的步驟，把生成失敗、出錯(cuò)的剔除出去，保留正確的畫面，這樣就能大大提升成功率了。

當(dāng)然了，盡管有了這些安全冗余，但AI還是會(huì)出錯(cuò)。

咱們?cè)跍y(cè)試時(shí)，也出現(xiàn)了一次任務(wù)報(bào)錯(cuò)，但納米AI人還怪好的，因?yàn)橛行〢gent任務(wù)出錯(cuò)了消耗的token可不退你，而納米AI是全額返還的。

至于一些生成視頻文字上的瑕疵、前后一致性還不是完美之類的問題，偶爾也還是會(huì)出現(xiàn)。

但那句話怎么說的，只要方向?qū)α耍叩迷俾彩窃谝徊讲浇咏康牡?。而類似大模型基礎(chǔ)能力上不足，其實(shí)也是目前業(yè)內(nèi)大伙們提升的方向。

而且，該說不說，咱挺認(rèn)同納米AI現(xiàn)在的這個(gè)思路的。

周鴻祎昨晚也說了，現(xiàn)在制作短視頻其實(shí)是人人的剛需，你做什么賬號(hào)能不做短視頻，甚至發(fā)朋友圈也要vlog吧。

買書買課不如學(xué)會(huì)用AI

那讓AI最快成為人人都愛用的、能改變大家生活的方式，不就是在解決大家的實(shí)際需求嗎？

強(qiáng)如大模型也得做一個(gè)ChatGPT的載體，才能在全球爆火，而Agent界的ChatGPT遲遲沒出現(xiàn)，這也是為啥業(yè)界和用戶之間有種割裂感。

啥公司都在說我們有Agent，多牛多牛，但我一個(gè)普通老百姓，感覺根本用不到啊。

而且，納米AI的一句話生成視頻，只是他們選擇的主攻點(diǎn)，實(shí)際上，你可以在L4級(jí)別多智能體蜂群里，根據(jù)自己的需求從0搭建專屬自己的AI團(tuán)隊(duì)。

喜歡吃瓜的，可以做一個(gè)每天娛樂大新聞總結(jié)Agent；喜歡體育的，可以做一個(gè)專屬自己的體育報(bào)道AI天團(tuán)。。。

昨天周鴻祎一直在強(qiáng)調(diào)，目前的大模型能力已經(jīng)相當(dāng)強(qiáng)悍，但出于各種原因，它真正的能力并沒有完全展現(xiàn)。

在他看來，Agent就是目前能夠最大限度挖掘大模型能力的橋梁，而通過多智能體共同參與，就能很好地處理現(xiàn)階段的一些人類需求，真正讓人覺得AI牛逼。

說到底，AI的未來，可能不取決于技術(shù)參數(shù)有多高、模型有多大，而在于它能不能像納米AI這樣，少談點(diǎn)玄乎的概念，多做個(gè)好視頻、寫個(gè)好方案，可能更有用。

當(dāng)AI不再是一個(gè)遙不可及的神，而是我們隨時(shí)可以拉來組隊(duì)干活、不知疲倦的賽博牛馬時(shí)，AI的下半場(chǎng)，才算真正開場(chǎng)了。

撰文：八戒

編輯：江江 & 面線

美編：萱萱

圖片、資料來源：

納米AI

即夢(mèng)

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.