大家好我是歸藏(guizang),今天教大家制作現(xiàn)在最火的 AI 視頻品類(lèi)。
無(wú)論你是否關(guān)注 AI 最近肯定在不同的社交媒體上刷到了這類(lèi)視頻。
一個(gè)大猩猩或者其他動(dòng)物對(duì)著鏡頭絮叨,要不就是各種虛構(gòu)的歷史事件的采訪。
每一個(gè)點(diǎn)贊和播放都很高不管是在國(guó)內(nèi)還是海外。
雖然很無(wú)聊但是刷到就看的停不下來(lái),即使是我這種經(jīng)常接觸 AI 內(nèi)容的人都是如此。
這種品類(lèi)甚至都滲透到了廣告和營(yíng)銷(xiāo)的領(lǐng)域。
ins 上有個(gè)牙醫(yī)診所每天都發(fā)廣告,每個(gè)播放都只有幾千,但是換成“大腳男孩”之后他的廣告播放高達(dá) 56 萬(wàn)次!
有了 Veo3 之后 AI 視頻的制作成本下降了非常多。
現(xiàn)在可能是你入門(mén) AI 視頻制作非常好的機(jī)會(huì),只需要兩次生成簡(jiǎn)單的合并兩段視頻,你的作品就已經(jīng)完成了。
你可能以為上面這些視頻的點(diǎn)子都是創(chuàng)作者自己想的,但我要告訴你,其實(shí)不是。
上面大部分爆火的 AI 視頻幾乎從構(gòu)思到提示詞到生成全是 AI 為主,人類(lèi)需要做的事情只有挑選點(diǎn)子,生成和復(fù)制提示詞而已。
所以這篇內(nèi)容我不只會(huì)教你如何用視頻模型,我還會(huì)教你用各種工具分析視頻從而生成新的創(chuàng)意,給你提示詞模板,讓你從創(chuàng)意到生成全部自動(dòng)化。
我這個(gè)流程其實(shí)接近工程化了,你甚至可以用來(lái)做視頻 Agent 產(chǎn)品,先要個(gè)贊不過(guò)分吧。
先來(lái)看兩個(gè)我用這流程做的這類(lèi) AI 視頻,首先是荒誕采訪形式的海盜財(cái)報(bào)會(huì)議。
之后是一個(gè)給巨龍看守地牢的倒霉哥布林牛馬的一天。
是不是很牛批!好了,從現(xiàn)在開(kāi)始扔掉你的腦子,開(kāi)搞?。?!
如何分析爆款視頻
首先我們要教的是如何分析視頻和拓展創(chuàng)意,這里我用的 NotebookLM。
你是不是只用 NotebookLM 來(lái)分析有口播的 youtube 視頻,但我要告訴你,Gemini 其實(shí)是能分析視頻畫(huà)面的,所以你可以讓 Noteboolm 幫你分析任何 Youtube 爆款視頻的創(chuàng)作形式。
你甚至可以往里面加入多個(gè)爆款視頻一起交叉分析。
你需要做的第一步是打開(kāi)頁(yè)面,新建一個(gè) NotebookLM 筆記本,在添加來(lái)源這里輸入你找到的 youtube 爆款視頻地址。
你可以在來(lái)源這里繼續(xù)添加,我最后一次性添加了找到的四個(gè) Veo3 做的爆款 AI 視頻,兩個(gè)是第一人稱(chēng)Vlog 形式的,兩個(gè)是采訪形式的。
然后就可以寫(xiě)提示詞讓 NotebookLM 開(kāi)始分析了,這里我放上我的提示詞改一下前面的部分可以套用到任何創(chuàng)意視頻上。
這四個(gè)視頻都是用谷歌新發(fā)布的 Veo 3 視頻模型生成編排的,在 Youtube 非?;鸨?,詳細(xì)分析每個(gè)視頻的每一個(gè)分鏡的臺(tái)詞和畫(huà)面內(nèi)容,然后總結(jié)爆火的原因。
可以看到 NotebookLM 分析的非常詳細(xì)。
每個(gè)視頻的分鏡畫(huà)面以及臺(tái)詞內(nèi)容都輸出了,同時(shí)對(duì)于這類(lèi)視頻爆火的原因分析的也非常好。
我看完對(duì)這些視頻爆火的原因是有些感覺(jué)到,但是完全做不到 NotebookLM 分析的這么細(xì)致和完整。
Veo3 偽紀(jì)實(shí)爆款視頻的萬(wàn)能公式:四大核心要素
核心引擎:巨大的“反差感” (Contrast Engine)
這是所有笑點(diǎn)的根本來(lái)源。視頻的成功在于將兩個(gè)完全不搭界的元素進(jìn)行強(qiáng)行碰撞,從而產(chǎn)生荒誕的喜劇效果。
- 時(shí)代反差: 用最現(xiàn)代的形式(Vlog、街頭采訪)去呈現(xiàn)古老或虛構(gòu)的內(nèi)容(泰坦尼克號(hào)、維京人、大腳怪、暴風(fēng)兵)。
- 身份反差: 讓本應(yīng)神秘、嚴(yán)肅或邪惡的角色(大腳怪、維京人、暴風(fēng)兵)表現(xiàn)出普通人(甚至“屌絲”)的一面,充滿(mǎn)生活氣息和人性弱點(diǎn)。
- 情境反差: 在極度危險(xiǎn)或宏大的背景下,角色們關(guān)心的卻是微不足道的日?,嵤?。例如,在即將撞上冰山時(shí),乘客關(guān)心的是明早的吐司;在炮火連天的戰(zhàn)場(chǎng)上,暴風(fēng)兵在堆雪人。
視頻都采用了模擬真實(shí)記錄的拍攝手法,讓觀眾產(chǎn)生“這好像是真的”的錯(cuò)覺(jué),從而使反差感更加強(qiáng)烈。
- 偽采訪 (Pseudo-Interview): 如《泰坦尼克號(hào)》和《維京人》,采用一本正經(jīng)的新聞采訪形式,讓荒謬的回答顯得更加滑稽。
- 第一人稱(chēng)Vlog (First-Person Vlog): 如《大腳男孩》和《暴風(fēng)兵》,使用自拍桿和主觀鏡頭,極大地增強(qiáng)了代入感,仿佛在看這些角色的“朋友圈”視頻。
這些視頻從不憑空創(chuàng)造世界觀,而是巧妙地站在“巨人”的肩膀上,利用了觀眾已有的知識(shí)儲(chǔ)備和刻板印象。
- 歷史事件: 觀眾都知道泰坦尼克號(hào)會(huì)沉、維京人好戰(zhàn)。
- 流行文化/IP: 觀眾都認(rèn)識(shí)《星球大戰(zhàn)》的暴風(fēng)兵和維達(dá)。
- 文化迷因: 觀眾都了解“大腳怪”的傳說(shuō)或特定人群的刻板印象(如開(kāi)斯巴魯?shù)膽?hù)外愛(ài)好者)。 這極大地降低了觀眾的理解成本,笑點(diǎn)無(wú)需鋪墊,一點(diǎn)就通。
視頻最“扎心”也最搞笑的部分,是把所有宏大的敘事都拉回到普通人的抱怨和吐槽上。
- “打工人”的嘴替: 暴風(fēng)兵把維達(dá)叫做“混蛋老板”,抱怨工作環(huán)境差、任務(wù)危險(xiǎn)、同事不靠譜。這讓所有上班族都感同身受。
- 日常的煩惱: 泰坦尼克號(hào)的電梯工抱怨工作繁瑣,維京女人抱怨總在洗血衣服。這些充滿(mǎn)生活氣息的細(xì)節(jié)讓角色瞬間變得鮮活,也讓觀眾產(chǎn)生了強(qiáng)烈的共鳴。
如何拓展視頻創(chuàng)意
我們上面已經(jīng)有了這類(lèi)爆款視頻的創(chuàng)作邏輯和分鏡描述了,接下來(lái)我們需要讓 AI 根據(jù)這些上下文幫我們拓展創(chuàng)意。
你可以打開(kāi)任何一個(gè)你用的慣的 AI 模型,我這里用的還是 Gemini。
將剛才 Notebooklm 分析的結(jié)果發(fā)給他,然后跟他說(shuō):
我會(huì)發(fā)給你幾個(gè)最近非常火爆的用 AI 視頻模型生成的視頻內(nèi)容和爆火的原因,你需要結(jié)合這些內(nèi)容給我一些類(lèi)似第一人稱(chēng) Vlog 形式的點(diǎn)子,詳細(xì)描寫(xiě)每個(gè)分鏡(8 秒)對(duì)應(yīng)的環(huán)境和角色以及說(shuō)話內(nèi)容和語(yǔ)氣,適當(dāng)插入打破第四面墻的說(shuō)話方式,比如要贊。
這里我們首先做的是第一人稱(chēng) Vlog 形式的視頻。
這里的文案可能和內(nèi)容可能我們生成提示詞到時(shí)候并不會(huì)用,但是依然要讓他輸出是因?yàn)樾枰迷敿?xì)的分鏡內(nèi)容和口播文案來(lái)判斷創(chuàng)意的質(zhì)量,不能只依賴(lài)標(biāo)題和簡(jiǎn)單的描述。
之后你就可以根據(jù)他輸出的點(diǎn)子內(nèi)容進(jìn)行挑選,首選比較好實(shí)現(xiàn)和偏現(xiàn)實(shí)題材的,這樣生成的效果比較好。
這里我選了哥布林牛馬這個(gè),感覺(jué)反差感很強(qiáng),在《龍與地下城》這種宏大視覺(jué)觀的小角色視角。
在虛構(gòu)采訪這里我選用了海盜年會(huì)和金融行業(yè)黑話這個(gè)點(diǎn)子,反差感也很足,也會(huì)讓打工人很有共鳴。
提示詞生成
如果你對(duì)某個(gè)分鏡感覺(jué)有需要修改的部分可以讓他重新修改,直到內(nèi)容你就的沒(méi)問(wèn)題。
這里我偷懶了,沒(méi)有改直接進(jìn)入了下一步,開(kāi)始生成提示詞。
這部分就比較簡(jiǎn)單了,我會(huì)給你第一人稱(chēng) Vlog 和采訪兩個(gè)方案的提示詞模板。
讓 AI 基于剛才討論的結(jié)果和提示詞模板輸出每個(gè)分鏡的提示詞就行。
第一人稱(chēng) Vlog 風(fēng)格視頻提示詞生成:
【地老哥布林清潔工】,這個(gè)點(diǎn)子很好,將每個(gè)分鏡的所有提示描述內(nèi)容都放在一段話中,包括音頻相關(guān)內(nèi)容,每個(gè)分鏡 8 秒,注意臺(tái)詞長(zhǎng)度,不要超時(shí)。
參考這個(gè)模板生成提示詞:A cinematic, handheld selfie-style shot of [a detailed character description, e.g., a sci-fi explorer in a sleek silver spacesuit]. They hold the camera at arm's length, and their [specific arm/hand description, e.g., armored silver gauntlet] is clearly visible in the frame as they show a [specific emotional expression, e.g., look of pure awe]. The scene is a [detailed location and time of day, e.g., bioluminescent alien jungle at twilight], and behind them, [describe the key background element, e.g., massive, pulsating mushroom-like trees] cast a [specific lighting quality, e.g., vibrant purple and blue light] across the landscape. The character looks directly into the camera and speaks in a [specific tone of voice, e.g., breathless, excited whisper]: "[Your Dialogue Here]". (Optional: For extra control, add specs like Lens: wide-angle with shallow focus or describe a camera pan).
虛構(gòu)采訪類(lèi)型提示詞生成
【海盜會(huì)議】,這個(gè)點(diǎn)子很好,將每個(gè)分鏡的所有提示描述內(nèi)容都放在一段話中,包括音頻相關(guān)內(nèi)容,每個(gè)分鏡 8 秒,注意臺(tái)詞長(zhǎng)度,不要超時(shí)。
參考這個(gè)模板生成提示詞:A cinematic, medium handheld interview shot featuring [a detailed character description, e.g., a fearsome pirate captain in a captain's coat with a Bluetooth earpiece]. They display a [specific emotional expression, e.g., look of confident authority] as they speak. The scene is set in [detailed location, e.g., a secluded alcove of a massive, torch-lit sea cave], with [key background elements, e.g., other pirates mingling near a makeshift bar] visible in the slightly out-of-focus background. The atmosphere is thick with [describe environmental sounds, e.g., the murmur of distant conversations and the clinking of tankards]. Flickering [specific lighting quality, e.g., torchlight] illuminates the character, casting dynamic shadows. Crucially, the character looks slightly off-camera, addressing an unseen interviewer. They speak in a [specific tone of voice, e.g., a fast-talking, confident finance-bro voice]: "[Your Dialogue Here]". (Optional: For extra control, specify lens details like 'shot on a 50mm lens with a shallow depth of field' or describe camera movement like 'a slow push-in during the dialogue').
到這一步,基本上我們的前期準(zhǔn)備工作就結(jié)束了。
因?yàn)?Veo3 強(qiáng)大的提示詞遵循和穩(wěn)定性以及音頻生成能力,我們可以直接跳過(guò)圖生視頻的圖片生成、語(yǔ)音生成、唇形同步、音效匹配這幾步。
如果以前要做類(lèi)似的視頻你可以想象要多麻煩,上面跳過(guò)的每一步都有可能出問(wèn)題導(dǎo)致增加好幾倍的工作量。
生成視頻
接下來(lái)我們就可以生成視頻了,如果你想簡(jiǎn)單點(diǎn)搞定,我推薦你開(kāi)個(gè) Gemini Pro 會(huì)員,在 Gemini 里面生成。
直接進(jìn)入到 Gemini APP 里面,選中輸入框下面的視頻按鈕,輸入提示詞然后回車(chē)就行。
如果你不怕麻煩的話可以用 FLOW (labs.google/fx/zh/tools/flow/)這個(gè)谷歌專(zhuān)門(mén)用來(lái)視頻生成的產(chǎn)品。
詳細(xì)的教程我之前寫(xiě)過(guò)《》,這里就寫(xiě)一下簡(jiǎn)單的。
進(jìn)來(lái)以后先創(chuàng)建項(xiàng)目,然后在輸入框設(shè)置這里把模型調(diào)整到 Veo3 Fast 模型,這個(gè)很便宜。
不要再因?yàn)闆](méi)切換模型,跑來(lái)問(wèn)我為啥視頻沒(méi)聲音了!
如果你追求質(zhì)量可以用Quality 模型,但很貴。然后輸入提示詞等待生成就行。
如果這里下載的時(shí)候可以選擇將生成的結(jié)果超分成 1080P,視頻會(huì)清晰一些。
到這里我們基本上全部都 OK 了。
視頻合并及后處理
最后就是把視頻合起來(lái)了,由于 Veo3 生成的視頻基本就是完整的,你只需要用剪映或者其他工具把多端視頻拼接然后導(dǎo)出就行,這應(yīng)該都會(huì)做吧。
如果是英文的話可以點(diǎn)上面的字幕讓剪映幫你自動(dòng)生成一個(gè)字幕。
如果你還需要增加一些沉浸感的話可以加一些裝飾,比如像我這個(gè)海盜年會(huì)一樣加了一些類(lèi)似電視臺(tái)新聞直播都有的臺(tái)標(biāo)和文字滾動(dòng)新聞。
在一個(gè)月前我 Veo 3 的測(cè)評(píng)文章里面就說(shuō)過(guò),“每一次Agent的模型化即使每個(gè)部分的模型本身質(zhì)量沒(méi)有升級(jí)也會(huì)帶來(lái)非常多的應(yīng)用場(chǎng)景和新的產(chǎn)品機(jī)會(huì)”。
現(xiàn)在回看我這個(gè)預(yù)言是不是算成真了,最近幾乎每天都有基于 Veo3 制作的視頻爆款產(chǎn)生,而且不斷向不同的視頻品類(lèi)擴(kuò)散。
AI 視頻制作過(guò)程每少一步對(duì)于創(chuàng)作者基本盤(pán)的拓展就不止 10 倍這么簡(jiǎn)單,很多人有很好的點(diǎn)子和流量嗅覺(jué)只是因?yàn)榧夹g(shù)和對(duì) AI 的了解不夠,所以沒(méi)辦法生產(chǎn)內(nèi)容。
Veo3 生產(chǎn)成本已經(jīng)很低了,如果出現(xiàn)視頻類(lèi) Agent 把視頻字幕之類(lèi)的包裝工作搞定,AI 視頻生產(chǎn)者又何止百倍。
我們今年或許就能看到這一天的到來(lái)。
好了,到這里教程基本就結(jié)束了,謝謝各位的雙擊和大大的贊,孩子餓壞了,給點(diǎn)吧。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.