5月13日,在 FORCE LINK AI 創(chuàng)新巡展·上海站,火山引擎發(fā)布豆包·視頻生成模型 Seedance 1.0 lite、豆包1.5·視覺(jué)深度思考模型,并升級(jí)豆包·音樂(lè)模型,以更全面的模型矩陣、更豐富的智能體工具,幫助企業(yè)打通從業(yè)務(wù)到智能體的應(yīng)用鏈路。
豆包·視頻生成模型Seedance 1.0 lite:效果好、生成快、更便宜
此次全新發(fā)布的豆包視頻生成模型Seedance 1.0 lite,支持文生視頻、圖生視頻,視頻生成時(shí)長(zhǎng)支持5s、10s,分辨率提供480P、720P。企業(yè)用戶(hù)可在火山方舟平臺(tái)使用該模型API,個(gè)人用戶(hù)也可在豆包APP、即夢(mèng)體驗(yàn)。
作為豆包視頻生成模型系列的小參數(shù)量版本,Seedance 1.0 lite模型實(shí)現(xiàn)了兩大突破:影視級(jí)的視頻生成質(zhì)量、視頻生成速度大幅提升,兼顧效果、速度、性?xún)r(jià)比。
· 更精準(zhǔn)的指令遵循:通過(guò)強(qiáng)大的語(yǔ)義理解,可精細(xì)控制人物外貌氣質(zhì)、衣著風(fēng)格、表情動(dòng)作等,并在多主體動(dòng)作解析、嵌入式文本響應(yīng)、程度副詞和鏡頭切換響應(yīng)方面具有優(yōu)勢(shì)。
· 更豐富的影視級(jí)運(yùn)鏡:支持360度環(huán)繞、航拍、變焦、平移、跟隨、手持等多種鏡頭語(yǔ)言,具備細(xì)膩高清的基礎(chǔ)畫(huà)質(zhì)和影視級(jí)美感。
· 更合理的運(yùn)動(dòng)交互:分析動(dòng)作時(shí)序與空間關(guān)系,提升人物、物體間自然流暢的交互動(dòng)作,運(yùn)動(dòng)軌跡、受力反饋更加契合現(xiàn)實(shí)規(guī)律。
Seedance 1.0 lite模型可廣泛應(yīng)用于電商廣告、娛樂(lè)特效、影視創(chuàng)作、動(dòng)態(tài)壁紙等場(chǎng)景。例如在電商領(lǐng)域,可幫助商家快速生成高質(zhì)量的營(yíng)銷(xiāo)視頻素材,精準(zhǔn)匹配產(chǎn)品展示、活動(dòng)推廣等場(chǎng)景,降低制作成本與周期。
豆包1.5·視覺(jué)深度思考模型,在60項(xiàng)公開(kāi)評(píng)測(cè)中取得38項(xiàng)第一
新發(fā)布的豆包1.5·視覺(jué)深度思考模型(Doubao-1.5-thinking-vision-pro),激活參數(shù)僅20B,但具備強(qiáng)大的多模態(tài)理解和推理能力,在60個(gè)公開(kāi)評(píng)測(cè)基準(zhǔn)中,有38個(gè)取得 SOTA 表現(xiàn),在視頻理解、視覺(jué)推理、GUI Agent能力等方面均處于第一梯隊(duì)。目前,該模型已在火山方舟上線(xiàn)。
在視頻理解方面,支持動(dòng)態(tài)幀率采樣,視頻時(shí)序定位能力顯著增強(qiáng),結(jié)合向量搜索,可精準(zhǔn)定位視頻中與文本描述相對(duì)應(yīng)的片段。
同時(shí),新增視頻深度思考能力。模型學(xué)習(xí)了數(shù)萬(wàn)億多模態(tài)標(biāo)記數(shù)據(jù),掌握廣泛視覺(jué)知識(shí),結(jié)合強(qiáng)化學(xué)習(xí),使視覺(jué)推理能力大幅提升。例如,在復(fù)雜的圖形推理題中,模型提出假設(shè),進(jìn)行推理檢驗(yàn),當(dāng)發(fā)現(xiàn)和假設(shè)不一樣時(shí),還能進(jìn)行不斷反思,提出新的猜測(cè),直到得出正確答案。
此外,該模型新增GUI Agent能力?;趶?qiáng)大的GUI定位性能,可在PC端、手機(jī)端等不同環(huán)境中完成復(fù)雜交互任務(wù)。例如,可對(duì)新開(kāi)發(fā)的APP功能進(jìn)行自動(dòng)化檢測(cè),目前該功能已經(jīng)應(yīng)用于字節(jié)跳動(dòng)多款A(yù)PP產(chǎn)品的開(kāi)發(fā)測(cè)試中。
去年火山引擎推出了豆包·音樂(lè)模型,用戶(hù)僅通過(guò)一張圖、一句話(huà)就可以創(chuàng)作10多種不同風(fēng)格的高品質(zhì)音樂(lè)。此次大會(huì)上,豆包·音樂(lè)模型升級(jí),不僅支持英文歌曲創(chuàng)作,還可以通過(guò)理解視頻,自動(dòng)適配純音樂(lè)BGM。目前豆包·音樂(lè)模型已全量上線(xiàn),個(gè)人和企業(yè)用戶(hù)可在海綿音樂(lè)、火山引擎官網(wǎng)體驗(yàn)。
Data Agent及新版Trae亮相上海巡展
Data Agent是火山引擎推出的企業(yè)數(shù)據(jù)全場(chǎng)景智能體,具備主動(dòng)思考、洞察、分析、行動(dòng)能力,可以幫助企業(yè)挖掘數(shù)據(jù)資產(chǎn)價(jià)值,功能覆蓋數(shù)據(jù)分析、智能營(yíng)銷(xiāo)等關(guān)鍵領(lǐng)域。
在數(shù)據(jù)分析上,Data Agent能融合企業(yè)內(nèi)結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),結(jié)合聯(lián)網(wǎng)知識(shí),精準(zhǔn)理解業(yè)務(wù)需求,快速生成專(zhuān)業(yè)深度研究報(bào)告。通過(guò)自動(dòng)化制定分析方案、追溯指標(biāo)波動(dòng)、運(yùn)用自助分析工具及搭建預(yù)警系統(tǒng),實(shí)現(xiàn)數(shù)據(jù)處理全流程智能化,將復(fù)雜報(bào)表生成的時(shí)間從 2 天縮短至 30 分鐘,顯著提升數(shù)據(jù)獲取與決策效率。
在智能營(yíng)銷(xiāo)領(lǐng)域,Data Agent 實(shí)現(xiàn)從策略制定到執(zhí)行優(yōu)化的全鏈路閉環(huán)管理,高效完成人群圈選與策略拆解,基于個(gè)性化引擎實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo)。此外,其智能會(huì)話(huà)輔助與自動(dòng)復(fù)盤(pán)優(yōu)化功能,可不斷提升轉(zhuǎn)化率與客戶(hù)滿(mǎn)意度,動(dòng)態(tài)迭代營(yíng)銷(xiāo)策略。
此外,為幫助開(kāi)發(fā)者更便捷地利用AI提升開(kāi)發(fā)效率,國(guó)內(nèi)首款 AI 原生 IDE 產(chǎn)品Trae也帶來(lái)多個(gè)重點(diǎn)功能升級(jí),例如統(tǒng)一的AI對(duì)話(huà)面板(所有交互僅需一個(gè)對(duì)話(huà)框)、支持自定義 @Agent(構(gòu)建你的專(zhuān)屬 AI 團(tuán)隊(duì))、新增聯(lián)網(wǎng)搜索 #Web 和文檔 #Doc 的上下文理解類(lèi)型(AI 執(zhí)行需求更準(zhǔn)確高效)、通過(guò)MCP讓AI主動(dòng)調(diào)用外部工具等。
目前,Trae已配置豆包1.5·深度思考模型(Doubao-1.5-thinking-pro),基于模型主動(dòng)深度思考和20毫秒極低延遲,讓代碼生成的質(zhì)量更好、效率更高。
豆包大模型產(chǎn)業(yè)落地加速,為行業(yè)智能化提效
目前,豆包大模型已在汽車(chē)、智能終端、互聯(lián)網(wǎng)、金融、教育科研、零售消費(fèi)等行業(yè)廣泛落地,覆蓋4億終端設(shè)備、八成主流車(chē)企、70%系統(tǒng)重要性銀行和數(shù)十家證券基金公司、近七成的 C9頂級(jí)高校和100多家科研院所。
在游戲行業(yè),巨人網(wǎng)絡(luò)正在借助大模型能力重塑游戲體驗(yàn)和玩法創(chuàng)新。通過(guò)火山方舟接入豆包大模型及 DeepSeek,巨人網(wǎng)絡(luò)已在旗下《太空殺》中推出Al原生游戲玩法“內(nèi)鬼挑戰(zhàn)”,基于大模型深度思考等能力打造Al玩家,與真實(shí)玩家進(jìn)行實(shí)時(shí)策略對(duì)抗,重新定義了社交推理游戲的智能邊界。
同時(shí),《原始征途》也接入大模型能力打造AI 智能NPC“小師妹”,在游戲策略指導(dǎo)、情感陪伴等方面提供更智能、更人性化的交互體驗(yàn),顯著提升了玩家粘性。
此外,借助火山引擎機(jī)器學(xué)習(xí)平臺(tái)所提供的大模型訓(xùn)練及資源保障,巨人網(wǎng)絡(luò)亦推進(jìn)了自研大模型的迭代優(yōu)化。
在醫(yī)療行業(yè),禮來(lái)制藥搭建了專(zhuān)屬 AI 應(yīng)用開(kāi)發(fā)平臺(tái),支撐從藥物研發(fā)到疾病診療的全場(chǎng)景創(chuàng)新。通過(guò)可視化工作流編排,禮來(lái)制藥搭建了HCP Chatbot, 地區(qū)經(jīng)理輔導(dǎo)報(bào)告等智能體,在學(xué)術(shù)溝通、銷(xiāo)售培訓(xùn)、疾病教育等多個(gè)場(chǎng)景中形成應(yīng)用,實(shí)現(xiàn)了企業(yè) AI 資產(chǎn)的沉淀與持續(xù)化運(yùn)營(yíng)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.