作為全球開(kāi)源創(chuàng)新的重要舞臺(tái),GOSIM 全球開(kāi)源創(chuàng)新匯主辦、CSDN 承辦的 GOSIM HANGZHOU 2025 將于 2025 年 9 月 13-14 日在杭州盛大開(kāi)啟。大會(huì)聚焦前沿技術(shù)趨勢(shì),設(shè)置2 場(chǎng) Keynote 演講,兩大高端論壇(GOSIM AI Vision Forum 與 Open for SDG),5 大主題論壇(AI 模型與基礎(chǔ)設(shè)施、具身智能、智能體網(wǎng)絡(luò)、應(yīng)用與智能體、下一代 AI)、9 場(chǎng) Workshop與3 場(chǎng) Hackathon創(chuàng)新競(jìng)賽,并特別聯(lián)動(dòng)RustGlobal + RustChinaConf和GOSIM AI for Humanity Spotlight兩大重磅活動(dòng)。
大會(huì)購(gòu)票通道已開(kāi)啟!立即掃碼或打開(kāi)鏈接搶購(gòu):
https://hangzhou2025.gosim.org/tickets/
最新嘉賓陣容重磅亮相!
Open for SDG conference
Matt White PyTorch 基金會(huì)執(zhí)行董事,Linux 基金會(huì) AI 總經(jīng)理
Matt White 是 PyTorch 基金會(huì)執(zhí)行董事、Linux 基金會(huì) AI 總經(jīng)理,同時(shí)擔(dān)任 LF AI & Data 基金會(huì)下的生成式 AI 共享體主任。他擁有近 30 年在人工智能研究、標(biāo)準(zhǔn)制定與跨行業(yè)(電信、媒體、游戲)應(yīng)用方面的經(jīng)驗(yàn),自 2012 年以來(lái)專(zhuān)注于機(jī)器學(xué)習(xí)、仿真模擬與多感官學(xué)習(xí)。他曾共同創(chuàng)辦 Open Metaverse Foundation,現(xiàn)任 Metaverse Standards Forum 主席,同時(shí)組織硅谷生成式 AI 論文閱讀組和 GenAI Collective。
演講議題:如何在開(kāi)源 AI 中取得成功
本次演講將深入探討如何應(yīng)對(duì)開(kāi)源 AI 的復(fù)雜性,包括:采用 AI 專(zhuān)屬許可協(xié)議如 OpenMDW、建設(shè)強(qiáng)大社區(qū)、推動(dòng)廠商中立,以及采用 Model Context Protocol 和 Agent to Agent Protocol 等開(kāi)放標(biāo)準(zhǔn),降低集成壁壘,實(shí)現(xiàn)智能體協(xié)同。
Joaquin Salvachua馬德里理工大學(xué)教授
Joaquín Salvachúa 是馬德里理工大學(xué)的教授,任教于電信學(xué)院的電信系統(tǒng)工程系。他是 Gaia-X 西班牙樞紐、FIWARE 和 BDVA 董事會(huì)成員,同時(shí)也是 Gaia-X AISBL 的積極貢獻(xiàn)者。他長(zhǎng)期參與機(jī)器學(xué)習(xí)運(yùn)維、大數(shù)據(jù)架構(gòu)、云計(jì)算、下一代互聯(lián)網(wǎng)技術(shù)、網(wǎng)絡(luò)科學(xué)以及形式化方法等領(lǐng)域的研究,并發(fā)表了大量學(xué)術(shù)論文
演講議題:一種數(shù)據(jù)空間定義語(yǔ)言(DSDL),用于實(shí)現(xiàn)數(shù)據(jù)空間之間的互操作性,并支持與自主智能體 AI 生態(tài)系統(tǒng)的集成
數(shù)據(jù)空間范式有望在數(shù)據(jù)經(jīng)濟(jì)參與方之間建立信任,但由于各類(lèi)實(shí)現(xiàn)方案的碎片化,實(shí)際推進(jìn)過(guò)程中面臨諸多挑戰(zhàn)。此外,從零開(kāi)始構(gòu)建數(shù)據(jù)空間本身也是一項(xiàng)復(fù)雜的任務(wù)。本次演講將提出一種基于 PDDL 2.1 的數(shù)據(jù)空間定義語(yǔ)言,可用于定義每個(gè)數(shù)據(jù)空間中的工作流,并建立不同實(shí)現(xiàn)之間的互操作性模式。我們還開(kāi)發(fā)了一個(gè)名為 Eunomia Agent 的數(shù)據(jù)空間代理,該代理能夠理解并生成這種定義語(yǔ)言,并通過(guò)數(shù)據(jù)空間協(xié)議的雙棧結(jié)構(gòu),實(shí)現(xiàn)與多種實(shí)現(xiàn)方式的互操作性。該代理提供了多通道協(xié)議的實(shí)現(xiàn),使其能夠幾乎透明地與智能體 AI 進(jìn)行交互,同時(shí)也支持基本的 A2A 協(xié)議。此外,這種語(yǔ)言還可用于定義數(shù)據(jù)服務(wù)(并生成具體實(shí)現(xiàn)),使其能夠與 AI 智能體進(jìn)行交互,成為其工作流中的組成部分。
AI Vision Forum
朱小虎 安全通用人工智能中心創(chuàng)始人
朱小虎是一名安全通用人工智能研究員。
演講議題:開(kāi)放安全的超級(jí)智能:將強(qiáng)大能力與集體安全對(duì)齊
超級(jí)智能 AI 系統(tǒng)的研發(fā)——即在多個(gè)認(rèn)知領(lǐng)域全面超越人類(lèi)能力的實(shí)體——已經(jīng)不再是遙遠(yuǎn)的理論可能性,而是迅速逼近的技術(shù)前沿。隨著我們加速邁向這一門(mén)檻,核心問(wèn)題已不再是“我們是否會(huì)構(gòu)建超級(jí)智能”,而是“我們將如何確保它的安全性、對(duì)齊性以及可被監(jiān)督性”。
本次演講將介紹“開(kāi)放安全超級(jí)智能”(簡(jiǎn)稱(chēng) OSSI)框架——這是一種旨在確保人類(lèi)有史以來(lái)最強(qiáng)大系統(tǒng)服務(wù)于人類(lèi)長(zhǎng)期利益的研究與治理范式。我們?cè)诖撕粲蹩蒲信c政策界匯聚于一個(gè)共同愿景:實(shí)現(xiàn)安全、可解釋、并通過(guò)開(kāi)放與集體遠(yuǎn)見(jiàn)進(jìn)行治理的超級(jí)智能。OSSI 并非烏托邦式的理想,而是一個(gè)務(wù)實(shí)的、安全導(dǎo)向的藍(lán)圖,為的是構(gòu)建一個(gè)我們能夠生存并蓬勃發(fā)展的未來(lái)。
Salim Nahle 法國(guó) EFREI 電子與計(jì)算機(jī)信息學(xué)院“數(shù)據(jù)與人工智能”項(xiàng)目經(jīng)理兼高管教育學(xué)術(shù)主管
Salim Nahle 博士現(xiàn)任巴黎 Efrei 工程師學(xué)院的“數(shù)據(jù)與人工智能”項(xiàng)目經(jīng)理兼高管教育學(xué)術(shù)主管。他于 2005 年獲得黎巴嫩大學(xué)電信與計(jì)算機(jī)工程學(xué)位,2006 年在巴黎第六大學(xué)獲得計(jì)算機(jī)科學(xué)碩士學(xué)位,2009 年在索邦大學(xué)獲得計(jì)算機(jī)科學(xué)博士學(xué)位。其博士研究聚焦于基于 Wi-Fi 和 WiMAX 技術(shù)的無(wú)線(xiàn)網(wǎng)狀網(wǎng)絡(luò),涵蓋調(diào)度、路由及服務(wù)質(zhì)量(QoS)等關(guān)鍵問(wèn)題。2011 至 2014 年期間,他在 GE Healthcare 擔(dān)任軟件工程師,參與 “CT Revolution” 項(xiàng)目。2014 年至 2019 年,他擔(dān)任 ECE 工程師學(xué)院網(wǎng)絡(luò)安全與大數(shù)據(jù)系主任,期間創(chuàng)設(shè)了“大數(shù)據(jù)與分析”和“防御性網(wǎng)絡(luò)安全”兩個(gè)專(zhuān)業(yè)方向。如今,作為 Efrei 的項(xiàng)目負(fù)責(zé)人,他領(lǐng)導(dǎo)人工智能、數(shù)據(jù)與云計(jì)算領(lǐng)域的學(xué)術(shù)創(chuàng)新工作,同時(shí)為合作企業(yè)設(shè)計(jì)并實(shí)施持續(xù)教育與高管教育項(xiàng)目。
演講議題:教育中的生成式人工智能:開(kāi)源解決方案與挑戰(zhàn)
本次演講將探討生成式人工智能在教育領(lǐng)域中的作用,重點(diǎn)關(guān)注開(kāi)源解決方案。內(nèi)容涵蓋部署 AI 工具時(shí)需考慮的關(guān)鍵因素,包括成本、基礎(chǔ)設(shè)施以及部署過(guò)程中的挑戰(zhàn)。演講還將介紹 RAG 和基于智能體的系統(tǒng),并結(jié)合實(shí)際案例,深入剖析在開(kāi)放教育環(huán)境中所面臨的具體問(wèn)題與挑戰(zhàn)。
Yicuan Yue 首都師范大學(xué)藝術(shù)家
Yicuan Yue 是一名藝術(shù)家,博士畢業(yè)于首都師范大學(xué)美術(shù)學(xué)院。
演講議題:如何將人工智能技術(shù)融入未來(lái)的藝術(shù)領(lǐng)域
通過(guò)列舉人工智能技術(shù)在藝術(shù)領(lǐng)域的應(yīng)用案例,分析人工智能藝術(shù)未來(lái)發(fā)展的可能性以及藝術(shù)家的責(zé)任。
AI Models & Infra
黃靖雅 Hugging Face 機(jī)器學(xué)習(xí)工程師
黃靖雅, Hugging Face Transformers 擴(kuò)展庫(kù) Optimum 的核心開(kāi)發(fā)者。在 Hugging Face 主要專(zhuān)注于模型訓(xùn)練的加速、高效部署,以及將 Hugging Face 的開(kāi)源生態(tài)與新興 AI 硬件加速器進(jìn)行整合。
演講議題:基于 Hugging Face 實(shí)現(xiàn)開(kāi)源模型的硬件無(wú)關(guān)加速方案
本次演講將分享 Hugging Face 如何與 NVIDIA 之外的眾多 AI 硬件合作伙伴緊密協(xié)作,通過(guò) Optimum 庫(kù),讓 Hugging Face 生態(tài)中的開(kāi)源模型能夠在不同的平臺(tái)上流暢運(yùn)行。從模型訓(xùn)練到部署,Optimum 幫助 AMD、Intel、AWS 等多種芯片實(shí)現(xiàn)靈活高效的性能。同時(shí),本次演講將介紹 Hugging Face 一路走來(lái)的經(jīng)驗(yàn)與收獲,以及如何讓機(jī)器學(xué)習(xí)真正實(shí)現(xiàn)硬件無(wú)關(guān)性。
Xuan Son Nguyen Hugging Face 軟件工程師,llama.cpp 核心維護(hù)者
Xuan Son Nguyen,Hugging Face 軟件工程師,llama.cpp 項(xiàng)目的核心維護(hù)者。
演講議題:llama.cpp 多模態(tài)支持的全面升級(jí)
本次演講將詳細(xì)介紹 llama.cpp 在多模態(tài)支持方面的重要升級(jí),通過(guò)集成 libmtmd 提升了穩(wěn)定性并統(tǒng)一了接口。這一升級(jí)已于五月成功完成,目前已支持 Qwen VL、Mistral Small、Gemma 3 等模型,并推動(dòng)了社區(qū)在視覺(jué)與音頻應(yīng)用方面的開(kāi)發(fā)。
游凱超 vLLM 核心維護(hù)者
游凱超,清華大學(xué)博士,自 2024 年訪(fǎng)問(wèn)加州大學(xué)伯克利分校起,一直參與 vLLM 項(xiàng)目。他目前是 vLLM 項(xiàng)目的核心維護(hù)者之一,主要負(fù)責(zé) vLLM 分布式推理架構(gòu)設(shè)計(jì)、vLLM 與 torch.compile 的集成、開(kāi)源社區(qū)合作及項(xiàng)目的其他多個(gè)方面。
演講議題:vLLM:人人可用的簡(jiǎn)單、快速且低成本的大模型服務(wù)方案
vLLM 是一個(gè)快速且易于使用的大語(yǔ)言模型推理與服務(wù)庫(kù)。在本次演講將簡(jiǎn)要介紹 vLLM 項(xiàng)目的發(fā)展歷程、其背后的開(kāi)源社區(qū),并重點(diǎn)分享一些用戶(hù)廣泛關(guān)注的功能特性。
Aurélien-Morgan CLAUDON 獨(dú)立高級(jí) MLOps 負(fù)責(zé)人
Aurélien-Morgan CLAUDON,法國(guó)機(jī)器學(xué)習(xí)工程師,擁有 20 多年在自動(dòng)化與數(shù)據(jù)驅(qū)動(dòng)交付領(lǐng)域的實(shí)戰(zhàn)經(jīng)驗(yàn),曾任 Capgemini 顧問(wèn),并具備大型企業(yè)、初創(chuàng)公司及自由職業(yè)背景。他畢業(yè)于 ESSEC 高等商學(xué)院的高管 MBA 項(xiàng)目,自 2017 年起活躍于機(jī)器學(xué)習(xí)領(lǐng)域,過(guò)去 5 年多專(zhuān)注于 MLOps,工作風(fēng)格兼具工程實(shí)用主義與深度產(chǎn)品思維。他是開(kāi)源框架 retrain-pipelines(Apache 2 許可證)的創(chuàng)始人,該框架從第一性原理出發(fā),致力于解決 MLOps 領(lǐng)域長(zhǎng)期以來(lái)缺乏用戶(hù)中心化的問(wèn)題。他的使命是為 ML 工程師提供實(shí)用、可擴(kuò)展的工具,支持持續(xù)學(xué)習(xí)工作流的構(gòu)建與落地。
演講議題:持續(xù)學(xué)習(xí)的工業(yè)化:構(gòu)建可重訓(xùn)練的大模型定制流水線(xiàn)
持續(xù)學(xué)習(xí)對(duì)于生產(chǎn)環(huán)境中的自托管大語(yǔ)言模型至關(guān)重要,但大多數(shù)企業(yè)在實(shí)現(xiàn)自動(dòng)化重訓(xùn)練方面面臨困難。本次演講將介紹一個(gè)簡(jiǎn)化的重訓(xùn)練框架,支持可插拔的領(lǐng)域適配器、LoRA 特化機(jī)制,以及具備高價(jià)值的基礎(chǔ)設(shè)施特性。
劉廣 BAAI 數(shù)據(jù)研究團(tuán)隊(duì)技術(shù)負(fù)責(zé)人,OpenSeek 項(xiàng)目負(fù)責(zé)人
劉廣是智源研究院(BAAI)數(shù)據(jù)研究團(tuán)隊(duì)的技術(shù)負(fù)責(zé)人,主導(dǎo) OpenSeek 項(xiàng)目。他也是 Aquila 大語(yǔ)言模型系列和 Infinity 數(shù)據(jù)集家族的主要架構(gòu)師。目前研究重點(diǎn)是智能體數(shù)據(jù)系統(tǒng),致力于為下一代 AI 訓(xùn)練創(chuàng)新合成數(shù)據(jù)生成方法。
演講議題:OpenSeek:開(kāi)源驅(qū)動(dòng)的下一代 AI 模型
OpenSeek 致力于聯(lián)合全球開(kāi)源社區(qū),共同推動(dòng)算法、數(shù)據(jù)與系統(tǒng)的協(xié)同發(fā)展,助力下一代模型的構(gòu)建。在第一階段,我們發(fā)布了 CCI4.0 數(shù)據(jù)集、OpenSeek-small 模型以及 OpenSeek-Pipeline 工具鏈;同時(shí)在 FlagScale 框架中開(kāi)發(fā)了 DualPipe-V 并行訓(xùn)練策略,并攜手 PAZHOU 大賽發(fā)起共創(chuàng)任務(wù),以支持社區(qū)的廣泛參與與貢獻(xiàn)。
陳海泉 字節(jié)跳動(dòng)工程師,verl 項(xiàng)目核心貢獻(xiàn)者
陳海泉,火山引擎開(kāi)發(fā)者,verl 項(xiàng)目核心貢獻(xiàn)者,專(zhuān)注于自主智能體強(qiáng)化學(xué)習(xí)與云基礎(chǔ)設(shè)施領(lǐng)域。
演講議題:verl: 面向智能體任務(wù)的開(kāi)源 LLM 強(qiáng)化學(xué)習(xí)框架
verl 是字節(jié)跳動(dòng) Seed 團(tuán)隊(duì)開(kāi)發(fā)的一款開(kāi)源的 LLM 強(qiáng)化學(xué)習(xí)框架,適用于智能體任務(wù),具備靈活擴(kuò)展多種 RL 算法、無(wú)縫集成現(xiàn)有 LLM 基礎(chǔ)設(shè)施、支持高效分布式計(jì)算和多場(chǎng)景應(yīng)用等特點(diǎn),且擁有活躍社區(qū)。
Richard REINER Procero AI 董事會(huì)成員兼顧問(wèn)
Richard REINER 是一名連續(xù)創(chuàng)業(yè)者與企業(yè)構(gòu)建專(zhuān)家,目前以高管、投資人、導(dǎo)師與董事會(huì)成員的身份,積極活躍于網(wǎng)絡(luò)安全、人工智能和物聯(lián)網(wǎng)交叉領(lǐng)域的多家高成長(zhǎng)企業(yè),現(xiàn)任 CC Stratus Capital 創(chuàng)始合伙人。
演講議題:通過(guò)動(dòng)態(tài)優(yōu)化,將 AI 帶向邊緣計(jì)算
如今的大語(yǔ)言模型和其他生成式 AI 應(yīng)用,正在徹底改變我們的工作方式,幫助人類(lèi)擺脫日常繁瑣任務(wù),專(zhuān)注于創(chuàng)造性和高價(jià)值的貢獻(xiàn)。然而,這項(xiàng)卓越的能力也伴隨著高昂的代價(jià)。本次演講將分享如何通過(guò) Procero 獨(dú)特的動(dòng)態(tài)優(yōu)化技術(shù),將大語(yǔ)言模型和生成式 AI 的強(qiáng)大能力從高成本、高耗能的云端服務(wù)器遷移至手機(jī)、筆記本電腦及物聯(lián)網(wǎng)設(shè)備等邊緣端,推動(dòng) AI 應(yīng)用更高效、經(jīng)濟(jì)且環(huán)保地落地。
張昱軒 智譜 AI 工程師,CogVideoX 項(xiàng)目貢獻(xiàn)者
張昱軒,智譜 AI 工程師,CogVideoX 項(xiàng)目貢獻(xiàn)者。
演講議題:智譜 AI 模型介紹與開(kāi)源生態(tài)
本次介紹將陳述 2025 年來(lái)智譜開(kāi)源的模型,包括 GLM-4.5 系列,GLM-4.1V 系列,以及陳述智譜 AI 在模型開(kāi)源上的工程與算法適配,社區(qū)合作模式。通過(guò)系統(tǒng)性闡述智譜 AI 開(kāi)源模型的流程,讓開(kāi)發(fā)者熟悉大模型開(kāi)源過(guò)程中的工程和算法難題,解決方案和工作方法。
Embodied AI
Jinwei Gu NVIDIA 首席研究科學(xué)家兼技術(shù)負(fù)責(zé)人
Jinwei Gu 博士現(xiàn)任英偉達(dá)首席研究科學(xué)家,并兼任香港中文大學(xué)客座副教授。他的研究方向涵蓋生成式人工智能、世界模型,以及計(jì)算機(jī)視覺(jué)、計(jì)算機(jī)圖形學(xué)和機(jī)器學(xué)習(xí)等領(lǐng)域。他于 2010 年在哥倫比亞大學(xué)取得計(jì)算機(jī)科學(xué)博士學(xué)位,分別于 2002 年和 2005 年在清華大學(xué)獲得學(xué)士和碩士學(xué)位。 在英偉達(dá)期間,他是 Cosmos 模型開(kāi)發(fā)的技術(shù)負(fù)責(zé)人之一。Cosmos 是一系列多模態(tài)世界基礎(chǔ)模型,致力于在機(jī)器人、自動(dòng)駕駛和生成式人工智能等領(lǐng)域?qū)崿F(xiàn)真實(shí)世界的應(yīng)用。在加入英偉達(dá)之前,他曾在 SenseBrain 擔(dān)任研發(fā)執(zhí)行總監(jiān),主要負(fù)責(zé)基于新型圖像傳感器和成像系統(tǒng)的移動(dòng)計(jì)算攝影技術(shù)研究。 Jinwei Gu 博士在計(jì)算機(jī)視覺(jué)領(lǐng)域頂級(jí)會(huì)議和期刊上發(fā)表了大量論文,并曾擔(dān)任 IEEE Transactions on Pattern Analysis and Machine Intelligence 和 IEEE Transactions on Computational Imaging 副編輯(2018-2023),并多次擔(dān)任 CVPR、NeurIPS、ICCV、ICCP 和 ECCV 等頂級(jí)會(huì)議的領(lǐng)域主席,以及多個(gè)學(xué)術(shù)研討會(huì)(如 MIPI、RichMediaGAI)的組織主席。他于 2018 年成為 IEEE 高級(jí)會(huì)員。他的研究成果已成功應(yīng)用于諸多產(chǎn)品,包括 NVIDIA-Cosmos、NVIDIA-CoPilot SDK、NVIDIA-DriveIX SDK,以及廣泛應(yīng)用于旗艦手機(jī)中的超分辨率、超級(jí)夜景、人像修復(fù)和 RGBW 成像解決方案等。
演講議題:面向物理 AI 的 Cosmos 世界基礎(chǔ)模型
NVIDIA Cosmos 是一系列專(zhuān)為物理 AI 而設(shè)計(jì)的世界基礎(chǔ)模型,主要包括三個(gè)核心組件:Cosmos-Predict、Cosmos-Transfer 和 Cosmos-Reason。本次演講將全面介紹 Cosmos 模型的整體架構(gòu)、發(fā)展歷程、基準(zhǔn)測(cè)試與評(píng)估方法,并著重講解面向機(jī)器人與自動(dòng)駕駛應(yīng)用所開(kāi)展的模型后訓(xùn)練工作。同時(shí),我也將展示如何利用 Cosmos 世界基礎(chǔ)模型高效完成合成數(shù)據(jù)生成、具身智能及其他下游任務(wù)。
JianShi Kornia AI 聯(lián)合創(chuàng)始人
Jian Shi,Kornia AI 的聯(lián)合創(chuàng)始人,Kornia 庫(kù)(PyTorch 中領(lǐng)先的計(jì)算機(jī)視覺(jué)框架)的核心維護(hù)者之一。他致力于通過(guò)開(kāi)放協(xié)作來(lái)推動(dòng)空間人工智能技術(shù)的發(fā)展和普及,目前是阿卜杜拉國(guó)王科技大學(xué)(KAUST)的博士候選人,研究方向?yàn)樯赡P团c立體視覺(jué)。
演講議題:基于 Kornia 的易用型智能體視覺(jué)計(jì)算框架
本次演講將介紹一種突破性的計(jì)算機(jī)視覺(jué)方法,它結(jié)合了 Kornia 視覺(jué)庫(kù)與大語(yǔ)言模型,構(gòu)建出具備智能體特性的計(jì)算機(jī)視覺(jué)系統(tǒng)。我們將展示如何利用 MCP,將復(fù)雜的計(jì)算機(jī)視覺(jué)操作轉(zhuǎn)化為自然語(yǔ)言交互,從而讓用戶(hù)無(wú)需深厚的編程基礎(chǔ),也能輕松實(shí)現(xiàn)先進(jìn)的圖像與視頻處理功能。
Xavier Tao 陶海軒 1ms.ai 創(chuàng)始人
1ms.ai 是一家致力于打造突破性人工智能開(kāi)源項(xiàng)目的初創(chuàng)公司,其中一個(gè)項(xiàng)目是 DORA-RS,這是一種創(chuàng)新性的中間件,能夠以領(lǐng)先的性能在 AI 模型、傳感器與執(zhí)行器之間共享數(shù)據(jù)。這使得跨模態(tài)構(gòu)建復(fù)雜應(yīng)用成為可能,也幫助我們實(shí)現(xiàn)了一些非常復(fù)雜的機(jī)器人演示項(xiàng)目。
演講議題:利用 DORA-RS 混合多模態(tài) AI 模型,解決復(fù)雜機(jī)器人任務(wù)
近年來(lái),Transformer 模型在許多復(fù)雜的預(yù)測(cè)任務(wù)上實(shí)現(xiàn)了突破性的成果,使得一些曾經(jīng)極具挑戰(zhàn)的機(jī)器人任務(wù)變得觸手可及。在本次演講中,我們將重點(diǎn)介紹在機(jī)器人領(lǐng)域發(fā)揮關(guān)鍵作用的一些模型,以及這些模型目前存在的局限性。
王鵬偉 北京智源人工智能研究院具身智能大模型負(fù)責(zé)人
王鵬偉,北京智源人工智能研究院具身智能大模型負(fù)責(zé)人、目前主要負(fù)責(zé)具身大腦大模型 RoboBrain 以及大小腦框架 RoboOS,研究方向是具身智能、多模態(tài)大模型、深度學(xué)習(xí)、自然語(yǔ)言處理和機(jī)器學(xué)習(xí)等方向,曾就職于阿里巴巴達(dá)摩院以及快手科技大模型中臺(tái)部門(mén),主要負(fù)責(zé)大規(guī)模語(yǔ)音語(yǔ)義一體化等多模態(tài)交互系統(tǒng)以及多模態(tài)預(yù)訓(xùn)練項(xiàng)目,具有豐富的多模態(tài)大模型、文本大模型以及機(jī)器智能等產(chǎn)學(xué)經(jīng)驗(yàn)。
演講議題:具身大小腦操作框架與具身大腦模型構(gòu)建
本次演講將詳細(xì)介紹智源研究院發(fā)布的首個(gè)跨本體具身大小腦協(xié)作框架 RoboOS 與開(kāi)源具身大腦 RoboBrain,可實(shí)現(xiàn)跨場(chǎng)景多任務(wù)輕量化快速部署與跨本體協(xié)作,推動(dòng)單機(jī)智能邁向群體智能,為構(gòu)建具身智能開(kāi)源統(tǒng)一生態(tài)加速場(chǎng)景應(yīng)用提供底層技術(shù)支持,為主流本體提供一站式大小腦部署流程,提供即插即用解決方案。
Edgar Riba Bonsai Robotics 主任研究工程師,Kornia 項(xiàng)目創(chuàng)始人
Edgar Riba 任職于 Bonsai Robotics,Kornia 項(xiàng)目的創(chuàng)始人兼項(xiàng)目負(fù)責(zé)人,負(fù)責(zé)引領(lǐng) Agentic AI 與視覺(jué)-語(yǔ)言動(dòng)作模型方面的研究,以及為教育和研究型機(jī)器人量身打造相關(guān)工具。他擅長(zhǎng)將經(jīng)典計(jì)算機(jī)視覺(jué)、深度學(xué)習(xí)與真實(shí)世界的機(jī)器人應(yīng)用緊密結(jié)合,提供穩(wěn)健、可擴(kuò)展的自動(dòng)化解決方案,專(zhuān)注于先進(jìn)的計(jì)算機(jī)視覺(jué)與空間人工智能技術(shù)。
演講議題:Amiga:面向智能農(nóng)業(yè)與戶(hù)外物流的模塊化 AI 優(yōu)先平臺(tái)
本次演講將介紹下一代機(jī)器人平臺(tái)——Amiga,這是一種專(zhuān)為農(nóng)業(yè)和戶(hù)外物流場(chǎng)景設(shè)計(jì)的模塊化機(jī)器人平臺(tái)。Amiga 旨在實(shí)現(xiàn)快速原型開(kāi)發(fā)與實(shí)際部署,支持定制化的電動(dòng)多功能車(chē)輛,以精簡(jiǎn)勞動(dòng)密集型任務(wù),降低成本,并促進(jìn)有機(jī)再生農(nóng)業(yè)的實(shí)踐。
岑明 重慶郵電大學(xué)教授
岑明于 2006 年在中國(guó)科學(xué)院研究生院獲得光學(xué)工程博士學(xué)位。他現(xiàn)任重慶郵電大學(xué)教授。在職業(yè)生涯中,他曾任軟件系統(tǒng)分析師,并擔(dān)任汽車(chē)電子與嵌入式系統(tǒng)研究中心副主任。他的研究興趣包括信息融合、多目標(biāo)跟蹤、自動(dòng)駕駛和智能機(jī)器人。
演講議題:非結(jié)構(gòu)化環(huán)境下的地圖生成與路徑規(guī)劃方法
地面自主平臺(tái)在災(zāi)難救援、礦產(chǎn)開(kāi)采、現(xiàn)場(chǎng)巡檢和農(nóng)業(yè)作業(yè)等領(lǐng)域的應(yīng)用日益增多,其中定位與建圖技術(shù)對(duì)這些平臺(tái)至關(guān)重要。然而,在非結(jié)構(gòu)化環(huán)境中,障礙物和不可通行區(qū)域呈現(xiàn)出多樣化的類(lèi)型和復(fù)雜的特征。現(xiàn)有的面向結(jié)構(gòu)化場(chǎng)景的建圖與路徑規(guī)劃方法難以有效應(yīng)對(duì)這些挑戰(zhàn)。因此,針對(duì)非結(jié)構(gòu)化環(huán)境的地圖生成與路徑規(guī)劃方法研究具有重要的學(xué)術(shù)價(jià)值。
尹云鵬 人形機(jī)器人上海有限公司運(yùn)控算法與框架負(fù)責(zé)人
尹云鵬,OpenLoong 控制框架開(kāi)發(fā)者。
演講議題:從格物到致知,具身智能機(jī)器人開(kāi)發(fā)范式的改變
在具身智能與人形機(jī)器人交匯發(fā)展的大背景下,以數(shù)據(jù)學(xué)習(xí)、模型訓(xùn)練為核心的機(jī)器人開(kāi)發(fā)范式革命悄然展開(kāi)。國(guó)家地方共建人形機(jī)器人創(chuàng)新中心推出“格物-致知”通用機(jī)器人開(kāi)發(fā)平臺(tái),提供機(jī)器人從高層算法模型訓(xùn)練、任務(wù)流編排到底層具身硬件配置的全流程開(kāi)發(fā)能力,搭配國(guó)地中心全開(kāi)源 OpenLoong 控制框架,一站完成異構(gòu)本體適配、計(jì)算架構(gòu)適配、仿真實(shí)機(jī)適配,加速具身智能場(chǎng)景應(yīng)用落地。
夏軒 深圳市人工智能與機(jī)器人研究院副研究員
夏軒,博士畢業(yè)于上海交通大學(xué),現(xiàn)任深圳市人工智能與機(jī)器人研究院副研究員。他是國(guó)家自然科學(xué)基金項(xiàng)目負(fù)責(zé)人,2024 年吳文俊人工智能科學(xué)技術(shù)進(jìn)步獎(jiǎng)獲得者,深圳市高層次人才及深圳市龍崗區(qū)高層次人才。其主要研究方向包括具身智能、多模態(tài)學(xué)習(xí)、計(jì)算機(jī)視覺(jué)、缺陷檢測(cè)及生成模型等領(lǐng)域。他主持了國(guó)家自然科學(xué)基金、廣東省自然科學(xué)基金、中國(guó)博士后科學(xué)基金等多個(gè)科研項(xiàng)目,并參與多項(xiàng)國(guó)家、省市級(jí)基金項(xiàng)目及企業(yè)合作項(xiàng)目。已出版專(zhuān)著一部,發(fā)表論文二十余篇,申請(qǐng)發(fā)明專(zhuān)利十余項(xiàng)。
演講議題:AIRSPEED:用于具身智能的開(kāi)源通用數(shù)據(jù)生產(chǎn)平臺(tái)
本次演講將介紹 AIRSPEED 這一通用數(shù)據(jù)生產(chǎn)平臺(tái),整合上下游資源,滿(mǎn)足從基礎(chǔ)軟硬件開(kāi)發(fā)商到具身智能應(yīng)用商的全方位數(shù)據(jù)需求。AIRSPEED 平臺(tái)在技術(shù)架構(gòu)與功能設(shè)計(jì)上展現(xiàn)出卓越的創(chuàng)新性與前瞻性。其采用 ROS 2 架構(gòu),確保分布式靈活部署,通過(guò)通用軟件接口實(shí)現(xiàn)設(shè)備快速調(diào)通,兼容多種遙操作設(shè)備、機(jī)器人本體以及末端執(zhí)行器,無(wú)論是 VR 遙操作、手柄遙操作,還是外骨骼控制,都能無(wú)縫銜接,實(shí)現(xiàn)對(duì)任意機(jī)器人形態(tài)的適配控制。在數(shù)據(jù)生成方面,AIRSPEED 支持預(yù)測(cè)生成、軌跡合成、資產(chǎn)合成等多種功能,可依據(jù)用戶(hù)需求生成任意操作軌跡、可交互資產(chǎn)以及智能體決策,為具身智能模型訓(xùn)練與算法優(yōu)化提供豐富、高質(zhì)量的數(shù)據(jù)資源。
岑汝平 重慶郵電大學(xué)博士
岑汝平,博士,現(xiàn)任職于重慶郵電大學(xué)自動(dòng)化學(xué)院。他的研究方向主要包括移動(dòng)機(jī)器人定位與導(dǎo)航、多傳感器融合定位技術(shù)?;谏詈竦膶W(xué)術(shù)積累,他創(chuàng)建了開(kāi)源項(xiàng)目 MickRobot,從零開(kāi)始打造了一套涵蓋機(jī)械設(shè)計(jì)、硬件集成、感知與定位,以及導(dǎo)航控制系統(tǒng)的雙臂仿人機(jī)器人平臺(tái)。除了代碼貢獻(xiàn)之外,他還撰寫(xiě)了一系列技術(shù)博客與教程,記錄了該項(xiàng)目的開(kāi)發(fā)歷程,累計(jì)頁(yè)面瀏覽量超過(guò) 110 萬(wàn)次,在社區(qū)中產(chǎn)生了廣泛的影響力。
演講議題:DORA-RS 高性能計(jì)算框架在具身機(jī)器人中的應(yīng)用
本次演講將介紹 DORA-RS 框架的內(nèi)在優(yōu)勢(shì),以及它在多個(gè)具身機(jī)器人平臺(tái)上的具體應(yīng)用,并以基于 DORA-RS 的抓取與分揀系統(tǒng)作為實(shí)例進(jìn)行說(shuō)明。
李濤 深開(kāi)鴻軟件工程師
李濤,深開(kāi)鴻軟件工程師,目前擔(dān)任 OpenHarmony 開(kāi)源機(jī)器人系統(tǒng)項(xiàng)目的主要開(kāi)發(fā)者。
演講議題:基于 OpenHarmony 的機(jī)器人操作系統(tǒng)
本研究將主要介紹深開(kāi)鴻聯(lián)合產(chǎn)業(yè)界與學(xué)術(shù)界共同研發(fā)的一款基于 OpenHarmony 的開(kāi)源、全場(chǎng)景、智能化機(jī)器人全棧操作系統(tǒng)。該系統(tǒng)面向教育、工業(yè)自動(dòng)化、巡檢、服務(wù)機(jī)器人等多種機(jī)器人應(yīng)用場(chǎng)景。與傳統(tǒng)基于 Ubuntu 系統(tǒng)和 ROS 中間件的方案相比,我們的方案以 OpenHarmony 為基礎(chǔ)系統(tǒng),并結(jié)合 Dora 機(jī)器人中間件,在安全性、可控性、可信性、云邊端協(xié)同以及應(yīng)用開(kāi)發(fā)語(yǔ)言范式等方面具備顯著優(yōu)勢(shì)。此外,該架構(gòu)有助于構(gòu)建開(kāi)放生態(tài),促進(jìn)開(kāi)源共創(chuàng),加速商業(yè)化落地。
Agentic Web
常高偉 ANP 開(kāi)源技術(shù)社區(qū)發(fā)起人,W3C AI Agent Protocol 聯(lián)合主席
常高偉是 ANP 開(kāi)源社區(qū)發(fā)起人,該協(xié)議是全球最早的智能體通信協(xié)議,ANP 的目標(biāo)是成為智能體互聯(lián)網(wǎng)時(shí)代的 HTTP,ANP 的愿景是定義智能體之間的連接方式,為數(shù)十億智能體構(gòu)建一個(gè)開(kāi)放、安全、高效的協(xié)作網(wǎng)絡(luò)。
演講議題:智能體協(xié)議:引領(lǐng)互聯(lián)網(wǎng)邁向 Agentic Web 時(shí)代
隨著大模型技術(shù)的發(fā)展,智能體正逐步成為互聯(lián)網(wǎng)的核心參與者。本次演講梳理了從語(yǔ)義網(wǎng)到 Agentic Web 的技術(shù)演進(jìn),提出構(gòu)建標(biāo)準(zhǔn)化智能體網(wǎng)絡(luò)協(xié)議的緊迫性與必要性??偨Y(jié)出 Agentic Web 的四大關(guān)鍵趨勢(shì):智能體替代傳統(tǒng)軟件、實(shí)現(xiàn)普遍互聯(lián)、以協(xié)議為核心連接方式,以及具備自主協(xié)作能力。同時(shí),指出當(dāng)前互聯(lián)網(wǎng)在接口、協(xié)作和數(shù)據(jù)孤島等方面對(duì)智能體發(fā)展構(gòu)成阻礙。為解決上述挑戰(zhàn),提出了智能體網(wǎng)絡(luò)協(xié)議的設(shè)計(jì)原則與功能需求,并比較分析了 MCP、A2A、ACP 與 ANP 等主流協(xié)議。呼吁全球開(kāi)發(fā)者與標(biāo)準(zhǔn)化組織共同推動(dòng)智能體協(xié)議標(biāo)準(zhǔn)的制定,構(gòu)建開(kāi)放、高效、可信的 Agentic Web。
José Andrés Mu?oz Arcentales馬德里理工大學(xué)副教授
José Andrés Mu?oz Arcentales 是馬德里理工大學(xué)的副教授。
演講議題:數(shù)據(jù)空間中面向智能體人工智能的自主身份與信任基礎(chǔ)設(shè)施
隨著人工智能越來(lái)越多地在分布式、動(dòng)態(tài)化的環(huán)境中運(yùn)作,對(duì)于強(qiáng)大、可驗(yàn)證且可互操作的身份基礎(chǔ)設(shè)施的需求變得至關(guān)重要。本次演講將介紹一種專(zhuān)為數(shù)據(jù)空間設(shè)計(jì)的身份驗(yàn)證協(xié)議,該協(xié)議與歐盟對(duì)于安全數(shù)字生態(tài)系統(tǒng)的愿景相一致。通過(guò)結(jié)合授權(quán)協(xié)商與授權(quán)協(xié)議和支持可驗(yàn)證展示的開(kāi)放身份連接協(xié)議,以及支持關(guān)聯(lián)可驗(yàn)證展示,該解決方案實(shí)現(xiàn)了一種安全且保護(hù)隱私的身份框架,支持以人為中心及完全自主的智能體交互。
該方案基于自主身份的原則,去中心化身份控制,降低對(duì)信任的假設(shè),并創(chuàng)建機(jī)器可讀的身份聲明。本次演講將探討這種基礎(chǔ)設(shè)施如何賦能 AI 智能體,使其能夠在受監(jiān)管的環(huán)境中安全運(yùn)行,并與歐盟《數(shù)據(jù)法案》和《人工智能法案》的規(guī)定保持一致。此外,我們還將深入探討 GNAP4VP 協(xié)議在技術(shù)設(shè)計(jì)、交互流程和現(xiàn)實(shí)世界中的適用性,展示其如何在身份層面實(shí)現(xiàn)信任與自主,從而為智能系統(tǒng)之間實(shí)現(xiàn)可擴(kuò)展、可驗(yàn)證且自動(dòng)化的交互奠定基礎(chǔ)。
張?jiān)骑w 中國(guó)電信智慧城市研究院副院長(zhǎng),中國(guó)電信首席專(zhuān)家
張?jiān)骑w,中國(guó)電信智慧城市研究院副院長(zhǎng),中國(guó)電信首席專(zhuān)家,教授級(jí)高級(jí)工程師,國(guó)家級(jí)人才計(jì)劃特聘專(zhuān)家,交通運(yùn)輸部中青年領(lǐng)軍人才、國(guó)際公路交通科技領(lǐng)軍人才,5G 產(chǎn)業(yè)方陣副理事長(zhǎng),中國(guó)通信標(biāo)準(zhǔn)化協(xié)會(huì)物聯(lián)網(wǎng)委員會(huì)副主席,曾任騰訊未來(lái)網(wǎng)絡(luò)實(shí)驗(yàn)室主任,騰訊智慧交通首席科學(xué)家。提出泛 V2X 技術(shù)體系和實(shí)踐,在業(yè)界形成廣泛影響。在 IETF 創(chuàng)立 P2P 流媒體協(xié)議工作組并擔(dān)任主席,在 IETF、ITU-T 等發(fā)布 10 多個(gè)國(guó)際標(biāo)準(zhǔn)。獲得中華杰出工程師青年獎(jiǎng)、國(guó)家專(zhuān)利銀獎(jiǎng)、國(guó)家標(biāo)準(zhǔn)獎(jiǎng)、上海市技術(shù)發(fā)明一等獎(jiǎng)、上海市科技進(jìn)步獎(jiǎng)一等獎(jiǎng)、深圳市科技進(jìn)步一等獎(jiǎng)、金橋獎(jiǎng)個(gè)人獎(jiǎng)、中國(guó)車(chē)聯(lián)網(wǎng)杰出人物獎(jiǎng)、IEEE ITSC 智慧交通和車(chē)路協(xié)同雙冠軍等省部級(jí)以上獎(jiǎng)勵(lì) 20 多項(xiàng)。
演講議題:超越現(xiàn)有范式:面向后數(shù)字時(shí)代 AI 生態(tài)系統(tǒng)的 RVP 協(xié)議
隨著 AI 技術(shù)邁入新紀(jì)元,傳統(tǒng)數(shù)字化架構(gòu)的局限性日益凸顯。本次演講將介紹革命性的 RVP 協(xié)議,這是面向后數(shù)字時(shí)代設(shè)計(jì)的全新 AI 生態(tài)系統(tǒng)架構(gòu)。演講將深入解析 RVP 協(xié)議的三大核心:現(xiàn)實(shí)層的多源數(shù)據(jù)融合、虛擬化層的數(shù)字孿生技術(shù)、以及感知層的多模態(tài) AI 能力整合。重點(diǎn)闡述該協(xié)議如何突破現(xiàn)有技術(shù)瓶頸,實(shí)現(xiàn)跨域協(xié)同、自適應(yīng)進(jìn)化的智能網(wǎng)絡(luò)。通過(guò)智慧城市、自動(dòng)駕駛、工業(yè)互聯(lián)網(wǎng)等實(shí)際應(yīng)用案例,展示 RVP 協(xié)議在解決數(shù)據(jù)孤島、算力分散、模型割裂等關(guān)鍵問(wèn)題上的獨(dú)特優(yōu)勢(shì)。演講還將探討該協(xié)議的標(biāo)準(zhǔn)化路徑與產(chǎn)業(yè)化前景。 作為下一代 AI 基礎(chǔ)設(shè)施的技術(shù)藍(lán)圖,RVP 協(xié)議代表著從工具化 AI 向生態(tài)化 AI 的根本轉(zhuǎn)變。本演講將為與會(huì)者提供前瞻性的技術(shù)洞察,共同探索人工智能的未來(lái)發(fā)展方向,推動(dòng)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的深度變革。
Apps & Agents
Ruoyu Ying Intel 云軟件工程師
Ruoyu Ying 是英特爾 STG 部門(mén)的云軟件工程師。她曾在多個(gè)開(kāi)源社區(qū)從事 ONAP、網(wǎng)絡(luò)、服務(wù)網(wǎng)格和機(jī)密計(jì)算等領(lǐng)域的工作。目前,她的主要關(guān)注領(lǐng)域之一是基于云原生基礎(chǔ)設(shè)施的生成式人工智能技術(shù)賦能。此外,她還參與撰寫(xiě)了關(guān)于邊緣計(jì)算的白皮書(shū)和書(shū)籍,并曾在 OpenInfra 和 KubeCon 等峰會(huì)上成功發(fā)表多次演講。
演講議題:加速企業(yè) AI 落地:實(shí)現(xiàn)低成本、高效率、無(wú)縫集成的實(shí)用路徑
隨著生成式 AI 在各個(gè)行業(yè)快速興起,企業(yè)迫切希望借助它來(lái)提升生產(chǎn)力和用戶(hù)體驗(yàn)。然而,將 AI 引入實(shí)際生產(chǎn)環(huán)境仍面臨諸多挑戰(zhàn)——尤其是在資源有限、預(yù)算緊張以及與現(xiàn)有企業(yè)系統(tǒng)整合復(fù)雜的背景下。如今擺在企業(yè)面前的關(guān)鍵問(wèn)題是:如何以更快的速度、更低的成本、更少的干擾部署 AI,甚至還能充分利用現(xiàn)有的基礎(chǔ)設(shè)施? 本次演講將介紹我們推出的開(kāi)源企業(yè)級(jí) AI 平臺(tái) OPEA,該平臺(tái)能夠幫助企業(yè)快速構(gòu)建、部署和驗(yàn)證適合自身需求的 AI 應(yīng)用。我們將逐步講解項(xiàng)目的核心架構(gòu)、模塊化設(shè)計(jì)和云原生部署模式,展示其如何簡(jiǎn)化企業(yè)在真實(shí)生產(chǎn)環(huán)境中的 AI 整合。此外,我們還會(huì)深入探討 OPEA 如何與 InfiniEdge AI 的 SPEAR 項(xiàng)目集成,支持在云、邊緣及設(shè)備之間按需進(jìn)行智能體編排和跨領(lǐng)域協(xié)作。最后,我們將通過(guò)一個(gè)實(shí)際案例演示如何結(jié)合這些技術(shù)實(shí)現(xiàn)一個(gè)實(shí)時(shí)語(yǔ)音助手,充分展現(xiàn)該平臺(tái)對(duì)企業(yè) AI 轉(zhuǎn)型的實(shí)際價(jià)值和影響力。
董鑫 華為中央軟件院項(xiàng)目群總監(jiān)
董鑫,華為中央軟件院項(xiàng)目群總監(jiān),從事研發(fā)工具鏈,編程語(yǔ)言,IDE 等核心基礎(chǔ)軟件研發(fā)工作。在華為公司工作期間,先后作為首席技術(shù)專(zhuān)家和項(xiàng)目經(jīng)理從事華為移動(dòng)端 AI 研發(fā)工具,公司級(jí) AI 研發(fā)平臺(tái),華為昇騰 AI 芯片工具鏈,鴻蒙 OS 工具鏈等相關(guān)工作。 2021 年起負(fù)責(zé)華為編程語(yǔ)言和 IDE 基礎(chǔ)軟件的研發(fā)業(yè)務(wù),并擔(dān)任項(xiàng)目群總監(jiān),從事自主可控的編程語(yǔ)言及 IDE 開(kāi)發(fā)工具的核心技術(shù)研發(fā)工作,對(duì)國(guó)產(chǎn)應(yīng)用編程語(yǔ)言的技術(shù)規(guī)劃,產(chǎn)品化,產(chǎn)業(yè)落地進(jìn)展等工作出了重要的貢獻(xiàn)。
演講議題:CangjieMagic:基于倉(cāng)頡語(yǔ)言的 Agent 開(kāi)發(fā)框架實(shí)踐
本次演講將整體介紹倉(cāng)頡編程語(yǔ)言以及基于倉(cāng)頡編程語(yǔ)言的 AI 大模型開(kāi)發(fā)框架 CangjieMagic,該框架支持向 Agent 編程,為開(kāi)發(fā)者提供高效 Agent 編程的 Agent DSL,支持 MCP 協(xié)議方便 Agent 和工具相互調(diào)用,支持模塊化調(diào)用,支持任務(wù)智能規(guī)劃。提升開(kāi)發(fā)者開(kāi)發(fā)智慧鴻蒙應(yīng)用效率,打造極致開(kāi)發(fā)體驗(yàn),探索未來(lái)大模型應(yīng)用開(kāi)發(fā)新范式。
Zhiyu LiMemTensor聯(lián)合創(chuàng)始人兼 CTO
Zhiyu Li 博士是 MemTensor(上海)科技有限公司的聯(lián)合創(chuàng)始人兼首席技術(shù)官、IAAR 研究員、上海交通大學(xué)人工智能學(xué)院(SAI)產(chǎn)業(yè)青年科學(xué)家。他的研究聚焦于大語(yǔ)言模型與生成式人工智能,尤其專(zhuān)注于“記憶增強(qiáng)智能”與 GAI 基礎(chǔ)設(shè)施的構(gòu)建。
在此之前,李博士曾領(lǐng)導(dǎo)阿里巴巴和小紅書(shū)的核心 AI 團(tuán)隊(duì),推動(dòng)了多項(xiàng)算法創(chuàng)新,創(chuàng)造了數(shù)十億級(jí)的商業(yè)收益。在 MemTensor,他主導(dǎo)研發(fā)了全球首個(gè)面向大語(yǔ)言模型的“記憶操作系統(tǒng)”(MemOS)。
演講議題:智能始于記憶:打造基于 MemOS 的記憶管理新范式
當(dāng)前的大模型系統(tǒng)雖具備強(qiáng)大的生成與推理能力,但長(zhǎng)期以來(lái)缺乏“記憶”的支撐,導(dǎo)致知識(shí)無(wú)法持續(xù)積累、上下文難以長(zhǎng)期保持,幻覺(jué)和邏輯斷裂頻繁發(fā)生。MemOS 是面向大模型的首個(gè)工業(yè)級(jí)記憶操作系統(tǒng),旨在為智能系統(tǒng)提供統(tǒng)一的記憶管理底座。 本次演講將圍繞“智能始于記憶”的核心理念,介紹 MemOS 的系統(tǒng)架構(gòu)與開(kāi)源進(jìn)展,分享如何通過(guò)動(dòng)態(tài)知識(shí)注入、分層記憶調(diào)度和跨模型記憶遷移,建立面向大模型的新一代記憶管理范式。演講將結(jié)合行業(yè)應(yīng)用場(chǎng)景的實(shí)際案例,探討如何用 MemOS 推動(dòng)大模型更低成本、更高效、更可信地落地行業(yè)場(chǎng)景,邁向長(zhǎng)期智能與可持續(xù)演化。
白婷 北京郵電大學(xué)副教授
白婷,北京郵電大學(xué)計(jì)算機(jī)學(xué)院副教授,專(zhuān)注于個(gè)性化推薦、大模型研究及應(yīng)用,以第一或者通訊作者發(fā)表高水平學(xué)術(shù)論文 40 余篇,包括 4 篇最佳論文/最佳論文候選獎(jiǎng),相關(guān)研究成果應(yīng)用于騰訊、小米等頭部互聯(lián)網(wǎng)公司。獲得 2020 年中國(guó)中文信息學(xué)會(huì)"優(yōu)秀博士學(xué)位論文獎(jiǎng)",2023 年中國(guó)電子學(xué)會(huì)"科技進(jìn)步一等獎(jiǎng)",2023 年百度首屆"全球 AI 華人女性青年學(xué)者", 2024 年中國(guó)科協(xié)青年托舉人才。
演講議題:AI 個(gè)性化記憶操作系統(tǒng)的構(gòu)建
構(gòu)建個(gè)性化智能體服務(wù)時(shí),需適配垂域特性、保障交互個(gè)性化及內(nèi)容可信合規(guī)。但傳統(tǒng)通用智能體存在明顯短板:難以精準(zhǔn)貼合垂域知識(shí)體系,長(zhǎng)交互中記憶易斷裂,內(nèi)容生成追溯困難。本次演講將介紹 “垂域適配 - 記憶管理 - 可信生成” 的個(gè)性化體系。核心模塊 MemoryOS 作為首個(gè)開(kāi)源記憶操作系統(tǒng)框架,深度融入知識(shí)與記憶管理環(huán)節(jié),通過(guò)關(guān)聯(lián)垂域知識(shí)圖譜實(shí)現(xiàn)精準(zhǔn)檢索,可有效解決垂域智能體知識(shí)檢索不精準(zhǔn)、交互連貫性不足及個(gè)性化欠缺等問(wèn)題。通過(guò)多模塊協(xié)同,在確保內(nèi)容可追溯、合規(guī)的基礎(chǔ)上,借助優(yōu)化記憶與知識(shí)管理,為垂域個(gè)性化 AI 應(yīng)用提供了一套完整可復(fù)用的技術(shù)實(shí)踐路徑。
劉南兵 四川餃子互動(dòng)科技有限公司 CTO
劉南兵,餃子互動(dòng)科技聯(lián)合創(chuàng)始人,5ire.app 作者,中文寫(xiě)作社區(qū) essay.ink 發(fā)起人。
演講議題:5ire:一個(gè)開(kāi)源 AI 項(xiàng)目的從零到一
本次演講將介紹 5ire,從一個(gè)簡(jiǎn)單想法出發(fā),逐步走向開(kāi)源、獲得社區(qū)反饋并持續(xù)演進(jìn)的過(guò)程。我們將回顧從產(chǎn)品設(shè)計(jì)、技術(shù)選型到快速構(gòu)建 MVP 的關(guān)鍵節(jié)點(diǎn),分享過(guò)程中遇到的問(wèn)題與轉(zhuǎn)折,以及我們?nèi)绾沃匦吕斫?AI 應(yīng)用的價(jià)值定位,找到與大模型能力的互補(bǔ)點(diǎn)。希望這段經(jīng)歷能為正在構(gòu)思、驗(yàn)證或打磨產(chǎn)品的開(kāi)發(fā)者,提供一些參考和啟發(fā)。
Florian H?nicke Jina AI 創(chuàng)始工程師
Florian 在人工智能領(lǐng)域擁有 10 年的豐富經(jīng)驗(yàn),曾就職于 Axel-Springer、德勤(Deloitte)和 SoundCloud 等公司。目前,他擔(dān)任 Jina AI 的首席工程師,致力于快速構(gòu)建人工智能原型解決方案。他的專(zhuān)業(yè)領(lǐng)域包括智能體搜索和合成數(shù)據(jù)生成。同時(shí),F(xiàn)lorian 還擔(dān)任人工智能政策顧問(wèn),向歐洲議會(huì)成員提供相關(guān)講解與見(jiàn)解,幫助他們更深入地理解人工智能。
演講議題:文本嵌入中的長(zhǎng)度偏差:可視化及其對(duì)搜索的影響
較長(zhǎng)的文本會(huì)人為抬高余弦相似度;CISI 演示揭示了這一偏差,并展示了如何通過(guò)非對(duì)稱(chēng)編碼與混合重排序的方法加以修正。
WilsonWang 字節(jié)跳動(dòng)軟件工程師
Wilson Wang,字節(jié)跳動(dòng)全球邊緣團(tuán)隊(duì)軟件工程師,專(zhuān)注于虛擬機(jī)和 WebAssembly 技術(shù)。我對(duì)操作系統(tǒng)、分布式系統(tǒng)、云原生技術(shù)、邊緣計(jì)算以及無(wú)服務(wù)器架構(gòu)領(lǐng)域有著濃厚的興趣。
演講議題:SPEAR - 一個(gè)可擴(kuò)展的、分布式的邊緣與云端 AI 智能體框架
SPEAR 是 LF Edge InfiniEdge AI 項(xiàng)目下的下一代開(kāi)源框架,專(zhuān)為靈活、可擴(kuò)展的 AI 智能體工作負(fù)載而設(shè)計(jì)。SPEAR 支持在多種運(yùn)行時(shí)環(huán)境下執(zhí)行,目前已支持本地進(jìn)程和 Docker 容器,并計(jì)劃未來(lái)支持 WebAssembly 和 Kubernetes。SPEAR 賦能開(kāi)發(fā)者構(gòu)建具備可定制能力和面向未來(lái)擴(kuò)展性的智能體,廣泛適用于邊緣為中心的應(yīng)用場(chǎng)景。
AI Next
劉世偉 牛津大學(xué)英國(guó)皇家牛頓國(guó)際研究員
劉世偉博士是牛津大學(xué)的英國(guó)皇家學(xué)會(huì)牛頓國(guó)際研究員,曾任美國(guó)德克薩斯大學(xué)奧斯汀分校博士后研究員。他于 2022 年以?xún)?yōu)異成績(jī)獲得荷蘭埃因霍芬理工大學(xué)博士學(xué)位。他的研究目標(biāo)是利用、理解并拓展神經(jīng)網(wǎng)絡(luò)中低維結(jié)構(gòu)的作用,以實(shí)現(xiàn)可擴(kuò)展且高效的人工智能。劉博士曾獲得沙特阿卜杜拉國(guó)王科技大學(xué)(KAUST)和“簡(jiǎn)約性與學(xué)習(xí)大會(huì)”(CPAL)頒發(fā)的兩項(xiàng)新星獎(jiǎng),其博士論文榮獲 Informatics Europe 頒發(fā)的 2023 年度最佳博士論文獎(jiǎng)。
演講議題:大語(yǔ)言模型中的深度詛咒
大語(yǔ)言模型已展現(xiàn)出令人矚目的成果。然而,最新研究表明,它們的深層通常貢獻(xiàn)較小,且隨著層數(shù)加深,模型效果呈現(xiàn)出逐漸減弱的趨勢(shì)。這一現(xiàn)象為模型壓縮提供了重要機(jī)會(huì)。本次研討會(huì)的第一部分將探討如何利用這一特性,實(shí)現(xiàn)高效的大模型推理。盡管存在壓縮潛力,深層利用不足仍導(dǎo)致顯著的資源浪費(fèi),這些資源本可以用于進(jìn)一步提升模型性能。研討會(huì)的第二部分將聚焦于深層失效的根本原因,并提出相應(yīng)的解決方案。我們發(fā)現(xiàn)問(wèn)題源于當(dāng)前廣泛采用的“預(yù)層歸一化”機(jī)制。為此,我們引入了一種新方法:LayerNorm Scaling(LNS),用于解決這一結(jié)構(gòu)性問(wèn)題。實(shí)驗(yàn)結(jié)果表明,LNS 能夠使深層生成更具多樣性的表示,從而更有效地發(fā)揮其作用,顯著提升預(yù)訓(xùn)練模型的整體質(zhì)量,并增強(qiáng)其在下游任務(wù)中的適應(yīng)能力。
張拳石 上海交通大學(xué)副教授
張拳石,上海交通大學(xué)電院計(jì)算機(jī)科學(xué)與工程系長(zhǎng)聘副教授,博士生導(dǎo)師,入選國(guó)家級(jí)海外高層次人才引進(jìn)計(jì)劃,獲 ACM China 新星獎(jiǎng)。他于 2014 年獲得日本東京大學(xué)博士學(xué)位,于 2014-2018 年在加州大學(xué)洛杉磯分校(UCLA)從事博士后研究。張拳石在神經(jīng)網(wǎng)絡(luò)可解釋性方向取得了多項(xiàng)具有國(guó)際影響力的創(chuàng)新性成果。張拳石承擔(dān)了 TMLR 的責(zé)任編輯,CCF-A 類(lèi)會(huì)議 NeurIPS 2024 的領(lǐng)域主席,IJCAI 2020 和 IJCAI 2021 的可解釋性方向的 Tutorial,并先后擔(dān)任了 AAAI 2019, CVPR 2019, ICML 2021 大會(huì)可解釋性方向的分論壇主席。
演講議題:神經(jīng)網(wǎng)絡(luò)是否可以被嚴(yán)謹(jǐn)?shù)亟忉屒宄?Scaling Law 是否會(huì)成為大模型永遠(yuǎn)的桎梏
“模型可解釋性的不足”和“Scaling Law 的桎梏”是深度學(xué)習(xí)領(lǐng)域中兩大瓶頸性問(wèn)題,但是從內(nèi)在機(jī)理層面卻殊途同歸地指向同一根因——對(duì)模型表征能力缺少根本性解釋與建模。目前大部分可解釋性研究依然停留在工程技術(shù)層面,無(wú)法在機(jī)理層面直接解釋模型表征能力。張拳石團(tuán)隊(duì)所提出的基于等效交互可解釋性理論體系,從機(jī)理層面部分解決了上述問(wèn)題,證明了神經(jīng)網(wǎng)絡(luò)內(nèi)在復(fù)雜表征邏輯可以被嚴(yán)謹(jǐn)且全面地概括為稀疏的交互概念,并基于交互概念可以充分解釋神經(jīng)網(wǎng)絡(luò)的性能根因,從而跳出黑盒訓(xùn)練范式,有針對(duì)性地實(shí)時(shí)監(jiān)控并修復(fù)模型表征缺陷,提升訓(xùn)練和測(cè)試效率,擺脫 Scaling Law 的桎梏。
唯偉 bilibili知名繪畫(huà)UP主“有點(diǎn)藝思哦”
唯偉,畢業(yè)于中央美術(shù)學(xué)院,從事審美教育和科普。
演講議題:AI 繪畫(huà)的未來(lái)方向
本次演講將分享 AI 繪畫(huà)當(dāng)下的局限,它和人的思考根本差異是什么,以及未來(lái)會(huì)有哪些方向。
更多精彩議題持續(xù)更新中,歡迎關(guān)注 GOSIM 大會(huì)官網(wǎng)。
九大主題 Workshop 精彩預(yù)告
GOSIM 的 Workshop 動(dòng)手工作坊一直以“多元、實(shí)操、互動(dòng)”著稱(chēng),成為大會(huì)中最受歡迎的版塊之一。每一場(chǎng) Workshop 都將由領(lǐng)域?qū)<規(guī)ьI(lǐng),融合理論講解與實(shí)操環(huán)節(jié),鼓勵(lì)參與者主動(dòng)提問(wèn)、即時(shí)練習(xí),甚至在現(xiàn)場(chǎng)協(xié)作解決實(shí)際問(wèn)題。
Rust Workshop:使用 Embedded Rust 打造 AI 語(yǔ)音對(duì)話(huà)機(jī)器人
主講人:Second State 創(chuàng)始人 Michael Yuan,Second State 工程師、EchoKit 研發(fā)陳思衡
本次 Workshop 將帶你從零開(kāi)始,使用 Rust 構(gòu)建一個(gè)安全、高效的嵌入式 AI 系統(tǒng)。你將親手把 ESP32 硬件變成一個(gè)可語(yǔ)音對(duì)話(huà)的智能機(jī)器人,深入理解 Rust 在嵌入式場(chǎng)景中的獨(dú)特優(yōu)勢(shì)。
課程將覆蓋從 ESP32 SDK 刷機(jī)與設(shè)備初始化、基于 WebSocket 構(gòu)建高性能 Echokit Server、編排 VAD、ASR、LLM 與 TTS 模型,到語(yǔ)音活動(dòng)檢測(cè)(VAD)、流式 TTS、Rust+Wasm 跨平臺(tái)運(yùn)行 LLM,以及進(jìn)階的 MCP Server 構(gòu)建等模塊。
尤其適合對(duì)嵌入式開(kāi)發(fā)、物聯(lián)網(wǎng)、語(yǔ)音交互、邊緣推理或智能體應(yīng)用場(chǎng)景有興趣的開(kāi)發(fā)者與創(chuàng)客參與。為確保順利參與,請(qǐng)準(zhǔn)備一臺(tái)具備一定算力的電腦、Type-C 數(shù)據(jù)線(xiàn),并熟悉 Rust 基本操作。我們也將為報(bào)名者提供完整開(kāi)發(fā)套件(包括 ESP32 開(kāi)發(fā)板、音頻解碼器、麥克風(fēng)、WiFi 模塊),歡迎自帶設(shè)備參與實(shí)踐體驗(yàn)。
其他已確認(rèn)同場(chǎng)活動(dòng):
Cangjie Workshop
SGlang Workshop
Makepad Workshop
Future Web Forum
跨平臺(tái)框架 Workshop
DORA Workshop
更多主題 Workshop 將逐步揭曉~
9 月 13- 14 日,GOSIM HANGZHOU 2025
1500 + 全球一線(xiàn)開(kāi)源開(kāi)發(fā)者
100 + 海內(nèi)外資深專(zhuān)家
100 +優(yōu)質(zhì)技術(shù)分享
5 大技術(shù)論壇
9 場(chǎng)主題 Workshop
3 場(chǎng) Hackathon 創(chuàng)新競(jìng)賽
1 場(chǎng) GOSIM AI for Humanity Spotlight
特別聯(lián)動(dòng) Rust 十周年精彩活動(dòng) RustGlobal + RustChinaConf
大咖云集,內(nèi)容豐富
歡迎親臨現(xiàn)場(chǎng)
與全球開(kāi)源資深大咖面對(duì)面交流!
立即打開(kāi)鏈接或掃碼搶購(gòu):
https://hangzhou2025.gosim.org/zh/tickets/
9 月的杭州,西子湖畔,我們等你共赴一場(chǎng)關(guān)于“開(kāi)源、協(xié)作與未來(lái)”的技術(shù)盛會(huì)!保存下圖,掃碼進(jìn)入官網(wǎng),歡迎提交演講申請(qǐng)、贊助支持以及參會(huì)購(gòu)票即刻加入 GOSIM HANGZHOU 2025!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.