夜夜躁很很躁日日躁麻豆,精品人妻无码,制服丝袜国产精品,成人免费看www网址入口

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

智源研究院揭秘具身智能數(shù)據(jù)治理新路徑

0
分享至



未來(lái)將出現(xiàn)專(zhuān)業(yè)的具身數(shù)據(jù)服務(wù)機(jī)構(gòu),提供“場(chǎng)景定制采集+數(shù)據(jù)治理+模型訓(xùn)練支持”的一體化服務(wù)。

文|錢(qián)麗娜

ID | BMR2004

“在人工智能技術(shù)飛速發(fā)展的今天,數(shù)據(jù)作為核心生產(chǎn)要素,其治理水平直接決定著大模型的性能與產(chǎn)業(yè)落地的深度?!北本┲窃慈斯ぶ悄苎芯吭焊痹洪L(zhǎng)兼總工程師林詠華在2025世界人工智能大會(huì)暨人工智能全球治理高級(jí)別會(huì)議(簡(jiǎn)稱(chēng)WAIC 2025)期間,接受《商學(xué)院》雜志專(zhuān)訪時(shí)表示。

作為國(guó)內(nèi)人工智能領(lǐng)域的領(lǐng)軍機(jī)構(gòu),智源研究院在數(shù)據(jù)治理領(lǐng)域深耕多年,構(gòu)建了一套涵蓋審查標(biāo)準(zhǔn)、管理規(guī)范、創(chuàng)新應(yīng)用的完整體系。從開(kāi)源數(shù)據(jù)的質(zhì)量管控到具身智能的特殊數(shù)據(jù)治理,從多元數(shù)據(jù)使用模式到未來(lái)商業(yè)模式探索,智源的實(shí)踐為行業(yè)提供了寶貴的參考樣本,也深刻揭示了數(shù)據(jù)治理在智能時(shí)代的核心價(jià)值。

01

數(shù)據(jù)審查:以技術(shù)筑起質(zhì)量與安全防線

開(kāi)源數(shù)據(jù)因質(zhì)量參差不齊、采集基準(zhǔn)缺失等問(wèn)題廣受詬病,建立科學(xué)的數(shù)據(jù)審查標(biāo)準(zhǔn)成為行業(yè)亟待解決的難題。

智源研究院從隱私保護(hù)、質(zhì)量過(guò)濾、安全管控三個(gè)維度,構(gòu)建了全流程的數(shù)據(jù)審查體系,為高質(zhì)量數(shù)據(jù)應(yīng)用奠定了基礎(chǔ)。

在隱私保護(hù)方面,智源對(duì)所有采集的數(shù)據(jù)實(shí)行“雙重篩查”機(jī)制。對(duì)于合作方提供的數(shù)據(jù)集,首先區(qū)分其使用權(quán)限——哪些可用于模型訓(xùn)練但不可開(kāi)源,哪些可部分開(kāi)源,哪些完全禁止對(duì)外披露。例如,某企業(yè)提供的用戶行為數(shù)據(jù),經(jīng)過(guò)脫敏處理后可用于模型訓(xùn)練,但原始數(shù)據(jù)因涉及個(gè)人隱私被嚴(yán)格限制在內(nèi)部使用。這種分類(lèi)處理既保障了數(shù)據(jù)的利用價(jià)值,又守住了隱私保護(hù)的紅線。

數(shù)據(jù)質(zhì)量過(guò)濾則依托技術(shù)手段實(shí)現(xiàn)標(biāo)準(zhǔn)化。2023年初,智源研究院承擔(dān)國(guó)家級(jí)高質(zhì)量語(yǔ)料庫(kù)建設(shè)與開(kāi)源任務(wù)時(shí),便意識(shí)到人工審核存在標(biāo)準(zhǔn)不統(tǒng)一、效率低下的問(wèn)題。為此,研究院訓(xùn)練出質(zhì)量過(guò)濾模型,構(gòu)建起完善的算法庫(kù),通過(guò)機(jī)器審核實(shí)現(xiàn)數(shù)據(jù)質(zhì)量的統(tǒng)一把控。當(dāng)遇到新的數(shù)據(jù)質(zhì)量問(wèn)題時(shí),算法庫(kù)會(huì)迅速迭代更新,將新規(guī)則納入模型訓(xùn)練中。例如,在處理文本數(shù)據(jù)時(shí),模型能自動(dòng)識(shí)別并過(guò)濾掉重復(fù)內(nèi)容、低信息密度文本以及涉黃、涉毒等違規(guī)信息,確保入庫(kù)數(shù)據(jù)的純凈度。

安全管控貫穿數(shù)據(jù)審查的全流程。除了常見(jiàn)的內(nèi)容安全篩查,智源還針對(duì)不同數(shù)據(jù)類(lèi)型制定了專(zhuān)項(xiàng)審查標(biāo)準(zhǔn)。對(duì)于多模態(tài)數(shù)據(jù)中的圖像、視頻,增加了對(duì)敏感場(chǎng)景、標(biāo)識(shí)信息的識(shí)別;對(duì)于工業(yè)場(chǎng)景采集的數(shù)據(jù),重點(diǎn)排查是否涉及企業(yè)商業(yè)機(jī)密。這種全方位的審查機(jī)制,為數(shù)據(jù)的安全合規(guī)使用提供了堅(jiān)實(shí)保障。

林詠華同時(shí)也表示:“實(shí)際上我們?cè)谑褂脭?shù)據(jù)時(shí),很多時(shí)候我們發(fā)現(xiàn)匯聚數(shù)據(jù)容易,但使用數(shù)據(jù)卻變成整個(gè)產(chǎn)業(yè)的問(wèn)題?!?/p>

02

管理規(guī)范:創(chuàng)新數(shù)據(jù)使用模式破解產(chǎn)業(yè)難題

智源研究院在2024年聯(lián)合產(chǎn)業(yè)機(jī)構(gòu)推出三種數(shù)據(jù)使用模式,通過(guò)開(kāi)源共享、共建共享、數(shù)算一體的多元模式,破解數(shù)據(jù)流通與保護(hù)的難題。具體來(lái)看:

開(kāi)源數(shù)據(jù)模式聚焦科研與產(chǎn)業(yè)普惠。智源將可開(kāi)放的數(shù)據(jù)打包發(fā)布,支持學(xué)術(shù)界和產(chǎn)業(yè)界免費(fèi)下載使用。

共建共享模式以積分制激發(fā)數(shù)據(jù)流通活力。針對(duì)不愿開(kāi)源但愿意在可信機(jī)構(gòu)間交換數(shù)據(jù)的企業(yè),智源設(shè)計(jì)了一套基于數(shù)據(jù)質(zhì)量和數(shù)量的積分體系——企業(yè)貢獻(xiàn)的數(shù)據(jù)經(jīng)質(zhì)量評(píng)估后轉(zhuǎn)化為積分,積分可用于兌換其他企業(yè)的共享數(shù)據(jù)。這種模式既保護(hù)了數(shù)據(jù)所有權(quán),又打破了“數(shù)據(jù)壁壘”。

數(shù)算一體模式則為版權(quán)要求高的數(shù)據(jù)提供安全使用方案,數(shù)據(jù)和算力放在一起。對(duì)于來(lái)自影視作品的高質(zhì)量的視頻和音頻數(shù)據(jù),智源構(gòu)建了“數(shù)據(jù)與算力綁定”的安全域,特定團(tuán)隊(duì)可在安全域內(nèi)使用數(shù)據(jù)訓(xùn)練模型,但數(shù)據(jù)本身不可帶出,訓(xùn)練成果(模型)則可自主帶走。這種模式在保護(hù)版權(quán)的同時(shí),也實(shí)現(xiàn)了數(shù)據(jù)的高效利用。

三種模式的協(xié)同推進(jìn),形成了“分層分類(lèi)、安全可控”的數(shù)據(jù)管理生態(tài)。這種生態(tài)既滿足了不同類(lèi)型數(shù)據(jù)的使用需求,又通過(guò)規(guī)范的流程設(shè)計(jì),降低了數(shù)據(jù)泄露、濫用的風(fēng)險(xiǎn),為數(shù)據(jù)要素的市場(chǎng)化配置提供了重要支撐。

03

具身智能:數(shù)據(jù)治理的新挑戰(zhàn)與新突破

隨著具身智能的興起,數(shù)據(jù)治理進(jìn)入更為復(fù)雜的新階段。與傳統(tǒng)大模型相比,具身智能的數(shù)據(jù)具有多模態(tài)、高維度、場(chǎng)景敏感等特點(diǎn),智源研究院在繼承傳統(tǒng)治理經(jīng)驗(yàn)的基礎(chǔ)上,創(chuàng)新出一套適配具身智能的數(shù)據(jù)治理方法,為該領(lǐng)域的技術(shù)突破掃清了障礙。

林詠華指出,具身智能的數(shù)據(jù)多樣性遠(yuǎn)超普通多模態(tài)模型。以機(jī)械臂數(shù)據(jù)為例,除了攝像頭采集的視頻信息,還涉及機(jī)械臂的運(yùn)動(dòng)軌跡、多自由度(XYZ軸)數(shù)據(jù)、加速度數(shù)據(jù)等傳感器信息。除了上述的單機(jī)數(shù)據(jù)采集,工程師還要跨機(jī)器人本體采集數(shù)據(jù),增加了設(shè)備數(shù)據(jù)的采集,同時(shí)為了在真實(shí)場(chǎng)景中采集數(shù)據(jù),公司還在實(shí)驗(yàn)室里搭建仿真場(chǎng)景??梢哉f(shuō),具身智能的數(shù)據(jù)維度增加,格式各異,傳統(tǒng)的分類(lèi)方法難以應(yīng)對(duì)。

場(chǎng)景敏感性是具身智能數(shù)據(jù)治理的另一大挑戰(zhàn)。在工業(yè)場(chǎng)景采集數(shù)據(jù)時(shí),部分企業(yè)因擔(dān)心流水線作業(yè)流程泄露,對(duì)數(shù)據(jù)采集持保守態(tài)度。智源通過(guò)“物理場(chǎng)景分級(jí)”策略解決這一問(wèn)題。

智源為此建立了“行業(yè)+場(chǎng)景+操作復(fù)雜度” 的三維分類(lèi)體系:按行業(yè)劃分為工業(yè)、家庭服務(wù)、醫(yī)療等領(lǐng)域;按場(chǎng)景細(xì)分為廚房操作、流水線作業(yè)等具體場(chǎng)景;按操作復(fù)雜度分為原子操作(如幾秒之內(nèi)的一個(gè)抓取動(dòng)作)、長(zhǎng)程操作(如疊衣服,涉及多個(gè)步驟)、復(fù)雜組合操作(如整理房間的指令中涉及到疊衣服、整理被子、掃地等不同的操作)。

數(shù)據(jù)采集效率是制約具身智能發(fā)展的關(guān)鍵瓶頸。具身數(shù)據(jù)的采集依賴(lài)硬件設(shè)備,不同構(gòu)型的機(jī)械臂(單臂、雙臂、輪式等)、不同類(lèi)型的末端執(zhí)行器(夾爪、靈巧手等),都需要針對(duì)性的采集方案。此外,遙操過(guò)程中的視角差異、設(shè)備校準(zhǔn)誤差,進(jìn)一步降低了采集效率。目前有一些解決方案,包括開(kāi)發(fā)VR映射校準(zhǔn)系統(tǒng)等。

具身智能的數(shù)據(jù)治理創(chuàng)新,不僅解決了該領(lǐng)域的技術(shù)痛點(diǎn),更拓展了數(shù)據(jù)治理的邊界。這種創(chuàng)新證明,數(shù)據(jù)治理必須與具體技術(shù)場(chǎng)景深度融合,才能真正發(fā)揮支撐作用。

04

仿真數(shù)據(jù):平衡真實(shí)與效率的治理探索

仿真合成數(shù)據(jù)的價(jià)值與局限,是行業(yè)爭(zhēng)論的焦點(diǎn)。智源研究院在實(shí)踐中形成了以“真機(jī)數(shù)據(jù)為核心、仿真數(shù)據(jù)為補(bǔ)充”的治理思路,通過(guò)二者的有機(jī)融合,既保證了數(shù)據(jù)的真實(shí)性,又提升了數(shù)據(jù)的覆蓋范圍,為模型訓(xùn)練提供了更豐富的“養(yǎng)料”。

“真機(jī)采集很難構(gòu)造所有的場(chǎng)景,所以這就是為什么大家覺(jué)得仿真數(shù)據(jù)很重要。但是仿真數(shù)據(jù)也有仿真不了的場(chǎng)景,例如真實(shí)物體的重量、摩擦力、質(zhì)感等物理特性?!绷衷伻A說(shuō)。

仿真數(shù)據(jù)的價(jià)值在于“場(chǎng)景泛化”。通過(guò)數(shù)據(jù)增強(qiáng)技術(shù),智源將單一真機(jī)數(shù)據(jù)擴(kuò)展出多種場(chǎng)景變體:改變光線強(qiáng)度、替換背景顏色、調(diào)整物體擺放角度等。這種處理使得一條原始數(shù)據(jù)可生成多條有效訓(xùn)練數(shù)據(jù),大幅提升了數(shù)據(jù)的利用效率。

真機(jī)數(shù)據(jù)與仿真數(shù)據(jù)的融合是治理的關(guān)鍵。智源探索出“物理屬性保真+場(chǎng)景靈活替換”的融合策略:保留真機(jī)數(shù)據(jù)中的物理參數(shù)(如力量、速度),通過(guò)仿真技術(shù)替換場(chǎng)景背景、物體外觀等非關(guān)鍵信息。這種方法既保證了數(shù)據(jù)的物理真實(shí)性,又拓展了場(chǎng)景覆蓋范圍。

數(shù)據(jù)治理的終極目標(biāo)是釋放數(shù)據(jù)價(jià)值。智源研究院在夯實(shí)治理基礎(chǔ)的同時(shí),積極探索具身數(shù)據(jù)服務(wù)的商業(yè)模式,推動(dòng)公共平臺(tái)建設(shè),為數(shù)據(jù)要素的規(guī)?;瘧?yīng)用描繪了清晰的路徑。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
2026年1月1日正式施行!生活噪音歸公安管 不再警告+罰款 改為最高10日拘留

2026年1月1日正式施行!生活噪音歸公安管 不再警告+罰款 改為最高10日拘留

閃電新聞
2025-10-28 15:38:22
金價(jià),跌破3900美元!大學(xué)女生下跌時(shí)補(bǔ)倉(cāng),結(jié)果虧得更多,專(zhuān)家提醒:黃金不是暴富工具

金價(jià),跌破3900美元!大學(xué)女生下跌時(shí)補(bǔ)倉(cāng),結(jié)果虧得更多,專(zhuān)家提醒:黃金不是暴富工具

每日經(jīng)濟(jì)新聞
2025-10-28 17:53:26
前國(guó)腳怒批主裁:申花壓哨獲點(diǎn)太牽強(qiáng)!沒(méi)黑幕就是業(yè)務(wù)水平不行

前國(guó)腳怒批主裁:申花壓哨獲點(diǎn)太牽強(qiáng)!沒(méi)黑幕就是業(yè)務(wù)水平不行

奧拜爾
2025-10-28 19:52:53
A股:股民要做好下車(chē)準(zhǔn)備,信號(hào)非常明顯,周三將迎來(lái)新的變盤(pán)?

A股:股民要做好下車(chē)準(zhǔn)備,信號(hào)非常明顯,周三將迎來(lái)新的變盤(pán)?

有范又有料
2025-10-28 16:47:57
上海搶金店的,果然是可憐人!37歲無(wú)業(yè),砸柜臺(tái)玻璃后全程無(wú)反抗

上海搶金店的,果然是可憐人!37歲無(wú)業(yè),砸柜臺(tái)玻璃后全程無(wú)反抗

火山詩(shī)話
2025-10-28 05:27:15
佘詩(shī)曼爆干爹許紹雄的臨終遺愿!留過(guò)億家產(chǎn)給女兒,去世時(shí)很安詳

佘詩(shī)曼爆干爹許紹雄的臨終遺愿!留過(guò)億家產(chǎn)給女兒,去世時(shí)很安詳

一只番茄魚(yú)
2025-10-28 16:42:51
41款進(jìn)口藥退出中國(guó)

41款進(jìn)口藥退出中國(guó)

藥智網(wǎng)網(wǎng)易號(hào)
2025-10-28 10:27:38
就在今天!楊瀚森再創(chuàng)生涯新紀(jì)錄,開(kāi)拓者大勝湖人,殺進(jìn)西部前八

就在今天!楊瀚森再創(chuàng)生涯新紀(jì)錄,開(kāi)拓者大勝湖人,殺進(jìn)西部前八

侃球熊弟
2025-10-28 11:12:59
雷軍回應(yīng)小字爭(zhēng)議,一切都結(jié)束了

雷軍回應(yīng)小字爭(zhēng)議,一切都結(jié)束了

廣告案例精選
2025-10-28 14:44:04
港劇“金牌綠葉”許紹雄逝世,享年76歲

港劇“金牌綠葉”許紹雄逝世,享年76歲

澎湃新聞
2025-10-28 11:14:40
俄烏紅軍村殊死血戰(zhàn),聯(lián)合國(guó)認(rèn)定俄羅斯犯有戰(zhàn)爭(zhēng)罪

俄烏紅軍村殊死血戰(zhàn),聯(lián)合國(guó)認(rèn)定俄羅斯犯有戰(zhàn)爭(zhēng)罪

史政先鋒
2025-10-28 16:49:02
曝“第一軟飯男”李春平去世,伺候美國(guó)老婦13年,繼承268億財(cái)產(chǎn)

曝“第一軟飯男”李春平去世,伺候美國(guó)老婦13年,繼承268億財(cái)產(chǎn)

180視角
2025-10-28 15:44:13
初三女生在校被同學(xué)毆打13次,后確診精神分裂?警方處打人者行拘不予執(zhí)行,校方、教科局回應(yīng)

初三女生在校被同學(xué)毆打13次,后確診精神分裂?警方處打人者行拘不予執(zhí)行,校方、教科局回應(yīng)

大風(fēng)新聞
2025-10-28 18:39:21
現(xiàn)貨黃金跌破3900美元/盎司

現(xiàn)貨黃金跌破3900美元/盎司

財(cái)聯(lián)社
2025-10-28 17:00:10
向太評(píng)價(jià)許家?。捍蚺朴寐榇b現(xiàn)金,輸了上千萬(wàn),早晚會(huì)破產(chǎn)

向太評(píng)價(jià)許家?。捍蚺朴寐榇b現(xiàn)金,輸了上千萬(wàn),早晚會(huì)破產(chǎn)

聚焦真實(shí)瞬間
2025-10-28 12:38:25
炒股牛人30萬(wàn)本金賺到10億,媽媽過(guò)生日轉(zhuǎn)賬1000萬(wàn)慶生

炒股牛人30萬(wàn)本金賺到10億,媽媽過(guò)生日轉(zhuǎn)賬1000萬(wàn)慶生

微微熱評(píng)
2025-10-28 11:34:11
試射核導(dǎo)彈后,俄羅斯廢除核安全相關(guān)協(xié)議 特朗普:美國(guó)核潛艇就在俄海岸附近

試射核導(dǎo)彈后,俄羅斯廢除核安全相關(guān)協(xié)議 特朗普:美國(guó)核潛艇就在俄海岸附近

紅星新聞
2025-10-28 18:40:25
荒唐!韓國(guó)剛對(duì)中國(guó)免簽,就有人脫團(tuán)!澳洲20人團(tuán)全逃,20萬(wàn)押金都不要了!

荒唐!韓國(guó)剛對(duì)中國(guó)免簽,就有人脫團(tuán)!澳洲20人團(tuán)全逃,20萬(wàn)押金都不要了!

最英國(guó)
2025-10-28 19:35:46
某國(guó)企領(lǐng)導(dǎo),被干崩潰了!

某國(guó)企領(lǐng)導(dǎo),被干崩潰了!

地產(chǎn)八卦
2025-10-28 06:07:19
雷軍回應(yīng)“小字”爭(zhēng)議,全網(wǎng)破大防了!

雷軍回應(yīng)“小字”爭(zhēng)議,全網(wǎng)破大防了!

財(cái)經(jīng)三分鐘pro
2025-10-28 12:21:59
2025-10-28 22:35:00
商學(xué)院雜志 incentive-icons
商學(xué)院雜志
本號(hào)由《中國(guó)經(jīng)營(yíng)報(bào)》社有限公司主辦,為商業(yè)領(lǐng)袖提供管理實(shí)踐與方法
6952文章數(shù) 22716關(guān)注度
往期回顧 全部

科技要聞

30000人,一夜失業(yè)!亞馬遜AI“砍刀”落下

頭條要聞

6人參加葬禮時(shí)被倒塌圍墻砸死:雨篷積水過(guò)重拉倒圍墻

頭條要聞

6人參加葬禮時(shí)被倒塌圍墻砸死:雨篷積水過(guò)重拉倒圍墻

體育要聞

巴西主帥一上任,先給楊瀚森打了個(gè)叉?

娛樂(lè)要聞

76歲歡喜哥去世!眾星悼念

財(cái)經(jīng)要聞

信息量巨大!“十五五”規(guī)劃建議發(fā)布

汽車(chē)要聞

增程方盒子 可城又可野 試駕奇瑞風(fēng)云X3L

態(tài)度原創(chuàng)

手機(jī)
房產(chǎn)
時(shí)尚
親子
游戲

手機(jī)要聞

努比亞張雷透露 12 月要上一款“國(guó)民游戲機(jī)”

房產(chǎn)要聞

太猛了!狂賣(mài)1194億!海南樓市,創(chuàng)7年新高!

50+女人聽(tīng)我一句勸,別穿大紅大紫和超短裙,才能優(yōu)雅到老

親子要聞

美贊臣發(fā)布兒童奶粉科學(xué)實(shí)證新成果

頭回見(jiàn)!一個(gè)游戲開(kāi)服,能讓玩家狂熱到如此地步

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 亚洲男人综合久久综合天堂| 国产最新无码专区在线| 日韩小电影网站| 中文字幕亚洲综合久久菠萝蜜| 日本成人午夜在线观看| 97狠狠操| 国产精品毛片久久久久久久AV| 人妻无码中文专区久久av| 91人妻人人做人碰人人爽| 日韩A级毛片无码免费| 456视频亚洲| 久久久久久精品免费免费WEI | 果冻传媒亚洲区二期| 强行糟蹋人妻hd中文| 红杏AV一区二区三区| 最新版天堂资源中文官网| 久久亚洲私人国产精品| 爆乳中文国产诱惑内射| 少妇人妻偷人精品无码视频新浪| 性少妇videosexfreexxxx片| 久99视频精品免费观看福利| 亚洲精品亚洲人成在线下载| 亚洲和欧洲一码二码区别在| 日本熟妇色xxxxx日本免费看| 亚洲一区高清无码| 在线观看亚洲最大成年网址| 成人免费毛片免费在线观看| 国产香蕉一区二区三区在线视频| 影院一区二区三区| 亚洲欧洲免费无限码| 天天操夜夜操| 精彩内射黑屄P18| 成人无码小视频在线观看| 美女视频黄是免费| av在线更新| 久久久久久久9精品视频| 无码人妻aⅴ一区二区三区鲁大师| 亚洲AV无码乱码国产麻豆| 亚洲熟女AVvvvv| 国产伦人人人人人人性| 国产成人精品视屏|