金磊 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
正所謂“得數(shù)據(jù)者得天下”,這家央企算是把高質(zhì)量數(shù)據(jù)集給玩明白了——
超過10萬億tokens的通用大模型語料數(shù)據(jù),以及覆蓋14個關(guān)鍵行業(yè)的專業(yè)數(shù)據(jù)集,總存儲量高達(dá)350TB!
如此龐大的體量,還不是雜亂無章的原始數(shù)據(jù),而是經(jīng)過精心標(biāo)注和優(yōu)化且包含多模態(tài)在內(nèi)的行業(yè)數(shù)據(jù),是隨時可以在行業(yè)里“上崗”的那種。
或許有小伙伴就要問了,這很重要嗎?答案是非常確定的。
高質(zhì)量數(shù)據(jù)集是經(jīng)過采集、加工等數(shù)據(jù)處理,可直接用于開發(fā)和訓(xùn)練人工智能模型,能有效提升模型性能的數(shù)據(jù)的集合。建設(shè)高質(zhì)量數(shù)據(jù)集至關(guān)重要,因?yàn)樗苯記Q定了AI模型的準(zhǔn)確性、泛化性和可用性——優(yōu)質(zhì)數(shù)據(jù)是訓(xùn)練出高效準(zhǔn)確模型的基礎(chǔ)。
重要程度,可見一斑了。
那么這家央企到底是誰?
不賣關(guān)子,它正是AI國家隊(duì)——中國電信天翼AI,其打造的星辰MaaS平臺是建設(shè)高質(zhì)量數(shù)據(jù)集的關(guān)鍵。
星辰MaaS平臺像是一個數(shù)據(jù)精煉廠,通過四大核心協(xié)同運(yùn)作,構(gòu)建“數(shù)據(jù)—模型—服務(wù)”的完整閉環(huán)。
其中,基模作為“動力引擎”,提供基礎(chǔ)認(rèn)知與推理能力;數(shù)據(jù)工具鏈作為“原料庫”,持續(xù)輸送高質(zhì)量的數(shù)據(jù)資源;模型工具鏈作為“加工廠”,將數(shù)據(jù)高效轉(zhuǎn)化為可用模型;智能體作為“執(zhí)行中樞”,靈活調(diào)度資源并自主完成復(fù)雜任務(wù),實(shí)現(xiàn)決策智能化與行為自動化,服務(wù)千行百業(yè)。
基于此,中國電信天翼 AI 與中國電信人工智能研究院(TeleAI)正加緊搞技術(shù)研發(fā),像大模型、智傳網(wǎng)(AI Flow)、具身智能這些基礎(chǔ)技術(shù)都在推進(jìn)。而且不只是搞研究,還照著產(chǎn)業(yè)和實(shí)際場景的需求,把這些技術(shù)做成能用的產(chǎn)品落地。
另外,靠著高質(zhì)量的數(shù)據(jù)集,他們還建了 “三全” 星辰大模型體系——全模態(tài)、全尺寸、全國產(chǎn)。
更厲害的是,已經(jīng)成功做出了萬億參數(shù)的大模型,這個模型是用全國產(chǎn)的萬卡集群和國產(chǎn)深度學(xué)習(xí)框架訓(xùn)練出來的,在國產(chǎn)化創(chuàng)新這塊走在了前面。
例如在福建晉江的一家紡織廠里,過去完全依賴人工肉眼驗(yàn)布,受工人經(jīng)驗(yàn)和熟練程度影響很大,檢測效率、精度穩(wěn)定性差,缺陷檢出率僅有50%。
如今已被基于星辰MaaS平臺打造的AI驗(yàn)布所取代,對于并緯、擦傷、斷經(jīng)、漿塊、經(jīng)向條紋、空織、毛邊、破洞、緯接頭、油點(diǎn)等瑕疵均可高效檢出,通過安裝使用智能驗(yàn)布系統(tǒng),企業(yè)實(shí)現(xiàn)了24小時穩(wěn)定檢測,常見瑕疵檢測準(zhǔn)確率高達(dá)95%以上,并且沉淀了全流程數(shù)據(jù),支持實(shí)時數(shù)據(jù)和歷史數(shù)據(jù)分析,有效發(fā)現(xiàn)業(yè)務(wù)卡點(diǎn)和問題,整體生產(chǎn)效率提升50%以上。
△圖:人工肉眼驗(yàn)布 vs AI驗(yàn)布
但這也僅僅是冰山一角。
因?yàn)?,從繁忙的港口到關(guān)系國計(jì)民生的供應(yīng)鏈,從智慧醫(yī)療到現(xiàn)代農(nóng)業(yè),高質(zhì)量數(shù)據(jù)正在以前所未有的深度和廣度滲透進(jìn)各行各業(yè)。
那么這一切是如何發(fā)生的?在龐大的數(shù)據(jù)藍(lán)圖背后,又蘊(yùn)含著怎樣的戰(zhàn)略考量與技術(shù)雄心?
為了探尋這背后的一切,量子位與中電信人工智能科技(北京)有限公司副總經(jīng)理阮宜龍進(jìn)行了一場深入的交流。
(注:為了準(zhǔn)確體現(xiàn)阮宜龍的觀點(diǎn),下文將盡量呈現(xiàn)完整的對話內(nèi)容。)
為什么要死磕高質(zhì)量數(shù)據(jù)集?
站在AI時代的當(dāng)下,算法、模型、應(yīng)用,可謂是以前所未有的速度在迭代。但萬變不離其宗,數(shù)據(jù),尤其是高質(zhì)量數(shù)據(jù),始終是驅(qū)動人工智能發(fā)展的核心燃料。
中國電信天翼AI作為人工智能行業(yè)的國家隊(duì),為何選擇重倉投入,甚至死磕高質(zhì)量數(shù)據(jù)集這一看似基礎(chǔ)卻極其艱巨的領(lǐng)域?這背后,既有對國家戰(zhàn)略的深刻領(lǐng)會,也有對市場脈搏的精準(zhǔn)把握。
量子位:我們觀察到中國電信天翼AI近年來在高質(zhì)量數(shù)據(jù)集建設(shè)上投入巨大。從戰(zhàn)略層面看,是什么驅(qū)動公司下定決心,要啃下這塊硬骨頭?
阮宜龍:中國電信天翼AI重倉投入數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè),是基于四個層面的綜合考量:國家戰(zhàn)略、市場需求、運(yùn)營商自身的優(yōu)勢稟賦和使命責(zé)任。
在戰(zhàn)略層面,近年來,政府相關(guān)部門快速出臺人工智能系列法規(guī),并深入實(shí)施“人工智能+”行動,這些都清晰表明AI已切實(shí)上升為國家戰(zhàn)略。同時,2025年中國電信加速“云改數(shù)轉(zhuǎn)智惠”戰(zhàn)略升級,布局算力、數(shù)據(jù)、模型、平臺及應(yīng)用等全產(chǎn)業(yè)鏈,尤其在基礎(chǔ)大模型技術(shù)攻堅(jiān)方面,我們致力于成為AI領(lǐng)域的主力軍,推進(jìn)AI邁向普惠發(fā)展新階段,這些都要求我們自主建設(shè)數(shù)據(jù)基礎(chǔ)設(shè)施,實(shí)現(xiàn)依托可控的高質(zhì)量數(shù)據(jù)集,加速AI關(guān)鍵技術(shù)突破,助力AI戰(zhàn)略高效落地。
市場需求方面,我們判斷2025年人工智能將轉(zhuǎn)向以數(shù)據(jù)要素價值為核心的規(guī)?;涞?。對內(nèi),天翼AI有義務(wù)服務(wù)于云網(wǎng)運(yùn)營、客戶服務(wù)、渠道營銷、科技研發(fā)和企業(yè)管理等20余個重點(diǎn)領(lǐng)域復(fù)雜業(yè)務(wù)場景的智能化升級;對外,天翼AI承擔(dān)著面向工業(yè)、應(yīng)急、教育等行業(yè)研發(fā)行業(yè)大模型和構(gòu)建智能體應(yīng)用的職責(zé)。這些AI賦能的實(shí)現(xiàn),依托于高質(zhì)量數(shù)據(jù)集的訓(xùn)練孵化和支撐,要求我們必須投入高質(zhì)量數(shù)據(jù)集的建設(shè)。
從運(yùn)營商自身優(yōu)勢考量,中國電信具有龐大的數(shù)據(jù)基礎(chǔ),擁有超10億的公眾客戶和上千萬的政企客戶,日增數(shù)據(jù)量達(dá)1.6PB、基礎(chǔ)數(shù)據(jù)集超10萬億tokens。同時,在客戶服務(wù)、渠道運(yùn)營等領(lǐng)域,具有廣泛的數(shù)據(jù)應(yīng)用場景,落地1.2萬家全業(yè)務(wù)數(shù)字門店、賦能超2萬個行業(yè)客戶等。依托這些優(yōu)勢,我們能更好地深耕高質(zhì)量數(shù)據(jù)集領(lǐng)域,而這也是當(dāng)前階段的必然選擇。
在使命和責(zé)任方面,中國電信堅(jiān)定履行建設(shè)網(wǎng)絡(luò)強(qiáng)國和數(shù)字中國、維護(hù)網(wǎng)信安全的使命擔(dān)當(dāng),持續(xù)推進(jìn)新型數(shù)字信息基礎(chǔ)設(shè)施建設(shè),推動AI向善、應(yīng)用普惠,助力人工智能同經(jīng)濟(jì)社會發(fā)展深度融合,這要求我們打造安全、可信的高質(zhì)量數(shù)據(jù)集,推進(jìn)數(shù)據(jù)流通交互,賦能千行百業(yè)智能化轉(zhuǎn)型。
如何做到的?
擁有海量數(shù)據(jù)和戰(zhàn)略決心只是第一步,如何將這些龐雜的、多模態(tài)的原始數(shù)據(jù),轉(zhuǎn)化為能夠直接“喂”給大模型的高質(zhì)量數(shù)據(jù),則是一項(xiàng)復(fù)雜的系統(tǒng)工程。
這背后需要一個強(qiáng)大的技術(shù)平臺,一套貫穿數(shù)據(jù)全生命周期的管理方法論。天翼AI打造的“數(shù)據(jù)-模型-服務(wù)”能力閉環(huán),正是解開這道難題的鑰匙。
量子位:這聽起來是一個龐大而復(fù)雜的工程。天翼AI具體是如何將這些來自不同渠道、不同形態(tài)的數(shù)據(jù),加工成高質(zhì)量數(shù)據(jù)集,并最終賦能應(yīng)用的呢?這背后的技術(shù)邏輯是怎樣的?
阮宜龍:這確實(shí)是一個系統(tǒng)性的工程。我們打造了一套覆蓋“采、存、算、管 - 標(biāo)、訓(xùn)、推、評 - 用”全生命周期的能力體系,核心是我們前面提到的星辰MaaS平臺。
△星辰MaaS平臺能力結(jié)構(gòu)示意圖
它的數(shù)據(jù)工具鏈覆蓋“采-存-算-管”鏈路,能統(tǒng)一接入文本、圖片、音視頻等多種類型的數(shù)據(jù),并將其統(tǒng)一高效存儲;在計(jì)算環(huán)節(jié),借助自有的上百種處理工具,實(shí)現(xiàn)對數(shù)據(jù)的清洗、轉(zhuǎn)換、增強(qiáng)與合成;最后通過自動化治理機(jī)制,保障數(shù)據(jù)質(zhì)量與安全。整個過程將原始數(shù)據(jù)高效轉(zhuǎn)化為高質(zhì)量、可復(fù)用的數(shù)據(jù)資產(chǎn),為上層AI應(yīng)用提供穩(wěn)定可靠的數(shù)據(jù)服務(wù)。
這里我想特別提一下數(shù)據(jù)合成技術(shù)。在很多行業(yè),一些極端的、危險的或罕見的場景數(shù)據(jù),在現(xiàn)實(shí)世界中是極難采集的。比如,自動駕駛,你不可能為了采集數(shù)據(jù)去主動制造一場交通事故,這時候,數(shù)據(jù)合成就派上了大用場。星辰MaaS平臺的數(shù)據(jù)工具鏈可以通過AIGC、知識注入、鏈路反思等技術(shù),生成這些極端天氣、罕見事故的數(shù)據(jù)集,讓模型訓(xùn)練得更魯棒、更安全。
它的模型工具鏈覆蓋“標(biāo)-訓(xùn)-推-評”鏈路,不僅支持40多種標(biāo)注任務(wù),更重要的是能基于自研星辰大模型進(jìn)行AI預(yù)標(biāo)注,標(biāo)注人員只需對結(jié)果進(jìn)行校驗(yàn),使得標(biāo)注效率相比傳統(tǒng)純?nèi)斯し绞教嵘?倍以上,極大地降低了成本。標(biāo)注后的數(shù)據(jù)再經(jīng)過嚴(yán)格的質(zhì)量評估,就成了高質(zhì)量數(shù)據(jù)集;這些“精煉燃料”會被送入模型工廠進(jìn)行模型訓(xùn)練、微調(diào)、推理和評測,最終得到的不同用途的大小模型。
平臺在“用”鏈路上,訓(xùn)練出的模型嵌入到智能體中,支撐千行百業(yè)的智能應(yīng)用場景,同時智能體運(yùn)行中產(chǎn)生大量的反饋數(shù)據(jù),通過數(shù)據(jù)回流機(jī)制重新采集加工,進(jìn)一步豐富高質(zhì)量數(shù)據(jù)集,從而持續(xù)優(yōu)化模型效果。
整個過程,從雜亂無章的原始數(shù)據(jù),到標(biāo)準(zhǔn)化的、高質(zhì)量的數(shù)據(jù)集,到能解決實(shí)際問題AI模型服務(wù),再到數(shù)據(jù)回流、模型自優(yōu)化,形成了一個完整高效、自動化、自閉環(huán)的流水線。
標(biāo)準(zhǔn)又是什么?
到底什么樣的數(shù)據(jù)集才稱得上高質(zhì)量?還是數(shù)據(jù)量越大越好,還是數(shù)據(jù)類型越多越好?在與阮宜龍的交流中,我們發(fā)現(xiàn),天翼AI對此有著更為辯證和務(wù)實(shí)的理解。
量子位:大家都說高質(zhì)量數(shù)據(jù)很重要,但似乎每個人對“高質(zhì)量”的定義都不同,您是怎么理解的?
阮宜龍:這是一個很好的問題。我們認(rèn)為,高質(zhì)量并沒有一個放之四海而皆準(zhǔn)的絕對標(biāo)準(zhǔn)。業(yè)內(nèi)一般根據(jù)模型訓(xùn)練階段、數(shù)據(jù)應(yīng)用類型兩個維度來劃分?jǐn)?shù)據(jù)集類型:從模型訓(xùn)練階段看,包括預(yù)訓(xùn)練數(shù)據(jù)集、微調(diào)數(shù)據(jù)集、評測數(shù)據(jù)集;從數(shù)據(jù)應(yīng)用類型看,包括通識數(shù)據(jù)集、行業(yè)通識數(shù)據(jù)集、行業(yè)專識數(shù)據(jù)集。不同階段、不同用途、不同場景的數(shù)據(jù)集,其高質(zhì)量與否的評判標(biāo)準(zhǔn)不能一概而論。
比如,一個用于基礎(chǔ)大模型預(yù)訓(xùn)練的通識數(shù)據(jù)集,我們可能更關(guān)注它的基礎(chǔ)數(shù)據(jù)維度和安全維度指標(biāo),比如規(guī)范性、完整性、一致性、合規(guī)性和可溯源性等。而一個經(jīng)過精細(xì)標(biāo)注,用于特定行業(yè)微調(diào)的數(shù)據(jù)集,我們則會更關(guān)注它的內(nèi)容維度和應(yīng)用維度指標(biāo),比如全面性、多樣性、均衡性,以及是否包含了足夠的行業(yè)專有知識(Know-how)等。
為更好地理解這一點(diǎn),我們可以再深入看看前面提到的工業(yè)紡織缺陷質(zhì)檢案例。傳統(tǒng)的紡織企業(yè)質(zhì)檢,完全依賴人工,靠人眼去發(fā)現(xiàn)布匹上的瑕疵。這種方式有幾個致命痛點(diǎn):速度慢、人工成本高、標(biāo)準(zhǔn)不統(tǒng)一、漏檢率高,而且人會疲勞,無法做到7x24小時不間斷工作。
我們的目標(biāo),就是用AI解決這個真問題。那么,一個高質(zhì)量的紡織行業(yè)缺陷數(shù)據(jù)集應(yīng)該是什么樣的?首先,它的全面性要夠,需要覆蓋行業(yè)內(nèi)常見的20多種瑕疵類型,比如紗結(jié)、污漬、破洞等等;其次,多樣性要豐富,同樣是“污漬”,有油污、水漬、染料漬,形態(tài)大小各異,這些都要包含進(jìn)去;再次,標(biāo)注要精準(zhǔn),不僅要框出瑕疵的位置,還要準(zhǔn)確地分類,告訴模型這具體是哪一類缺陷。
我們通過采集、清洗、標(biāo)注15余萬張圖像,構(gòu)建了這樣一個高質(zhì)量數(shù)據(jù)集。用它訓(xùn)練出的行業(yè)模型,能夠自動識別出布匹上毫米級的瑕疵,綜合檢出率超過90%,并且能實(shí)時將瑕疵的類型、數(shù)量、位置傳輸給生產(chǎn)系統(tǒng),代替了人工。對企業(yè)來說,這就是實(shí)實(shí)在在的降本增效,這個能解決實(shí)際問題的數(shù)據(jù)集,就是高質(zhì)量的。
用起來才是硬道理
當(dāng)前的人工智能領(lǐng)域,存在一種普遍情況:一方面是通用大模型引發(fā)的全民狂歡,另一方面卻是其在垂直行業(yè)落地難、創(chuàng)造實(shí)際價值慢的現(xiàn)實(shí)。
AI的最終價值,不在于數(shù)據(jù)集有多好、模型參數(shù)有多大,而在于能否真正深入產(chǎn)業(yè)一線,解決實(shí)際問題。
天翼AI深諳此道,將應(yīng)用的廣度和深度作為衡量自身價值的核心標(biāo)尺,在服務(wù)大型央國企、國家標(biāo)注基地、政務(wù)、交通、工業(yè)、醫(yī)療、文化旅游、教育等領(lǐng)域上,交出了一份份高分答卷。
量子位:天翼AI有很多大型央企的服務(wù)案例,比如中物流、中車等,他們的系統(tǒng)極其復(fù)雜,對安全性有自身特定的要求。在服務(wù)這些客戶時,有哪些特別的挑戰(zhàn)和應(yīng)對之策?
阮宜龍:您說得很對,大型央企確實(shí)有自身的顯著特征:一是業(yè)務(wù)需求聚焦于生產(chǎn),他們的痛點(diǎn)是如何優(yōu)化成本、提升生產(chǎn)運(yùn)營效率、降低故障率。二是系統(tǒng)復(fù)雜度高,央企有大量分子公司,具備眾多已建成的核心系統(tǒng),AI能力必須與這些現(xiàn)有系統(tǒng)深度融合,這對技術(shù)整合能力要求極高。三是安全和價值觀要求高,因?yàn)檫@些領(lǐng)域都關(guān)系到國計(jì)民生和國家安全,必須堅(jiān)持安全第一,并確保模型與主流價值觀保持一致,且符合國家監(jiān)管要求。四是國產(chǎn)化要求,為保障數(shù)據(jù)安全和系統(tǒng)穩(wěn)定,需從算力、操作系統(tǒng)、中間件、業(yè)務(wù)平臺等多方面,推動構(gòu)建安全、可靠、可控的全國產(chǎn)基礎(chǔ)信息設(shè)施體系。
針對這些特點(diǎn),我們提供端到端的全鏈路解決方案,核心思路是價值導(dǎo)向和敏捷迭代。我們堅(jiān)持與行業(yè)龍頭的一線專家并肩工作,讓技術(shù)服務(wù)于業(yè)務(wù);采用云邊端協(xié)同架構(gòu),滿足不同場景的部署要求;通過數(shù)據(jù)反饋閉環(huán)機(jī)制,讓AI系統(tǒng)能伴隨業(yè)務(wù)共同成長和優(yōu)化。
以服務(wù)物流集團(tuán)為例,我們基于星辰MaaS平臺構(gòu)建AI大模型“標(biāo)訓(xùn)推評”的人工智能套件,納管其超500P國產(chǎn)化算力卡,協(xié)助構(gòu)建了多個物流行業(yè)高質(zhì)量數(shù)據(jù)集,支撐其自研流云大模型及CV模型研發(fā)和建設(shè);為其提供數(shù)十個統(tǒng)一的服務(wù)接口,包含文本、語言、圖片等多場景;通過“算力、數(shù)據(jù)、模型、應(yīng)用”四位一體的模式,賦能其在全國智慧物流場景的應(yīng)用。
量子位:天翼AI支撐了成都、沈陽等多個國家級數(shù)據(jù)標(biāo)注基地的建設(shè),在這個過程中,除了提供技術(shù)平臺,天翼AI還扮演了哪些角色?
阮宜龍:在支撐國家級數(shù)據(jù)標(biāo)注基地的建設(shè)中,我們不僅僅是技術(shù)平臺的提供方,更扮演了三個關(guān)鍵角色:產(chǎn)業(yè)生態(tài)的規(guī)劃者、產(chǎn)能的運(yùn)營者和新職業(yè)的培育者。
作為規(guī)劃者,我們結(jié)合地方產(chǎn)業(yè)特色,比如沈陽的工業(yè)制造、成都的金融醫(yī)療,幫助政府規(guī)劃數(shù)據(jù)產(chǎn)業(yè)生態(tài),定向引入上下游企業(yè),形成產(chǎn)業(yè)聚集效應(yīng)。例如,在成都,我們聯(lián)合新津區(qū)政府、成都數(shù)據(jù)集團(tuán)打造“蓉數(shù)公園?新津數(shù)據(jù)要素服務(wù)站”,重點(diǎn)圍繞金融風(fēng)控數(shù)據(jù)核驗(yàn)、醫(yī)療影像標(biāo)注等場景規(guī)劃生態(tài),已引入整數(shù)智能、路米科技等數(shù)十家標(biāo)注企業(yè)及成都職業(yè)技術(shù)學(xué)院等教研機(jī)構(gòu)。
作為運(yùn)營者,我們不僅提供工具,還會通過自身的項(xiàng)目和生態(tài)網(wǎng)絡(luò),為基地帶來穩(wěn)定可靠的AI數(shù)據(jù)訂單,幫助入駐企業(yè)“有活干”,能夠健康成長。我們將自身政務(wù)熱線升級、工業(yè)質(zhì)檢等項(xiàng)目的標(biāo)注需求定向輸送至基地,其中成都基地承接了四川方言語音標(biāo)注訂單,基于19個地市方言語音大數(shù)據(jù),構(gòu)建了四川方言高質(zhì)量數(shù)據(jù)集。
作為培育者,我們建立了培訓(xùn)認(rèn)證體系,規(guī)模化地培養(yǎng)數(shù)據(jù)標(biāo)注師、AI訓(xùn)練師等數(shù)字化人才,提升基地的整體產(chǎn)業(yè)能力,并促進(jìn)地方就業(yè)。
我們追求的不是短期的項(xiàng)目利潤,而是通過技術(shù)賦能帶動產(chǎn)業(yè)發(fā)展,通過產(chǎn)業(yè)發(fā)展培育出繁榮的AI生態(tài),最終實(shí)現(xiàn)多方共贏的長期價值。目前已形成“政府引導(dǎo)+央企主導(dǎo)+生態(tài)協(xié)同”的可復(fù)制模式,構(gòu)建起“算力供給-數(shù)據(jù)生產(chǎn)-模型訓(xùn)練-應(yīng)用落地”的完整生態(tài)鏈。比如,前面提到的方言標(biāo)注項(xiàng)目既解決了上億非普通話人群的服務(wù)痛點(diǎn),又為地方創(chuàng)造大量靈活就業(yè)崗位。這種生態(tài)繁榮帶來的價值,遠(yuǎn)超過單一項(xiàng)目的短期收益。
量子位:除了服務(wù)大型央企和國家政府,在更廣泛的國計(jì)民生領(lǐng)域,這些高質(zhì)量數(shù)據(jù)集帶來了哪些改變?
阮宜龍:我們目前已經(jīng)在14個行業(yè)、30多個應(yīng)用場景中,構(gòu)建了相應(yīng)的高質(zhì)量數(shù)據(jù)集,實(shí)現(xiàn)了規(guī)?;涞?。
在醫(yī)療領(lǐng)域,我們與北京某三甲醫(yī)院合作,構(gòu)建了醫(yī)院醫(yī)療質(zhì)量管理數(shù)據(jù)集,打造科學(xué)化精細(xì)化智能化醫(yī)院運(yùn)行管理體系,實(shí)現(xiàn)醫(yī)院運(yùn)行管理場景智能化升級,推動院內(nèi)資源高效配置、風(fēng)險精準(zhǔn)防控,賦能公立醫(yī)院高質(zhì)量發(fā)展。
在文旅領(lǐng)域,我們承接了國家文旅部的重點(diǎn)課題,在云南麗江落地的智慧導(dǎo)覽服務(wù),能夠準(zhǔn)確識別超過95%的旅客需求,提升了游客體驗(yàn)。
在農(nóng)業(yè)領(lǐng)域,我們?yōu)樾郯残聟^(qū)打造的“雄小農(nóng)”智能交互應(yīng)用,背后是龐大的農(nóng)業(yè)農(nóng)村數(shù)據(jù)集,它可以解答農(nóng)技問題、預(yù)測農(nóng)產(chǎn)品價格,幫助當(dāng)?shù)剞r(nóng)民實(shí)現(xiàn)了超過15%的增收。
在智慧城市領(lǐng)域,我們聯(lián)合杭州“中國視谷”打造視覺類通識數(shù)據(jù)集,通過視頻共享平臺與自助打標(biāo)工具,已匯聚城市視頻數(shù)據(jù)26萬路、視覺標(biāo)簽2000余個,服務(wù)城市建設(shè)、智能駕駛、低空經(jīng)濟(jì)等多個方向,構(gòu)建視覺數(shù)據(jù)產(chǎn)業(yè)一站式平臺。
在政務(wù)服務(wù)領(lǐng)域,我們與深圳市政數(shù)局合作構(gòu)建12345民生訴求專識數(shù)據(jù)集,基于1200萬條工單記錄,建成520萬條高質(zhì)量語料,支撐25個智能應(yīng)用場景,助力政務(wù)服務(wù)質(zhì)量提升。
在電信內(nèi)部,圍繞中國電信集團(tuán)供應(yīng)鏈采購要求構(gòu)建了行業(yè)通用的供應(yīng)鏈專識數(shù)據(jù)集,依托大模型與多模態(tài)技術(shù),統(tǒng)一標(biāo)注標(biāo)準(zhǔn)、貫通法規(guī)環(huán)節(jié),實(shí)現(xiàn)評標(biāo)流程的智能化升級。
無論是社會治理、城市安全,還是教育、金融,我們的目標(biāo)就是讓高質(zhì)量數(shù)據(jù)真正用起來,深入到社會經(jīng)濟(jì)的毛細(xì)血管中,創(chuàng)造出可感知的價值。
量子位:看起來天翼AI在國計(jì)民生領(lǐng)域落地了很多垂類行業(yè)案例,剛才談到了數(shù)據(jù)工具鏈、模型工具鏈、高質(zhì)量數(shù)據(jù)集等內(nèi)容,此外,還有哪些影響智能服務(wù)真正發(fā)揮效果的關(guān)鍵因素嗎?
阮宜龍:AI行業(yè)有三大關(guān)鍵因素:數(shù)據(jù)、算法、算力。除了數(shù)據(jù)之外,算法也很重要,天翼AI自主打造了國內(nèi)領(lǐng)先的“全模態(tài)、全尺寸、全國產(chǎn)”的星辰系列大模型,并在央企中率先開源,完成了中央網(wǎng)信辦“境內(nèi)深度合成服務(wù)算法備案”和“生成式人工智能服務(wù)”雙備案。
同時,圍繞數(shù)據(jù)治理、模型健壯性、應(yīng)用可信三大核心維度,我們自主研發(fā)的星辰大模型安全圍欄從源頭防范因惡意誘導(dǎo)或模型自身“幻覺”產(chǎn)生的意識形態(tài)問題及被惡意利用風(fēng)險,構(gòu)筑智能化安全防護(hù)矩陣,為自研國產(chǎn)大模型奠定安全基座,守護(hù)安全底線。
打造的語音大模型能精準(zhǔn)識別60種方言并合成逼真語音,極大便利了非普通話人群的溝通;語義大模型參數(shù)規(guī)模龐大,下載量巨大,廣泛賦能政務(wù)、教育等場景;視覺模型在公共安全與災(zāi)害預(yù)警中作用顯著,其鑒偽技術(shù)達(dá)國際領(lǐng)先水平;多模態(tài)模型更實(shí)現(xiàn)了長視頻生成等突破性應(yīng)用,助力內(nèi)容創(chuàng)作創(chuàng)新。
我們以基礎(chǔ)大模型為核心,推出了一系列產(chǎn)品和服務(wù)。面向B端用戶,基于天翼AI開放平臺上線了18項(xiàng)星辰大模型API服務(wù),覆蓋語音、圖像、多模態(tài)等方向,為他們提供以行業(yè)大模型為核心的智能化解決方案;面向C端用戶,天翼AI發(fā)布了可實(shí)現(xiàn)“智能反詐”的“星小辰”應(yīng)用服務(wù),守護(hù)C端用戶通訊安全;面向家庭場景,天翼AI發(fā)布了可實(shí)現(xiàn)智能陪伴的智能玩偶“智伴小熊”;推出AI智能眼鏡,拓寬用戶的日常場景觸達(dá)等一系列覆蓋C端多種場景的軟硬件服務(wù)。
最終愿景
技術(shù)的發(fā)展終將服務(wù)于人與社會。在一場深刻的技術(shù)變革中,一家企業(yè)最終能達(dá)到的高度,往往取決于其愿景的廣度與深度。
對于天翼AI而言,建設(shè)高質(zhì)量數(shù)據(jù)集、打造全棧AI能力,并非終點(diǎn),因?yàn)樗麄兊哪抗?,已?jīng)投向了更遠(yuǎn)的地方。
量子位:最后想請您分享一下,作為人工智能領(lǐng)域的核心力量,您對天翼AI的最終愿景是什么?
阮宜龍:中國電信天翼AI作為人工智能領(lǐng)域的重要力量,我們承載著深遠(yuǎn)的愿景和宏大的目標(biāo)。我們的最終愿景是,發(fā)揮央企在AI領(lǐng)域的主力軍作用,成為國家戰(zhàn)略科技力量和領(lǐng)先的通用人工智能服務(wù)提供商。
為此,我們將持續(xù)發(fā)力:
第一,在技術(shù)上追求領(lǐng)先。我們將繼續(xù)打造全棧自研的AI能力,在前沿領(lǐng)域持續(xù)探索,從基礎(chǔ)大模型到具身智能再到智傳網(wǎng),對標(biāo)國際一流,力爭引領(lǐng)人工智能技術(shù)的發(fā)展潮流。
第二,在應(yīng)用上追求普惠。我們正在構(gòu)建一個“全民工具箱”,依托鑒偽反詐打造網(wǎng)絡(luò)可信空間、打造適老適幼產(chǎn)品彌補(bǔ)智能鴻溝等,讓AI從高精尖的實(shí)驗(yàn)室走進(jìn)千家萬戶,讓每一個普通民眾都能享受到人工智能帶來的便利和福祉。
第三,在生態(tài)上保持開放。我們將通過開放平臺,以算力服務(wù)、扶持計(jì)劃等政策,支持和歡迎全球的開發(fā)者、學(xué)者和合作伙伴,共同參與到這個生態(tài)的建設(shè)中來,共同推動人工智能產(chǎn)業(yè)的健康發(fā)展。
第四,在人才上研用一體。重視青年人才創(chuàng)新能力發(fā)展,營造寬松的科研環(huán)境,加速科研成果轉(zhuǎn)化為實(shí)際生產(chǎn)力,促進(jìn)關(guān)鍵領(lǐng)域產(chǎn)業(yè)升級,為國家培養(yǎng)一批懂理論、能實(shí)踐的高層次AI隊(duì)伍。
在未來的數(shù)字化經(jīng)濟(jì)戰(zhàn)場中,中國電信天翼AI將繼續(xù)做好產(chǎn)業(yè)升級的核心引擎和社會安全的基石。作為AI國家隊(duì),我們將持續(xù)強(qiáng)化賦能,打造更多高價值的行業(yè)大模型和產(chǎn)品;同時,我們也將擔(dān)起社會責(zé)任,構(gòu)建完善的安全防護(hù)體系,確保數(shù)字經(jīng)濟(jì)的紅利能夠全民共享,維護(hù)社會的公平與安全。
這既是我們的目標(biāo),也是我們的承諾。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.