“當(dāng)模型軍備競賽陷入瓶頸,數(shù)據(jù)成為巨頭爭奪的下一個高地。
近日,Meta以148億美元收購AI初創(chuàng)公司Scale AI的49%股份,這一交易將創(chuàng)下私營公司融資交易的歷史新紀(jì)錄。Scale AI是一家快速崛起的數(shù)據(jù)標(biāo)注公司,擁有50多萬遍布世界各地的員工,從事數(shù)據(jù)標(biāo)注工作。這一重磅新聞釋放了一個信號:數(shù)據(jù)在AI競賽中的戰(zhàn)略地位越發(fā)凸顯——當(dāng)模型軍備競賽陷入瓶頸,數(shù)據(jù)成為巨頭爭奪的下一個高地。
在這場由數(shù)據(jù)驅(qū)動、大模型實(shí)現(xiàn)、算力支撐的智能革命里,市場上幾乎所有人都在攢模型、買算力,數(shù)據(jù)逐漸成為了這個“大三角”最薄弱的一環(huán)。
AI時代,一道悄然樹立的“硅幕”
作家尤瓦爾·赫拉利指出,隨著人工智能的快速發(fā)展,一道“硅幕”正在落下。這道“硅幕”不僅是企業(yè)之間,在企業(yè)內(nèi)部同樣顯著。
☆數(shù)據(jù)割裂與治理缺位:惡性循環(huán)的根源
過去十年數(shù)字化系統(tǒng)的膨脹埋下隱患:業(yè)務(wù)、系統(tǒng)、部門間形成數(shù)據(jù)孤島。其根源在于支撐工具鏈的深度割裂——數(shù)據(jù)采集、存儲、處理、分析、建模、應(yīng)用等環(huán)節(jié)采用互不聯(lián)通的不同工具。這種割裂制造了人為“斷點(diǎn)”,導(dǎo)致數(shù)據(jù)流動受阻、價(jià)值難以整合:看似各環(huán)節(jié)工具“完整”,卻因無法協(xié)同而失效。
工具鏈的斷裂必然引發(fā)數(shù)據(jù)治理缺位。一方面源于戰(zhàn)略輕視(在很多企業(yè)數(shù)據(jù)治理被視為“成本部門”的臟活累活);另一方面受制于能力不足——將散碎數(shù)據(jù)轉(zhuǎn)化為標(biāo)準(zhǔn)化的“數(shù)據(jù)資產(chǎn)”面臨取數(shù)、治數(shù)、用數(shù)三重挑戰(zhàn)。治理“失能”不僅使數(shù)據(jù)無法支撐動態(tài)業(yè)務(wù),更會導(dǎo)致治理結(jié)果與業(yè)務(wù)脫節(jié)。
企業(yè)由此陷入 “高投入、低產(chǎn)出” 困局,加深決策層疑慮,最終形成惡性循環(huán):數(shù)據(jù)鏈路斷裂->價(jià)值損耗->AI決策失效->治理投入削減。打破循環(huán)不能僅靠意識覺醒,需要找到病根對癥下藥。
☆千頭萬緒一根針:數(shù)用一體是破局關(guān)鍵
數(shù)據(jù)治理問題根源在于傳統(tǒng)的 “建用分離” 模式,致業(yè)務(wù)與數(shù)據(jù)系統(tǒng) “兩張皮”,如果不從底層顛覆這個運(yùn)行模式,數(shù)據(jù)治理工作將是緣木求魚。
產(chǎn)業(yè)界急需一場深層變革。數(shù)睿數(shù)據(jù)提出的“數(shù)用一體化” 方法論,提供了一條嶄新路徑。其核心理念是打破工具壁壘,將數(shù)據(jù)采集等全流程置于統(tǒng)一連貫平臺,并實(shí)現(xiàn)深度工具融合,使得數(shù)據(jù)從源頭可治理、復(fù)用,從而支撐高效自動化建模。這一全新模式從根源上突破了業(yè)務(wù)與數(shù)據(jù)“兩張皮”的困境,將數(shù)據(jù)價(jià)值直接嵌入到業(yè)務(wù)流程中,穿越“硅幕”,實(shí)現(xiàn)從數(shù)據(jù)支撐應(yīng)用,應(yīng)用支撐業(yè)務(wù)創(chuàng)新的跨越。
“數(shù)用一體化”的理念引人注目,但關(guān)鍵在于能否落地。數(shù)睿數(shù)據(jù)近期發(fā)布了smardaten2.0平臺,致力于將軟件工程、數(shù)據(jù)工程與AI工程化融為一體。smardaten2.0平臺的問世,也將“數(shù)用一體化”推向了新的高度。我們就以此為出發(fā)點(diǎn),探察“數(shù)用一體化”與產(chǎn)業(yè)會產(chǎn)生怎樣的化學(xué)反應(yīng)。
AI解鎖醫(yī)療數(shù)據(jù)的深層價(jià)值
自從OpenAI推出GPT-4,整個世界就進(jìn)入到大模型時刻。大模型的到來深刻改變了數(shù)據(jù)生態(tài),同時也深度塑造了AI的產(chǎn)業(yè)化進(jìn)程。
在此背景下,數(shù)睿數(shù)據(jù)率先踏入無代碼領(lǐng)域的大模型時代。其標(biāo)志性成果是融入生成式AI能力的smardaten 2.0平臺。該平臺基于全域?qū)崟r數(shù)據(jù),通過“低代碼+AI”驅(qū)動技術(shù)民主化,實(shí)現(xiàn)業(yè)務(wù)敏捷響應(yīng),并在應(yīng)用生成、意圖識別與命令執(zhí)行、深度知識檢索等方面實(shí)現(xiàn)能力躍升。
1.數(shù)據(jù)治理智能化:從“人工追數(shù)”到“AI主動管數(shù)”
smardaten 2.0依托 “專家知識庫+AI雙引擎”,推動數(shù)據(jù)治理從低效人工模式轉(zhuǎn)向智能化,加速數(shù)據(jù)資產(chǎn)標(biāo)準(zhǔn)化:
·AI語義映射替代人工比對:某市衛(wèi)健委想通過全民健康信息平臺,為市民提供更加完善的公共服務(wù)。但平臺涉及幾十家醫(yī)院,存在數(shù)據(jù)標(biāo)準(zhǔn)不一、數(shù)據(jù)集成統(tǒng)一復(fù)雜等挑戰(zhàn)。數(shù)睿數(shù)據(jù)借助60+醫(yī)療數(shù)據(jù)模型知識庫,自動識別同義表述并映射標(biāo)準(zhǔn)字段。如市衛(wèi)健委45家醫(yī)院 “血糖指標(biāo)” 的11種說法,AI將單家醫(yī)院標(biāo)準(zhǔn)化時間從3個月縮至8小時,技術(shù)門檻降70%;
·主動規(guī)則引擎適配標(biāo)準(zhǔn)迭代:將治理規(guī)則與業(yè)務(wù)場景綁定,醫(yī)療ICD編碼更新時,AI自動掃描并批量更新,某三甲醫(yī)院應(yīng)對 “長新冠” 編碼更新,時間從14天縮至40分鐘,無需人工操作;
·NLP解析釋放非結(jié)構(gòu)化數(shù)據(jù)價(jià)值:通過自然語言處理將病歷文本轉(zhuǎn)為結(jié)構(gòu)化數(shù)據(jù),某區(qū)域醫(yī)療數(shù)據(jù)利用率從30%提至85%,為AI輔助診斷提供支持。
可以看到,數(shù)據(jù)治理智能化帶來了效率的極大提升,并大幅降低了人工操作的環(huán)節(jié)。但必須說明的是,數(shù)據(jù)治理智能化的價(jià)值并非是為了替代人,而是讓治理轉(zhuǎn)為業(yè)務(wù)支撐,實(shí)現(xiàn) “治理-分析-決策” 一步到位。
2.主動治理:從“消防員”到“領(lǐng)航員”
“數(shù)用一體化”的另一重要優(yōu)勢是實(shí)現(xiàn)了數(shù)據(jù)的主動治理。很多企業(yè)數(shù)字治理采用的是事后補(bǔ)救,被動治理為主的模式。在瞬息萬變的數(shù)字時代,這樣的模式很顯然是存在巨大隱患的。
繼續(xù)以衛(wèi)健委為例,面對醫(yī)療數(shù)據(jù)的高敏感性和頻繁更新的規(guī)范(如ICD-11編碼),smardaten 2.0將治理規(guī)則直接嵌入業(yè)務(wù)場景(如門急診、住院),利用語義引擎自動化執(zhí)行轉(zhuǎn)換規(guī)則。當(dāng)標(biāo)準(zhǔn)更新時,系統(tǒng)能自動同步,確保歷史數(shù)據(jù)無需繁瑣重映射。實(shí)現(xiàn)數(shù)據(jù)的主動治理標(biāo)志著從“消防員”到“領(lǐng)航員”的治理范式轉(zhuǎn)變,實(shí)現(xiàn)了源頭管控和全生命周期的自動化合規(guī)。
3.自然語言構(gòu)建:公民開發(fā)的現(xiàn)實(shí)圖景
2.0時代,數(shù)睿數(shù)據(jù)打造了深度思考引擎的“4+3”應(yīng)用構(gòu)建框架、Build Copilot以及Copilot Studio三大核心功能?!?+3”框架基于應(yīng)用、頁面、卡片、組件的軟件4層顆粒度,以及數(shù)據(jù)、樣式、邏輯的功能性3元素,對軟件進(jìn)行系統(tǒng)性解構(gòu),使AI能快速構(gòu)建。Copilot智能體則提供智能搭建支持,涵蓋需求分析、上下文理解、文檔處理、知識庫檢索、對話流建設(shè)等能力,并支持組裝式開發(fā)與擴(kuò)展。
例如”智能問數(shù)“,用戶僅需輸入自然語言問題,系統(tǒng)即可自動識別意圖,精準(zhǔn)定位相關(guān)數(shù)據(jù)資產(chǎn),并實(shí)時生成分析結(jié)果(圖表/報(bào)表)。用戶可在對話框中對結(jié)果進(jìn)行交互式調(diào)整與優(yōu)化。所有分析成果均支持一鍵插入大屏、文檔或應(yīng)用頁面,實(shí)現(xiàn)高效復(fù)用。
“我需要一套MES生產(chǎn)管理系統(tǒng),包含銷售管理、工種管理、計(jì)劃管理和分析大屏?!?10分鐘后,系統(tǒng)自動生成了包含表單、數(shù)據(jù)分析模型的原型方案和可視化大屏。整個流程中只需要自然語言即可實(shí)現(xiàn)。
smardaten2.0展示了驚人的效率提升,在某些場景下,數(shù)據(jù)驅(qū)動AI的應(yīng)用構(gòu)建效率最高可提升10倍。更加重要的是,邁入2.0時代,數(shù)睿數(shù)據(jù)那個公民開發(fā)應(yīng)用的夢想,開始照進(jìn)了現(xiàn)實(shí)。
讓“沉睡”的金融數(shù)據(jù)流動
化“數(shù)據(jù)孤島”為“數(shù)據(jù)賦能”
我們再以一個銀行的合作案例作為切口,窺探“數(shù)用一體化”在金融行業(yè)的實(shí)戰(zhàn)情況。
該行曾深陷 “建用分離” 困境:12套異構(gòu)系統(tǒng)形成數(shù)據(jù)孤島,“企業(yè)客戶” 在不同系統(tǒng)中被稱為 “對公賬戶主體”“合作單位”“授信對象” 等,字段歧義導(dǎo)致數(shù)據(jù)無法互通;同時,原有CRM功能簡陋,廠商響應(yīng)業(yè)務(wù)需求需2個月,遠(yuǎn)跟不上大宗商品業(yè)務(wù)的迭代速度。
在smardaten2.0上,破局路徑徹底顛覆了傳統(tǒng)“先集中再治理”的模式:
☆A(yù)I驅(qū)動的“邊治理邊聯(lián)通”
smardaten2.0依托金融知識庫與AI語義引擎,對分散數(shù)據(jù)實(shí)施 “動態(tài)標(biāo)準(zhǔn)化”。AI能快速識別12套系統(tǒng)的異構(gòu)字段關(guān)聯(lián),48小時就完成了傳統(tǒng)3周才能搞定的跨系統(tǒng)數(shù)據(jù)映射,自動生成統(tǒng)一的 “企業(yè)客戶” 數(shù)據(jù)資產(chǎn)目錄。
更重要的是,治理規(guī)則和業(yè)務(wù)場景深度綁定:比如在 “跨境貸款審批” 時,平臺預(yù)設(shè)了征信、納稅證明等校驗(yàn)規(guī)則,AI實(shí)時掃描數(shù)據(jù),若發(fā)現(xiàn)貸款申請缺 “海關(guān)進(jìn)出口數(shù)據(jù)”,會自動補(bǔ)全并標(biāo)準(zhǔn)化,讓數(shù)據(jù)在流動中完成80%的標(biāo)準(zhǔn)化,打破了治理和應(yīng)用脫節(jié)的問題。
☆數(shù)據(jù)直接“生長”出應(yīng)用
治理后的標(biāo)準(zhǔn)化數(shù)據(jù)并非靜態(tài)存于倉庫,而是應(yīng)用構(gòu)建的 “活素材”。當(dāng)業(yè)務(wù)人員提出 “對公客戶分層管理模塊(含資質(zhì)評分、業(yè)務(wù)往來分析、風(fēng)險(xiǎn)預(yù)警大屏)” 需求時,平臺基于治理后的客戶數(shù)據(jù),自動調(diào)用相關(guān)模型和算法,1小時內(nèi)就能生成應(yīng)用原型,全程無需技術(shù)人員,業(yè)務(wù)人員用自然語言指令即可完成。
更關(guān)鍵的是 “應(yīng)用反哺治理” 閉環(huán),當(dāng)業(yè)務(wù)新增 “綠色信貸客戶” 標(biāo)簽,平臺自動識別補(bǔ)充 “企業(yè)環(huán)保認(rèn)證”“碳排放數(shù)據(jù)” 等字段,AI實(shí)時從環(huán)保局、碳交易所抓取并標(biāo)準(zhǔn)化數(shù)據(jù),同步更新到客戶分層模型。“治理支撐應(yīng)用迭代、應(yīng)用驅(qū)動治理深化” 的循環(huán),讓該行CRM響應(yīng)周期從2個月縮至72小時,客戶數(shù)據(jù)調(diào)用效率提升90%,充分體現(xiàn)了 “數(shù)用一體” 核心價(jià)值 —— 數(shù)據(jù)是應(yīng)用中持續(xù)進(jìn)化的 “活性要素”,非 “治理完再搬運(yùn)” 的靜態(tài)資產(chǎn) 。
基于一體化平臺,該行此前“沉睡”的數(shù)據(jù),經(jīng)匯總統(tǒng)一治理后,開始在系統(tǒng)與應(yīng)用間高效“流動”,驅(qū)動數(shù)據(jù)分析與新業(yè)務(wù)構(gòu)建,成為其從“數(shù)據(jù)孤島”向“數(shù)據(jù)賦能”躍遷的戰(zhàn)略支點(diǎn)。
數(shù)據(jù)護(hù)城河決定AI時代勝負(fù)
數(shù)睿數(shù)據(jù)是國內(nèi)最早一批將AI技術(shù)與數(shù)據(jù)分析、軟件開發(fā)結(jié)合的科技公司之一,它的發(fā)展歷程是兩次AI浪潮疊加向前的一個縮影。從smardaten2.0上,除了技術(shù)的升級之外,我們還看到了一個“以數(shù)據(jù)為中心的人工智能”模式,正在成型??梢钥吹剑?dāng)前很多大模型公司最大的發(fā)展問題不在模型身上,而是來自數(shù)據(jù)生態(tài)的結(jié)構(gòu)性塌陷。
如果把視角放置在數(shù)據(jù)與AI的整個產(chǎn)業(yè)中,數(shù)睿數(shù)據(jù)帶來了三個重要變化。
1、從“單點(diǎn)優(yōu)化”到“全鏈條協(xié)同”,加速了數(shù)據(jù)決策的效率。由于數(shù)據(jù)被動態(tài)激活,以數(shù)據(jù)為核心的決策成為現(xiàn)實(shí),企業(yè)得以從“事后報(bào)表”升級為“實(shí)時決策”,從“人工分析”進(jìn)化為“AI協(xié)同”,最終實(shí)現(xiàn)數(shù)據(jù)價(jià)值指數(shù)級釋放;
2、重構(gòu)了數(shù)據(jù)治理的內(nèi)生驅(qū)動力,使數(shù)據(jù)治理從 “成本中心” 轉(zhuǎn)向 “價(jià)值中心”;
3、形成三位一體的數(shù)智體系,確立“數(shù)據(jù)即資產(chǎn)、應(yīng)用即組裝、AI即業(yè)務(wù)搭檔”的融合生態(tài)。
隨著大模型技術(shù)的快速、持續(xù)發(fā)展,賽道將會變得越來越擁擠,市場正在迎來重新洗牌的局面。正如我們開頭所講的Scale AI,其創(chuàng)始人說:“大型語言模型(LLM)競爭中的護(hù)城河在哪里,我認(rèn)為數(shù)據(jù)是少數(shù)幾個可以產(chǎn)生可持續(xù)壁壘的領(lǐng)域之一?!?/p>
Meta的天價(jià)收購并非孤例,它昭示著一個新時代的開啟:在模型軍備競賽之外,一場圍繞高質(zhì)量數(shù)據(jù)獲取與高效治理 的“暗戰(zhàn)”已然打響。能否穿透“硅幕”,構(gòu)建強(qiáng)大的數(shù)據(jù)護(hù)城河,將直接決定企業(yè)乃至國家在AI時代的競爭力。處理好數(shù)據(jù)與大模型的關(guān)系,不僅是贏得競賽的秘鑰,更是擁抱智能未來的基石。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.