題記:2025年6月9-10日,“2025羅漢堂-北大國(guó)發(fā)院數(shù)字經(jīng)濟(jì)年會(huì)”在北京大學(xué)國(guó)家發(fā)展研究院召開。本文為螞蟻集團(tuán)資深副總裁、財(cái)富與保險(xiǎn)事業(yè)群總裁黃浩在本次年會(huì)上的主題演講。
以下是黃浩演講的全文:
大家好,我是黃浩。這是我第三次來(lái)參加羅漢堂年會(huì)的活動(dòng)?,F(xiàn)在大家一說起 AI 都默認(rèn)是大語(yǔ)言模型,而大語(yǔ)言模型和金融的結(jié)合,我覺得如果用一句話來(lái)說,就是“理想有多么的豐滿,現(xiàn)實(shí)就有多么的骨感”。目前在金融領(lǐng)域,大語(yǔ)言模型的實(shí)際落地應(yīng)用接近為零。大家可以回想一下,最近一次使用大語(yǔ)言模型的金融服務(wù)是在哪里,是用了什么?實(shí)際情況是很少很少的?;谶@個(gè)接近為零的應(yīng)用狀況,我就簡(jiǎn)單地分享一下行業(yè)的現(xiàn)狀,以此拋磚引玉。
01
金融科技發(fā)展的三個(gè)階段
如果用幾分鐘簡(jiǎn)單地回顧金融科技的發(fā)展歷程,我們發(fā)現(xiàn)其實(shí)中國(guó)的金融科技就是世界的金融科技。在過去 20 年里,金融科技的發(fā)展可以分為三個(gè)階段。
第一個(gè)階段是前 AI 時(shí)代,代表作是支付寶。支付寶開創(chuàng)了中國(guó)乃至全世界數(shù)字化支付的新時(shí)代。這是在 2014 年之前,幾乎沒有 AI?;ヂ?lián)網(wǎng)支付大家都很熟悉了,我們使用得最多的技術(shù),包括大數(shù)據(jù)、云計(jì)算、分布式架構(gòu),都是為了解決海量交易高并發(fā)的普惠性服務(wù)。這方面中國(guó)解決得最好,除了金融科技企業(yè)之外,銀聯(lián)、網(wǎng)聯(lián)也都建立了高并發(fā)的系統(tǒng),后來(lái)全世界都開始向中國(guó)學(xué)習(xí)。當(dāng)時(shí)的技術(shù)解決的核心問題就是線上化、實(shí)時(shí)化和規(guī)?;瑢?shí)現(xiàn)了綠色、便捷和普惠。
第二個(gè)時(shí)代是小模型時(shí)代,或者叫數(shù)字金融時(shí)代。一個(gè)代表作是余額寶(余額寶誕生于 2013 年,快速發(fā)展于 2014 年之后,可以說是介于第一個(gè)和第二個(gè)時(shí)代之間)。更有代表性的是數(shù)字化信貸,比如網(wǎng)商銀行首創(chuàng)的 “310” 模式,即 “三分鐘申請(qǐng)、一秒鐘貸款、零人工干預(yù)”。我曾經(jīng)擔(dān)任過網(wǎng)商銀行的行長(zhǎng)。十多年前剛推出這個(gè)服務(wù)的時(shí)候,人們都在問:沒有客戶經(jīng)理,沒有網(wǎng)點(diǎn),沒有抵押的貸款能夠有效的運(yùn)轉(zhuǎn)嗎?十年之后走到今天,我們看到的數(shù)據(jù)是,中國(guó)的消費(fèi)信貸實(shí)際上 60% 以上是純數(shù)字化的,小微企業(yè)的信貸 —— 特別是 100-200 萬(wàn)以下的 —— 絕大部分是數(shù)字化的。也就是說,數(shù)字化信貸從螞蟻出發(fā),已經(jīng)成為包括螞蟻的合作伙伴、競(jìng)爭(zhēng)對(duì)手,以及所有銀行和金融機(jī)構(gòu)都在使用的標(biāo)配,就像互聯(lián)網(wǎng)支付一樣。它所代表的數(shù)字金融其實(shí)是真正的 AI 應(yīng)用??稍?ChatGPT 和 DeepSeek 興起之后,我們都不太好意思提這事了,好像小模型就不是 AI,但實(shí)際上這已經(jīng)是 AI 技術(shù),并且在金融領(lǐng)域得到了廣泛應(yīng)用。
第二個(gè)階段另一個(gè)創(chuàng)新實(shí)踐項(xiàng)目是 “大山雀”,這也是基于 AI 技術(shù)。我們利用衛(wèi)星對(duì)農(nóng)作物 —— 不管是糧食作物還是經(jīng)濟(jì)作物 —— 進(jìn)行拍照,然后利用 AI 技術(shù)去識(shí)別農(nóng)民種的是什么、種的怎么樣,再基于算法來(lái)判斷他們是否需要貸款、貸款是否安全。這也是網(wǎng)商銀行首先推出的一項(xiàng)服務(wù),目前有超過 120 萬(wàn)的種植戶通過這項(xiàng)服務(wù)獲得了貸款。實(shí)際上現(xiàn)在有很多金融機(jī)構(gòu)也已經(jīng)開始使用這種純正的 AI 技術(shù),但這還不是大語(yǔ)言模型。
這個(gè)時(shí)代的再一個(gè)創(chuàng)新例子是在保險(xiǎn)領(lǐng)域的數(shù)字理賠。理賠以前是采用非常重人工的模式,可能一個(gè)機(jī)構(gòu)對(duì)醫(yī)療險(xiǎn)或重疾險(xiǎn)的理賠需要 30 到 60 天或者更長(zhǎng)的時(shí)間。而現(xiàn)在螞蟻的絕大多數(shù)保險(xiǎn)理賠是在 10 秒內(nèi)完結(jié)的,用戶只需要把所有的醫(yī)院理賠材料勾選上傳,不用做任何的分類,立刻就能出理賠結(jié)果。我們每年這樣辦理的案例超過 300 萬(wàn)起。這也是純正的 AI 技術(shù),但仍然不是大語(yǔ)言模型(最近我們開始部分地應(yīng)用大語(yǔ)言模型技術(shù))。
由此,在金融科技的第二個(gè)時(shí)代,我們基于海量的數(shù)據(jù),通過算法的優(yōu)化,深刻地結(jié)合場(chǎng)景,進(jìn)行了各種金融業(yè)務(wù)的創(chuàng)新。我覺得毫不夸張地講,經(jīng)過第一個(gè)和第二個(gè)階段的發(fā)展,中國(guó)已經(jīng)引領(lǐng)了數(shù)字化支付和數(shù)字化信貸的全世界浪潮。在第一個(gè)和第二個(gè)時(shí)代,中國(guó)是領(lǐng)先全球的,甚至說遙遙領(lǐng)先也不為過。
第三個(gè)時(shí)代就是大模型時(shí)代,也就是現(xiàn)在大家談到更多的智能金融。這個(gè)時(shí)代才剛剛開始,誰(shuí)也沒有領(lǐng)先。大家在同一條起跑線上競(jìng)爭(zhēng),螞蟻也一樣 —— 螞蟻很幸運(yùn),在這三個(gè)階段都是其中主要的參與者之一。大語(yǔ)言模型必將會(huì)為金融領(lǐng)域的 AI 應(yīng)用打開新空間,因?yàn)槟P妥銐虼蟆?shù)據(jù)足夠多,而語(yǔ)言又是人類區(qū)別于動(dòng)物智能的最主要的特征。如果在這個(gè)點(diǎn)上取得突破的話,會(huì)給很多金融產(chǎn)品的制造和交付的過程都帶來(lái)巨大的想象空間。這個(gè)想象空間在哪兒呢?我們認(rèn)為在三件事上:知識(shí)力(解決專業(yè)知識(shí)密集的問題)、專業(yè)力(解決決策復(fù)雜度高的問題)和語(yǔ)言力(解決服務(wù)溝通難度大的問題 —— 通過多輪次的溝通,深入了解用戶需求,并為其提供服務(wù))。
這三種力發(fā)揮作用的領(lǐng)域,肯定不是在支付這類瞬間發(fā)生的、資金搬家的流程,也不是在基于 AI 評(píng)估能否貸款、貸多少款的流程,而是會(huì)觸及金融業(yè)務(wù)最復(fù)雜的環(huán)節(jié)。如果金融業(yè)務(wù)有一部分是融資性業(yè)務(wù),那么還有一部分是融智性業(yè)務(wù),那就是資產(chǎn)管理、財(cái)富管理、保險(xiǎn)等等。在大語(yǔ)言模型推出之前,這些業(yè)務(wù)在中國(guó)可能是通過數(shù)十萬(wàn)的銀行網(wǎng)點(diǎn)、數(shù)百萬(wàn)的銀行員工、數(shù)百萬(wàn)的保險(xiǎn)代理人員來(lái)提供服務(wù)。服務(wù)的質(zhì)量高嗎?夠嗎?大家心里都有判斷。你得到過像私人銀行或者財(cái)富管理那樣專業(yè)的、有品質(zhì)的、貼身的服務(wù)嗎?答案是都沒有。正是網(wǎng)點(diǎn)數(shù)量和員工數(shù)量的限制,使得十億人無(wú)法得到既有高水準(zhǔn)又有溫度的金融服務(wù)。所以這次突然給了所有人想象空間。
02
大模型時(shí)代的現(xiàn)實(shí)及
螞蟻的應(yīng)對(duì)
就我了解,圈內(nèi)幾乎沒有人質(zhì)疑大模型會(huì)帶來(lái)金融服務(wù)的高質(zhì)量發(fā)展以及進(jìn)一步普惠。如果今天有人對(duì)此表示懷疑 —— 就像二十年前懷疑數(shù)字支付會(huì)普及、十年前懷疑數(shù)字信貸會(huì)普及 —— 就會(huì)顯得很傻,好像自己既缺乏想象力,也沒有記憶力。但是現(xiàn)實(shí)的骨感就在于:ChatGPT 發(fā)布已經(jīng)有兩年半了,DeepSeek 也出來(lái)不短時(shí)間了,可截至目前實(shí)際上沒有任何一家正規(guī)金融機(jī)構(gòu)推出結(jié)合了生成式大模型 —— 特別是推理的生成式大模型 —— 的金融服務(wù)。無(wú)論在哪個(gè)銀行開戶、在哪個(gè)證券公司炒股、在哪個(gè)平臺(tái)買基金、在哪個(gè)地方買保險(xiǎn),大家可以了解一下它們的網(wǎng)頁(yè)端或手機(jī)端有沒有提供這樣的服務(wù)?答案是沒有,不僅在國(guó)內(nèi)沒有,在全世界范圍內(nèi)也沒有。為什么?卡點(diǎn)在哪里?
我談一談螞蟻對(duì)這個(gè)事情怎么看。螞蟻嘗試在四個(gè)方向上進(jìn)行實(shí)踐和探索。請(qǐng)看這張大圖。最上面的是投資顧問和保險(xiǎn)顧問,提供 to C 的財(cái)富管理和保險(xiǎn)規(guī)劃服務(wù)。這項(xiàng)服務(wù)叫 “螞小財(cái)”,其實(shí)已經(jīng)有超過 8000 萬(wàn)的用戶每個(gè)月在支付寶端內(nèi)使用這個(gè)服務(wù)了。這里列出了他們咨詢的主要問題類型,我就不展開講了。這個(gè)服務(wù)是不是基于大模型?是的。有沒有用到推理大模型?還沒有,但 6 月底就會(huì)有,我們將上線新模型。這張圖的下方(“智能運(yùn)營(yíng)”)是我們幫助與螞蟻合作的金融機(jī)構(gòu),用大模型來(lái)高效地生產(chǎn)推廣素材,比如在小紅書、抖音等平臺(tái)編寫內(nèi)容。
注意這張圖的左右都是 to B 的業(yè)務(wù)。右邊的 “支小助” 是為螞蟻?zhàn)约旱囊约昂献鹘鹑跈C(jī)構(gòu)的銷售和客服人員提供智能輔助服務(wù),讓理財(cái)師、規(guī)劃師等能夠更高效。大家想一下,一位理財(cái)師或者規(guī)劃師能夠高質(zhì)量服務(wù) 5000 位客戶嗎?哪怕在中國(guó)做得最好的財(cái)富管理機(jī)構(gòu)和銀行,一位理財(cái)師能提供在線服務(wù)的有效范圍大概也很難超過 500 人。這就是為什么私人銀行和財(cái)富管理很難下沉到普惠的人群:成本太高,太貴。一個(gè)人服務(wù)的范圍有可能變大 10 倍嗎?這是我們希望解決的普惠的問題。實(shí)際上,今天在線上已經(jīng)基本可以實(shí)現(xiàn)絕大部分了。今天在支付寶的螞蟻財(cái)富端內(nèi),超過 50% 提供給用戶的服務(wù)內(nèi)容是由 AI 產(chǎn)生并且被理財(cái)師拿來(lái)使用的。
這張圖的左邊,是螞蟻結(jié)合合作的金融機(jī)構(gòu)、資管機(jī)構(gòu)和證券公司做 “智能投研” 的服務(wù)。如果你在資管機(jī)構(gòu)工作,應(yīng)該對(duì)這個(gè)印象最深刻。我們推出了 PC 端的 “螞小財(cái) PRO” 服務(wù),它為金融分析師去分析資訊報(bào)表,快速地產(chǎn)生內(nèi)容。這一部分有沒有使用推理大模型?有。實(shí)際上這部分都使用了推理大模型。那為什么我們?cè)?to B 的場(chǎng)景就敢用推理大模型,而 to C 就不敢呢?問題在于監(jiān)管不允許嗎?并不是。監(jiān)管其實(shí)還是非常鼓勵(lì) AI 創(chuàng)新的,截至目前沒有對(duì)金融領(lǐng)域使用 AI 有禁令。
03
大模型在 to C 金融落地時(shí)的
三大關(guān)鍵問題
我們覺得,要解決大模型落地 to C 金融,有三個(gè)關(guān)鍵的問題是我們行業(yè)的從業(yè)者不得不面對(duì)的。
第一,嚴(yán)不嚴(yán)謹(jǐn)?怎樣控制實(shí)時(shí)性幻覺?
第二,怎樣確保服務(wù)模型的可解釋性。
第三,怎樣防止大眾策略的集中風(fēng)險(xiǎn),比如推薦所有人都去買同一只股票或基金帶來(lái)的共振。
我們認(rèn)為,這三個(gè)問題中有任何一個(gè)問題不能得到有效地解決,作為一個(gè)負(fù)責(zé)任的金融服務(wù)者 —— 不管是線上還是線下,不管自稱是金融機(jī)構(gòu)還是金融科技機(jī)構(gòu) —— 都沒有資格推出這樣的 to C 服務(wù)。所以,當(dāng) DeepSeek 出來(lái)后,有一些機(jī)構(gòu)說自己滿血接入 DeepSeek 等等,也有人問我們?yōu)槭裁礇]有滿血接入。DeepSeek 的幻覺率大家都知道,滿血接入的后果就不用展開講了。
針對(duì)這三個(gè)問題,我簡(jiǎn)單介紹一下螞蟻的對(duì)策。第一,必須精準(zhǔn)地控制幻覺率,要把現(xiàn)在市場(chǎng)上普遍在百分之十幾以上 —— 甚至在金融領(lǐng)域高達(dá)百分之二三十以上 —— 的幻覺率降到個(gè)位數(shù),降到不影響用戶基本的業(yè)務(wù)決策。以技術(shù)發(fā)展之名,忽視風(fēng)險(xiǎn),簡(jiǎn)單地推出一些技術(shù)應(yīng)用,其實(shí)是非常危險(xiǎn)的。今天螞蟻的客戶群足夠大,責(zé)任也就足夠大,必須考慮這個(gè)問題 —— 我們今天已經(jīng)不是穿著開襠褲滿街跑的小孩了。
解決的基本方法,一是建立高質(zhì)量金融知識(shí)庫(kù),嚴(yán)格控制數(shù)據(jù)源,杜絕被污染的、非權(quán)威的數(shù)據(jù)。二是強(qiáng)化模型訓(xùn)練。不同于直接全部接入,也不同于做一些簡(jiǎn)單的提示詞方面的工程強(qiáng)化,我們?cè)谖浵佔(zhàn)匝械牡鬃竽P秃桶⒗锏耐x大模型基礎(chǔ)上,會(huì)做非常嚴(yán)格的強(qiáng)化學(xué)習(xí)和加訓(xùn),目前已經(jīng)成功地將幻覺率控制在一個(gè)比較低的水平。
第二,確保專業(yè)領(lǐng)域的可解釋性。辦法很簡(jiǎn)單,就是不能把所有的問題都交給推理大模型。我們做了每個(gè)領(lǐng)域的大模型和小模型的對(duì)比(剛才講的第二個(gè)階段其實(shí)就是小模型,是可解釋的,基于專業(yè)經(jīng)驗(yàn)加上海量數(shù)據(jù)的 AI 應(yīng)用),發(fā)現(xiàn)有些地方是大模型勝出,有些地方是小模型勝出。越是嚴(yán)謹(jǐn)?shù)牟糠?—— 比如金融工程等 —— 我們會(huì)越多地使用小模型的應(yīng)用。所以我們今天給 to C 用戶推出的服務(wù),就是大模型和小模型的結(jié)合。當(dāng)我們嚴(yán)肅地給用戶提供保險(xiǎn)和理財(cái)?shù)慕ㄗh時(shí),一定要具備可解釋性。
第三,防止策略的集中度。這方面要做的既包括金融本身,也包括 AI 本身。從金融本身來(lái)說,我們要嚴(yán)格地控制給用戶推薦的資產(chǎn)總量。一只基金再好,也不會(huì)把所有的用戶都推到這只基金,因?yàn)樗赡艿搅藘扇賰|的規(guī)模之后,就超過了阿爾法能夠體現(xiàn)的上限了,所以首先我們會(huì)有金融層面的控量。另外在用戶層面,基于大數(shù)據(jù)的 AI 會(huì)真正為用戶提供千人千面的方案。每個(gè)人都不一樣,且每個(gè)人在不同時(shí)刻的心理訴求也不一樣 —— 有時(shí)候求穩(wěn),有時(shí)候求賺 ——AI 不會(huì)讓用戶涌向單一的產(chǎn)品。
基于這三點(diǎn),我覺得大模型大概率在今年會(huì)有一些 to C 業(yè)務(wù)的落地。
04
前瞻和判斷
最后分享一些目前還不成熟的思考。第一,不存在 “開箱即用”。無(wú)論是滿血接入,或者是用通用人工智能 (AGI) 的方式直接接入一個(gè)底座大模型,就能解決所有的金融問題、保險(xiǎn)問題,甚至醫(yī)療問題嗎?我們覺得,在事關(guān)消費(fèi)者生命財(cái)產(chǎn)安全的領(lǐng)域,不存在 “開箱即用” 的方案。我們要結(jié)合數(shù)據(jù)、知識(shí)、算力,還要結(jié)合業(yè)務(wù)流,去提供真正為用戶負(fù)責(zé)的、嚴(yán)謹(jǐn)專業(yè)和可靠的金融服務(wù)。
第二,我們相信時(shí)代的趨勢(shì)是不可阻擋的,但是用戶的理解和接受一定是有一個(gè)過程的。AI 發(fā)展了已有 70 年,ChatGPT 的出現(xiàn)是在幾乎 70 年之后。自動(dòng)駕駛也十幾年了,今天很快可能要從 L2 跨入到 L3。這都是一個(gè)從量變到質(zhì)變的過程。而大模型和金融的結(jié)合其實(shí)才剛剛開始,前年、去年、今年,都有人說是元年。不管哪年是元年,我認(rèn)為大模型在金融領(lǐng)域落地的 ChatGPT 時(shí)刻(或者說 DeepSeek 時(shí)刻,或者 L3 時(shí)刻)可能還沒有到來(lái)。它需要時(shí)間的積累,積累的既是技術(shù),也有專業(yè)知識(shí),也有監(jiān)管經(jīng)驗(yàn),還包括消費(fèi)者對(duì)這件事的接受。就像十年前你不太敢把自己的命交給自動(dòng)駕駛一樣,今天你可能會(huì)有 10% 的情況會(huì)交給它,未來(lái)可能會(huì)有 20% 和 30%。我覺得金融也需要一樣長(zhǎng) —— 甚至更長(zhǎng) —— 的時(shí)間,因?yàn)樽詣?dòng)駕駛給人的反饋是非常及時(shí)的,它加速、減速、并道對(duì)不對(duì),你立刻就能感覺到。但給你推薦一個(gè)金融產(chǎn)品,當(dāng)你意識(shí)到它是錯(cuò)的時(shí)候,可能需要好些年。所以我們要有足夠的耐心,隨著時(shí)間一點(diǎn)一點(diǎn)做好我們?cè)撟龅氖虑椤?
我就說這么多,謝謝大家。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.