近日,為了加速多元素催化劑的發(fā)現(xiàn)與優(yōu)化,美國(guó)麻省理工學(xué)院團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)多模態(tài)機(jī)器人平臺(tái)——CRESt(Copilot for Real-world Experimental Scientists)。
該平臺(tái)能夠結(jié)合自動(dòng)化設(shè)備、大規(guī)模模型和實(shí)驗(yàn)室監(jiān)測(cè),在實(shí)驗(yàn)設(shè)計(jì)中融入人類(lèi)經(jīng)驗(yàn)、文獻(xiàn)知識(shí)和顯微結(jié)構(gòu)信息,從而加速多元素催化劑的發(fā)現(xiàn)和優(yōu)化加速發(fā)展。
該團(tuán)隊(duì)以電化學(xué)甲酸氧化為例,在 3 個(gè)月的時(shí)間內(nèi)對(duì) 900 多種配方進(jìn)行探索,共完成電化學(xué)測(cè)試約 3500 次。最終,他們成功發(fā)現(xiàn)多種有潛力的催化劑,其中一種八元合金催化劑,成本比性能(按催化劑成本標(biāo)準(zhǔn)化的功率密度)相較于純鈀基準(zhǔn)提升了 9.3 倍。
該成果的相關(guān)論文日前以加速預(yù)覽的形式亮相Nature,論文題目為“A multimodal robotic platform for multi-element electrocatalyst discovery”,已通過(guò)同行評(píng)審但尚未正式發(fā)表。
(來(lái)源:Nature)
要理解這一成果,我們首先要明白傳統(tǒng)材料研發(fā)的局限。傳統(tǒng)的主動(dòng)學(xué)習(xí)(AL,Active Learning)方法,如基于高斯過(guò)程的貝葉斯優(yōu)化,為實(shí)驗(yàn)設(shè)計(jì)提供了一個(gè)強(qiáng)大的框架。
它能在“探索”(在未知區(qū)域?qū)ふ铱赡苄裕┖汀袄谩保ㄔ谝阎母咝阅軈^(qū)域深入挖掘)之間取得平衡。但這種方法通常是“單模態(tài)”的,即主要依賴(lài)單一類(lèi)型的數(shù)據(jù)流,例如僅將元素比例與材料性能相關(guān)聯(lián),卻忽略了人類(lèi)科學(xué)家在研究中會(huì)綜合利用的多種信息源。
CRESt 的設(shè)計(jì)初衷,正是要彌合這種差距,讓人工智能像經(jīng)驗(yàn)豐富的科學(xué)家一樣,進(jìn)行“多模態(tài)”的思考和實(shí)踐。
圖 | CRESt 指導(dǎo)的電催化劑發(fā)現(xiàn)工作流程(來(lái)源:Nature)
它由用戶(hù)交互界面、大規(guī)模多模態(tài)模型驅(qū)動(dòng)的后端,以及一系列執(zhí)行器組成。執(zhí)行器包括液體處理機(jī)器人、碳熱沖擊合成系統(tǒng)、自動(dòng)電化學(xué)工作站、X 射線衍射、軟件驅(qū)動(dòng)的掃描電子顯微鏡,以及用于氣體與流體控制的泵和閥門(mén)等。
操作者無(wú)需編程經(jīng)驗(yàn),只需通過(guò)語(yǔ)音或文本,就能與 CRESt 自然地交流,指揮整個(gè)機(jī)器人平臺(tái)。所有設(shè)備通過(guò) Python 代碼實(shí)現(xiàn)遠(yuǎn)程協(xié)調(diào)與控制,用戶(hù)可通過(guò)語(yǔ)音或文本與系統(tǒng)交互,平臺(tái)在實(shí)驗(yàn)過(guò)程中能夠生成觀察與假設(shè)。
在算法層面,研究團(tuán)隊(duì)提出了“知識(shí)輔助貝葉斯優(yōu)化”(KABO,Knowledge-Assisted Bayesian Optimization)。傳統(tǒng)的貝葉斯優(yōu)化多以單一數(shù)值流(例如元素比例)建立代理模型,會(huì)忽略化學(xué)文獻(xiàn)、以往經(jīng)驗(yàn)和顯微結(jié)構(gòu)圖像等豐富信息。
而當(dāng) CRESt 面臨一個(gè)新的催化劑設(shè)計(jì)任務(wù)時(shí),它會(huì)先從文獻(xiàn)中檢索相關(guān)元素的全面描述,并用詞向量將這些文本知識(shí)嵌入到元素特征向量。
換句話說(shuō),CRESt 在開(kāi)始之前,已經(jīng)“預(yù)習(xí)”了相關(guān)的資料,對(duì)哪些元素的組合可能產(chǎn)生優(yōu)異性能,形成了初步的“直覺(jué)”。
針對(duì)隨后的圖像特征嵌入,研究團(tuán)隊(duì)開(kāi)發(fā)了一套高通量的掃描電子顯微鏡成像工作流程。CRESt 會(huì)自動(dòng)拍攝催化劑樣本的微觀圖像,并利用計(jì)算機(jī)視覺(jué)技術(shù),提取四個(gè)關(guān)鍵的形態(tài)學(xué)特征:顆粒分布函數(shù)的斜率與偏差、顆粒覆蓋率,以及單位面積的顆粒數(shù)量。
圖 | 掃描電子顯微鏡圖像(來(lái)源:Nature)
最后,知識(shí)輔助貝葉斯優(yōu)化算法將化學(xué)成分、從文獻(xiàn)中提煉的文本知識(shí),以及從電鏡圖中提取的微觀結(jié)構(gòu)特征這三大類(lèi)信息源融合在一起。通過(guò)主成分分析等降維技術(shù),該算法在一個(gè)濃縮了所有關(guān)鍵信息的潛空間中進(jìn)行優(yōu)化計(jì)算,規(guī)劃下一步的實(shí)驗(yàn)方向。
這種多模態(tài)的學(xué)習(xí)方式,極大地縮小了搜索空間,顯著提升了優(yōu)化效率。實(shí)驗(yàn)對(duì)比顯示,與標(biāo)準(zhǔn)的貝葉斯優(yōu)化相比,知識(shí)輔助貝葉斯優(yōu)化算法平均能將實(shí)驗(yàn)效率提升 36%,并且只需 25% 的實(shí)驗(yàn)次數(shù)就能找到高性能的樣品。
(來(lái)源:Nature)
為了檢驗(yàn) CRESt 的真實(shí)能力,研究團(tuán)隊(duì)選擇了一個(gè)極具挑戰(zhàn)性的課題:為直接甲酸燃料電池尋找高效的電化學(xué)催化劑。直接甲酸燃料電池是一種前景廣闊的清潔能源設(shè)備,而催化劑的好壞直接決定了其性能。
CRESt 的探索從一個(gè)相對(duì)簡(jiǎn)單的三元化學(xué)空間 Pd-Pt-Cu 開(kāi)始。即便如此,這個(gè)空間也包含了約 50 萬(wàn)種潛在的配方組合。但 CRESt 僅執(zhí)行了不到 60 次實(shí)驗(yàn),就成功鎖定了一個(gè)優(yōu)化的催化劑配方 Pd?.???Pt?.???Cu?.???,其產(chǎn)生的功率密度是傳統(tǒng)基準(zhǔn)催化劑純鈀的 3.5 倍。
隨后,CRESt 開(kāi)始挑戰(zhàn)更難的八元化學(xué)空間 Pd-Pt-Cu-Au-Ir-Ce-Nb-Cr。這個(gè)空間的潛在配方數(shù)量高達(dá) 2x101? 個(gè)。
這是什么概念?假設(shè)地球上有 80 億人,每人找一種配方,那么想要窮盡 2x101? 個(gè)配方,就需要 2500 萬(wàn)個(gè)地球。以人類(lèi)現(xiàn)有手段,幾乎不可能完整探索整個(gè)空間。
CRESt 接手這項(xiàng)任務(wù)后,花費(fèi)了 3 個(gè)月的時(shí)間,自主設(shè)計(jì)并完成了 900 多種不同化學(xué)配比的催化劑合成,進(jìn)行了超過(guò) 3500 次的電化學(xué)性能測(cè)試。
最終,它發(fā)現(xiàn)了兩種性能卓越的催化劑。其中一種 Pd?.???Pt?.???Cu?.???Ir?.???Ce?.???Nb?.??? 的功率密度達(dá)到了純鈀的 5.6 倍。而另一種經(jīng)過(guò)成本優(yōu)化的配方 Pd?.???Pt?.???Cu?.???Au?.???Ir?.??Ce?.???Nb?.???Cr?.???,在將功率密度除以催化劑成本后得到的“成本比性能”,更是達(dá)到了純鈀基準(zhǔn)的 9.3 倍。
(來(lái)源:Nature)
在燃料電池測(cè)試中,這種新催化劑在貴金屬用量?jī)H為以往 25% 的情況下,創(chuàng)造了新的功率密度記錄。
有了更好的算法,研究團(tuán)隊(duì)接下來(lái)將目光投向了算法的執(zhí)行者,也就是機(jī)器人。它們負(fù)責(zé)完成配方的合成和測(cè)試。
但真實(shí)世界遠(yuǎn)比理論模型復(fù)雜,在項(xiàng)目初期,研究團(tuán)隊(duì)就發(fā)現(xiàn)許多實(shí)驗(yàn)結(jié)果無(wú)法復(fù)現(xiàn)。盡管機(jī)器人生成了大量數(shù)據(jù),但數(shù)據(jù)之間充滿(mǎn)了矛盾和不一致,根本無(wú)法用來(lái)訓(xùn)練模型。
這些問(wèn)題源于一些極其隱蔽的誤差,例如機(jī)械臂的微小位移、環(huán)境溫度的細(xì)微波動(dòng)、電路的瞬時(shí)干擾等等。
圖 | 視覺(jué)語(yǔ)言模型的應(yīng)用(來(lái)源:Nature)
一個(gè)例子是,在滴加溶液時(shí),移液管的尖端可能會(huì)觸碰到作為電極的碳紙,微米級(jí)的碳紙錯(cuò)位導(dǎo)致了后續(xù)測(cè)量的巨大誤差。
另一個(gè)例子是,為了保證樣品位置的一致性,團(tuán)隊(duì)使用了激光切割的木制平臺(tái),但總是出現(xiàn)微小偏差,進(jìn)而影響實(shí)驗(yàn)精度。
研究人員給 CRESt 加入了視覺(jué)語(yǔ)言模型,可以通過(guò)攝像頭持續(xù)監(jiān)控實(shí)驗(yàn)過(guò)程,并結(jié)合日志做出推理,給出建議。
針對(duì)剛才提到的木制平臺(tái)問(wèn)題,視覺(jué)語(yǔ)言模型將其歸結(jié)于“激光燒灼會(huì)在木頭表面留下不均勻的炭化痕跡,導(dǎo)致樣品臺(tái)出現(xiàn)微小誤差”,并建議改用不銹鋼平臺(tái)。這條建議改善了實(shí)驗(yàn)的可復(fù)現(xiàn)性。
為了系統(tǒng)性地評(píng)估視覺(jué)語(yǔ)言模型,研究團(tuán)隊(duì)將問(wèn)題日志丟給了 OpenAI 和谷歌的模型。結(jié)果顯示,OpenAI o3 和谷歌 Gemini 2.5 Pro 分別以 72% 和 70% 的準(zhǔn)確率判斷出問(wèn)題。
(來(lái)源:Nature)
發(fā)現(xiàn)新材料只是第一步,更重要的是理解它為何表現(xiàn)優(yōu)異。CRESt 的發(fā)現(xiàn)同樣需要經(jīng)過(guò)嚴(yán)格驗(yàn)證。研究團(tuán)隊(duì)運(yùn)用了原位 X 射線吸收光譜(in situ XAS)和密度泛函理論計(jì)算等技術(shù),深入剖析了新型催化劑的內(nèi)在奧秘。
研究人員觀察到,Pd 和 Pt 是催化反應(yīng)的核心活性元素;Cu、Ce、 Nb、Cr 等其他元素則是重要輔助。它們通過(guò)和核心元素形成合金來(lái)改變?cè)优挪己碗娮咏Y(jié)構(gòu),通過(guò)這種方式達(dá)到催化性能優(yōu)化的效果。
總體來(lái)看,CRESt 是一個(gè)在機(jī)器人與大模型雙重驅(qū)動(dòng)下的材料發(fā)現(xiàn)平臺(tái),它展示了將“提出假設(shè)、機(jī)器人實(shí)驗(yàn)、獲取數(shù)據(jù)、分析學(xué)習(xí)、提出新假設(shè)”,整合為閉環(huán)探索流程的可能性。CRESt 為未來(lái)復(fù)雜多元素催化劑,乃至新材料的自動(dòng)化發(fā)現(xiàn),提供了一種新路線和量化基準(zhǔn)。
參考資料:
Zhang, Z., Ren, Z., Hsu, CW. et al. A multimodal robotic platform for multi-element electrocatalyst discovery.Nature(2025). https://doi.org/10.1038/s41586-025-09640-5
運(yùn)營(yíng)/排版:何晨龍
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.