始智AI wisemodel.cn社區(qū)是源自中國的中立開放的AI開源社區(qū)。正在,歡迎加入共同成長。A800/H20等算力6.25元/卡時(shí),支持在線微調(diào)訓(xùn)練,及線部署和。
在科學(xué)發(fā)現(xiàn)過程 中,傳統(tǒng)的單一模態(tài)分析往往難以全面捕捉復(fù)雜現(xiàn)象,尤其是在跨學(xué)科 領(lǐng)域的深度探索中更加顯著。Intern-S1 融合了書生大模型家族的優(yōu)勢(shì),在同一模型內(nèi)實(shí)現(xiàn)了語言和多模態(tài)性能的高水平均衡發(fā)展,并富集多學(xué)科專業(yè)知識(shí),重點(diǎn)強(qiáng)化了科學(xué)能力,為首個(gè)融合專業(yè)科學(xué)能力的開源通用模型,其綜合性能為當(dāng)前開源多模態(tài)大模型中最優(yōu)。
基于 Intern-S1 的 書生科學(xué)發(fā)現(xiàn)平臺(tái)Intern-Discovery 也 于近日上線,助力 研究者、研究工具、研究對(duì)象三者能力全面提升 、協(xié)同演進(jìn),驅(qū)動(dòng)科學(xué)研究從團(tuán)隊(duì)單點(diǎn)探索邁向科學(xué)發(fā)現(xiàn)Sc aling Law階 段 。 Intern-S1 現(xiàn) 已上線始智AI-wisemodel開源社區(qū),歡迎體驗(yàn)。
模型地址
https://wisemodel.cn/models/Intern/Intern-S1
01.
重構(gòu)科研生產(chǎn)力
當(dāng)大模型在聊天、繪畫、代碼生成等場(chǎng)景中持續(xù)取得突破時(shí),科研領(lǐng)域卻仍在期待一個(gè)真正“懂科學(xué)”的 AI 伙伴。盡管當(dāng)前主流模型在自然語言處理、圖像識(shí)別等方面表現(xiàn)出色,但在面對(duì)復(fù)雜、精細(xì)且高度專業(yè)化的科研任務(wù)時(shí),依然存在明顯短板。
一方面,現(xiàn)有開源模型普遍缺乏對(duì)復(fù)雜科學(xué)數(shù)據(jù)的深度理解,難以滿足科研場(chǎng)景對(duì)精度、專業(yè)性和推理能力的嚴(yán)苛要求。另一方面,性能更強(qiáng)的閉源模型存在部署門檻高、可控性弱等問題,導(dǎo)致科研工作者在實(shí)際應(yīng)用中常面臨高成本、低透明的現(xiàn)實(shí)挑戰(zhàn)。
Intern-S1首創(chuàng)“跨模態(tài)科學(xué)解析引擎”,可精準(zhǔn)解讀化學(xué)分子式、蛋白質(zhì)結(jié)構(gòu)、地震波信號(hào)等多種復(fù)雜科學(xué)模態(tài)數(shù)據(jù),并具備多項(xiàng)前沿科研能力,如預(yù)測(cè)化合物合成路徑,判斷化學(xué)反應(yīng)可行性,識(shí)別地震波事件等,真正讓 AI 從“對(duì)話助手”進(jìn)化為“科研搭檔”,助力全面重構(gòu)科研生產(chǎn)力。
得益于強(qiáng)大的科學(xué)解析能力,Intern-S1 在化學(xué)、材料、地球等多學(xué)科專業(yè)任務(wù)基準(zhǔn)上超越了頂尖閉源模型 Grok-4,展現(xiàn)出卓越的科學(xué)推理與理解能力。在多模態(tài)綜合能力方面,Intern-S1 同樣表現(xiàn)亮眼,全面領(lǐng)先 InternVL3、Qwen2.5-VL 等主流開源模型,堪稱“全能高手”中的“科學(xué)明星”。
基于 Intern-S1 強(qiáng)大的跨模態(tài)生物信息感知與整合能力,上海AI實(shí)驗(yàn)室聯(lián)合臨港實(shí)驗(yàn)室、上海交通大學(xué)、復(fù)旦大學(xué)、MIT 等研究機(jī)構(gòu)協(xié)同攻關(guān),共同參與構(gòu)建了多智能體虛擬疾病學(xué)家系統(tǒng)——“元生”(OriGene),可用于靶標(biāo)發(fā)現(xiàn)與臨床轉(zhuǎn)化價(jià)值評(píng)估,已在肝癌和結(jié)直腸癌治療領(lǐng)域上分別提出新靶點(diǎn) GPR160 和 ARG2,且經(jīng)真實(shí)臨床樣本和動(dòng)物實(shí)驗(yàn)驗(yàn)證,形成科學(xué)閉環(huán)。
體系化的技術(shù)創(chuàng)新為 Intern-S1 的能力突破提供了有效支撐。自書生大模型首次發(fā)布以來,上海AI實(shí)驗(yàn)室已逐步構(gòu)建起豐富的書生大模型家族,包括大語言模型書生·浦語 InternLM、多模態(tài)模型書生·萬象 InternVL、強(qiáng)推理模型書生·思客 InternThinker等?;凇巴▽H诤稀钡募夹g(shù)路線,上海AI實(shí)驗(yàn)室的研究團(tuán)隊(duì)通過持續(xù)的體系化技術(shù)創(chuàng)新,成功打造了 Intern-S1,成為新一代模型標(biāo)桿。
02.
創(chuàng)新科學(xué)多模態(tài)架構(gòu)
受數(shù)據(jù)異構(gòu)性壁壘、專業(yè)語義理解瓶頸等因素制約,傳統(tǒng)的通用大模型在處理科學(xué)模態(tài)數(shù)據(jù)時(shí)面臨顯著挑戰(zhàn)。為了更好地適應(yīng)科學(xué)數(shù)據(jù),Intern-S1 新增了動(dòng)態(tài) Tokenizer 和時(shí)序信號(hào)編碼器,可支持多種復(fù)雜科學(xué)模態(tài)數(shù)據(jù),實(shí)現(xiàn)了材料科學(xué)與化學(xué)分子式、生物制藥領(lǐng)域的蛋白質(zhì)序列、天文巡天中的光變曲線、天體碰撞產(chǎn)生的引力波信號(hào)、地震臺(tái)網(wǎng)記錄的地震波形等多種科學(xué)模態(tài)的深度融合。
通過架構(gòu)創(chuàng)新,Intern-S1 還實(shí)現(xiàn)了對(duì)科學(xué)模態(tài)數(shù)據(jù)的深入理解與高效處理,例如,其對(duì)化學(xué)分子式的壓縮率相比 DeepSeek-R1 提升 70% 以上;在一系列基于科學(xué)模態(tài)的專業(yè)任務(wù)上消耗的算力更少,同時(shí)性能表現(xiàn)更優(yōu)。
03.
一個(gè)模型解決多項(xiàng)專業(yè)任務(wù)
科學(xué)領(lǐng)域的高價(jià)值任務(wù)往往高度專業(yè)化,不僅模型輸出可讀性差,且不同任務(wù)在技能要求與思維方式上差異顯著,直接混合訓(xùn)練面臨此消彼長的困境,難以實(shí)現(xiàn)能力的深度融合。
為此,研究團(tuán)隊(duì)提出通專融合的科學(xué)數(shù)據(jù)合成方法:一方面利用海量通用科學(xué)數(shù)據(jù)拓展模型的知識(shí)面,另一方面訓(xùn)練眾多專業(yè)模型生成具有高可讀性、思維路徑清晰的科學(xué)數(shù)據(jù),并由領(lǐng)域定制的專業(yè)驗(yàn)證智能體進(jìn)行數(shù)據(jù)質(zhì)量控制。
最終,這一閉環(huán)機(jī)制持續(xù)反哺基座模型,使其同時(shí)具備強(qiáng)大的通用推理能力與多項(xiàng)頂尖的專業(yè)能力,真正實(shí)現(xiàn)一個(gè)模型解決多項(xiàng)專業(yè)任務(wù)的的科學(xué)智能突破。
04.
大模型強(qiáng)化學(xué)習(xí)成本直降10倍
當(dāng)前,強(qiáng)化學(xué)習(xí)逐漸成為大模型后訓(xùn)練的核心,但面臨系統(tǒng)復(fù)雜度和穩(wěn)定性的重重挑戰(zhàn)。得益于訓(xùn)練系統(tǒng)與算法層面的協(xié)同突破,Intern-S1 研發(fā)團(tuán)隊(duì)成功實(shí)現(xiàn)了大型多模態(tài) MoE 模型在 FP8 精度下的高效穩(wěn)定強(qiáng)化學(xué)習(xí)訓(xùn)練,其強(qiáng)化學(xué)習(xí)訓(xùn)練成本相比近期公開的 MoE 模型降低 10 倍。
在系統(tǒng)層面,Intern-S1 研究團(tuán)隊(duì)采用了訓(xùn)推分離的 RL 方案,通過自研推理引擎進(jìn)行 FP8 高效率大規(guī)模異步推理,利用數(shù)據(jù)并行均衡策略緩解長思維鏈解碼時(shí)的長尾現(xiàn)象;在訓(xùn)練過程中同樣采用分塊式 FP8 訓(xùn)練,大大提升訓(xùn)練效率。后續(xù),訓(xùn)練系統(tǒng)也將開源。
在算法層面,基于 Intern·BootCamp 構(gòu)建的大規(guī)模多任務(wù)交互環(huán)境,研究團(tuán)隊(duì)提出 Mixture of Rewards 混合獎(jiǎng)勵(lì)學(xué)習(xí)算法,融合多種獎(jiǎng)勵(lì)和反饋信號(hào),在易驗(yàn)證的任務(wù)上采用 RLVR 訓(xùn)練范式,通過規(guī)則、驗(yàn)證器或者交互環(huán)境提供獎(jiǎng)勵(lì)信號(hào);在難驗(yàn)證的任務(wù)上(如對(duì)話和寫作任務(wù))采用獎(jiǎng)勵(lì)模型提供的獎(jiǎng)勵(lì)信號(hào)進(jìn)行聯(lián)合訓(xùn)練。
同時(shí),訓(xùn)練算法還集成了上海AI實(shí)驗(yàn)室在大模型強(qiáng)化學(xué)習(xí)訓(xùn)練策略上的多項(xiàng)研究成果,實(shí)現(xiàn)了訓(xùn)練效率和穩(wěn)定性的顯著提升。
05.
打造更懂科學(xué)的AI助手
書生大模型自2023年正式開源以來,已陸續(xù)迭代升級(jí)多個(gè)版本,并持續(xù)降低大模型應(yīng)用及研究門檻。
書生大模型首創(chuàng)并開源了面向大模型研發(fā)與應(yīng)用的全鏈路開源工具體系,覆蓋數(shù)據(jù)處理、預(yù)訓(xùn)練、微調(diào)、部署、評(píng)測(cè)與應(yīng)用等關(guān)鍵環(huán)節(jié),包含低成本微調(diào)框架 XTuner、部署推理框架 LMDeploy、評(píng)測(cè)框架 OpenCompass、高效文檔解析工具 MinerU,以及思索式 AI 搜索應(yīng)用 MindSearch 等在內(nèi)的核心工具全面開源,已形成涵蓋數(shù)十萬開發(fā)者參與的活躍開源社區(qū)。
近期,上海AI實(shí)驗(yàn)室進(jìn)一步開源了多智能體框架Intern·Agent,可廣泛應(yīng)用于化學(xué)、物理、生物等領(lǐng)域的 12 種科研任務(wù),在大幅提升科研效率的同時(shí),亦初步展現(xiàn)出多智能體系統(tǒng)自主學(xué)習(xí)、持續(xù)進(jìn)化的潛力,為人工智能自主完成算法設(shè)計(jì)、科學(xué)發(fā)現(xiàn)等高端科研任務(wù)開辟了全新探索路徑。
未來,在研究范式創(chuàng)新及模型能力提升的基礎(chǔ)上,上海AI實(shí)驗(yàn)室將推進(jìn) Intern-S1 及其全鏈條工具體系持續(xù)開源,支持免費(fèi)商用,同時(shí)提供線上開放服務(wù),與各界共同擁抱更廣闊的開源生態(tài),攜手打造更懂科學(xué)的AI助手。
06.
Intern-S1案例展示
借助深厚的科學(xué)底蘊(yùn),Intern-S1 在面對(duì)生活中的科學(xué)問題時(shí)也是得心應(yīng)手。如下圖所示,刁鉆的驗(yàn)證碼也難不倒模型,能準(zhǔn)確地從各種有趣的混淆圖片中分辨出黑洞。
在面對(duì)藝術(shù)作品時(shí),在感性欣賞之余,Intern-S1 還能以科學(xué)的邏輯和知識(shí)體系對(duì)藝術(shù)畫作進(jìn)行理性賞析,以科學(xué)的方式“讀懂”藝術(shù)。
----- END -----
wisemodel相關(guān):
系統(tǒng)升級(jí):
系列模型:
關(guān)于wisemodel更多
1
歡迎持續(xù)關(guān)注和支持
開源社區(qū)建設(shè)需要長期堅(jiān)持和投入,更需要廣大用戶的積極參與、貢獻(xiàn)和維護(hù),歡迎大家加入wisemodel開源社區(qū)的志愿者計(jì)劃和開源共創(chuàng)計(jì)劃。期待更多開發(fā)者將開源成果,包括模型、數(shù)據(jù)集和代碼等發(fā)布到 wisemodel.cn 社區(qū),共建中立、開放的AI開源社區(qū)生態(tài)。歡迎掃碼添加wisemodel微信,申請(qǐng)加入wisemodel社群,持續(xù)關(guān)注wisemodel.cn開源社區(qū)動(dòng)態(tài)。
2
歡迎加盟wisemodel開源社區(qū)
始智AI wisemodel社區(qū)自2023年9月上線以來,逐漸成為影響力日益擴(kuò)大的中立開放的AI開源社區(qū),為了加快公司發(fā)展,我們長期需要技術(shù)、運(yùn)營等人才加盟,技術(shù)側(cè)重在AI infra、后端開發(fā),熟悉K8S、模型訓(xùn)練和推理等技術(shù), 以及熟悉開發(fā)者生態(tài)運(yùn)營的成員,歡迎感興趣的朋友加盟,可以通過添加wisemodel微信,或者將簡(jiǎn)歷投遞到郵箱:liudaoquan@wisemodel.cn
3
歡迎投稿優(yōu)質(zhì)內(nèi)容
歡迎投稿分享人工智能領(lǐng)域相關(guān)的優(yōu)秀研究成果,鼓勵(lì)高校實(shí)驗(yàn)室、大企業(yè)研究團(tuán)隊(duì)、個(gè)人等,在wisemodel平臺(tái)上分享各類優(yōu)質(zhì)內(nèi)容,可以是AI領(lǐng)域最新論文解讀、最新開源成果介紹,也可以是關(guān)于AI技術(shù)實(shí)踐、應(yīng)用和總結(jié)等。投稿可以發(fā)郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。
4
關(guān)于wisemodel開源社區(qū)
始智AI wisemodel.cn開源社區(qū)由清華校友總會(huì)AI大數(shù)據(jù)專委會(huì)副秘書長劉道全創(chuàng)立,旨在打造和建設(shè)中立開放的AI開源創(chuàng)新社區(qū),將打造成“HuggingFace”之外最活躍的AI開源社區(qū),匯聚主要AI開源模型、數(shù)據(jù)集和代碼等,歡迎高??蒲性核⒋笮突ヂ?lián)網(wǎng)公司、創(chuàng)新創(chuàng)業(yè)企業(yè)、廣大個(gè)人開發(fā)者,以及政府部門、學(xué)會(huì)協(xié)會(huì)、聯(lián)盟、基金會(huì)等,還有投資機(jī)構(gòu)、科技媒體等,共同參與建設(shè)AI開源創(chuàng)新生態(tài)。
向上滑動(dòng)查看
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.