人工智能技術(shù)的爆發(fā)式增長引發(fā)算力需求激增,數(shù)據(jù)中心能源消耗壓力驟增。作為能耗占比近50%的核心設(shè)備,服務(wù)器節(jié)能技術(shù)成為破局關(guān)鍵。元腦服務(wù)器第八代平臺通過五大創(chuàng)新維度——革命性液冷方案、高效能元件配置、智能風(fēng)道優(yōu)化、模塊化供電架構(gòu)、精準(zhǔn)溫控策略,實(shí)現(xiàn)整機(jī)性能跨越式升級,散熱效率飆升85%,綜合能耗直降13%,為數(shù)據(jù)中心打造PUE極致標(biāo)桿,構(gòu)筑綠色算力新范式。
全棧產(chǎn)品“All in液冷”,實(shí)現(xiàn)節(jié)點(diǎn)級、機(jī)柜級、數(shù)據(jù)中心級三維解決方案
實(shí)現(xiàn)綠色降碳、降低PUE的關(guān)鍵路徑在于液冷技術(shù)的落地。元腦服務(wù)器第八代平臺延續(xù) “All in 液冷” 戰(zhàn)略,憑借全棧液冷能力,為數(shù)據(jù)中心提供全方位的液冷整體解決方案。
■ 在服務(wù)器節(jié)點(diǎn)方面,創(chuàng)新性導(dǎo)入Closed-loop內(nèi)循環(huán)散熱器,無需CDU即可在傳統(tǒng)風(fēng)冷機(jī)柜內(nèi)部署液冷設(shè)備。相比較傳統(tǒng)冷板散熱器依賴?yán)浒灞粍觽鲗?dǎo)熱量,Closed-loop內(nèi)循環(huán)散熱器通過集成熱源、液體/冷媒循環(huán)管路、熱交換器、回流系統(tǒng)等形成完整的封閉散熱回路,采用主動式泵驅(qū)循環(huán),冷媒熱傳導(dǎo)效率顯著高于金屬被動導(dǎo)熱,尤其適用于高功率密度設(shè)備。其全封閉設(shè)計(jì)大幅降低液體泄漏風(fēng)險(xiǎn),能適應(yīng)更復(fù)雜的工作環(huán)境。同時,Closed-loop內(nèi)循環(huán)散熱器精巧的體積設(shè)計(jì)減少對主板區(qū)域的占用,模塊化架構(gòu)支持靈活擴(kuò)展,可通過增加散熱器面積、升級泵/介質(zhì)的流量提升散熱能力,靈活適應(yīng)更高熱負(fù)載。這一創(chuàng)新設(shè)計(jì)在保持傳統(tǒng)風(fēng)冷機(jī)柜兼容性的同時,實(shí)現(xiàn)了散熱效率的顯著提升。
Closed-loop液冷散熱器工作原理
■ 針對機(jī)柜級液冷,全新一代元腦液冷整機(jī)柜服務(wù)器ORS6000G8基于OCP開放標(biāo)準(zhǔn)設(shè)計(jì),可同時兼容19/21英寸節(jié)點(diǎn),面向未來架構(gòu)演進(jìn),實(shí)現(xiàn)全平臺多元算力兼容。ORS6000G8支持供電、供液雙盲插,極大簡化安裝與運(yùn)維流程,還可根據(jù)客戶數(shù)據(jù)中心實(shí)際條件,提供一體化或組合交付方案,滿足不同場景需求。
19英寸節(jié)點(diǎn)(左) 21英寸節(jié)點(diǎn)(右)
■ 面向數(shù)據(jù)中心液冷,元腦服務(wù)器第八代平臺可搭配智能CDU(冷量分配單元)控制系統(tǒng),實(shí)現(xiàn)冷量和電量的實(shí)時按需分配,有效降低CDU的耗電量,助力液冷數(shù)據(jù)中心實(shí)現(xiàn)PUE無限接近1。同時,借助AI技術(shù),該方案能對能耗展開實(shí)時監(jiān)測,通過實(shí)時采集服務(wù)器運(yùn)行時的電能消耗數(shù)據(jù),結(jié)合數(shù)據(jù)中心內(nèi)的溫度、濕度、氣流等多方面因素,進(jìn)行綜合分析與動態(tài)優(yōu)化,結(jié)合碳足跡管理技術(shù),可節(jié)省約15%~20%的能耗。
此外,該方案支持模塊化數(shù)據(jù)中心和預(yù)制化數(shù)據(jù)中心架構(gòu),可高效搭載液冷散熱系統(tǒng)。通過冷源預(yù)制化、管路標(biāo)準(zhǔn)化及三重防漏機(jī)制,實(shí)現(xiàn)液冷系統(tǒng)的快速部署與安全可靠運(yùn)行。在滿足快速交付、高密部署和彈性擴(kuò)容需求的同時,助力數(shù)據(jù)中心提升能效、降低碳排放。
高效鈦金電源提升電力轉(zhuǎn)化效率,5年節(jié)省千萬運(yùn)維成本
算力的盡頭是電力,元腦服務(wù)器第八代平臺還創(chuàng)新性地導(dǎo)入了自研氮化鎵(GaN)鈦金電源,相比市面?zhèn)鹘y(tǒng)碳化硅(SiC)的鈦金電源,具備更高的功率密度、耐溫性、耐壓性和可靠性,電源峰值轉(zhuǎn)換效率可達(dá)98%以上,并已率先通過80PLUS認(rèn)證。
氮化鎵(GaN)鈦金電源
據(jù)測算,在一個1萬臺服務(wù)器規(guī)模的數(shù)據(jù)中心場景中,模擬客戶側(cè)處于30%~50%的典型業(yè)務(wù)負(fù)載狀況下,針對單臺功耗為2kW的服務(wù)器,若采用鈦金電源替換鉑金電源,五年運(yùn)維期內(nèi)可節(jié)省約1000萬元成本,為客戶創(chuàng)造極為可觀的經(jīng)濟(jì)價值。同時,鈦金電源還導(dǎo)入了更精準(zhǔn)的故障診斷系統(tǒng),通過新增計(jì)時系統(tǒng)以及BMC時間同步策略,確保電源內(nèi)部時間與系統(tǒng)時間一致。此外,該電源還可對自身溫度、電流等信息實(shí)時監(jiān)控,實(shí)現(xiàn)提前預(yù)警和精準(zhǔn)定位故障,為系統(tǒng)穩(wěn)定運(yùn)行提供有力保障。
優(yōu)化風(fēng)冷散熱風(fēng)道及風(fēng)扇,散熱效率提升85%
隨著芯片功耗升高,整機(jī)散熱面臨更嚴(yán)苛的挑戰(zhàn)。為滿足傳統(tǒng)風(fēng)冷數(shù)據(jù)中心客戶的需求,元腦服務(wù)器第八代平臺對散熱風(fēng)道及風(fēng)扇系統(tǒng)進(jìn)行了全面升級。例如,針對關(guān)鍵核心部件、高功耗零件設(shè)計(jì)獨(dú)立風(fēng)道,配合單風(fēng)扇的散熱調(diào)控,通過系統(tǒng)導(dǎo)流結(jié)構(gòu)設(shè)計(jì),聚集風(fēng)流,減少部件熱量累積,達(dá)到最高效利用系統(tǒng)風(fēng)流的目的。
同時,還創(chuàng)新性驗(yàn)證和導(dǎo)入了PCIe標(biāo)卡風(fēng)扇部件,配置于OCP上方slot槽位,出風(fēng)口位置正對OCP光模塊,有效解決OCP光模塊等熱敏部件的關(guān)鍵散熱問題,通過不斷改良風(fēng)扇充磁方式、改進(jìn)扇葉曲面設(shè)計(jì),經(jīng)過上百次形狀修正和實(shí)際驗(yàn)證,最終選定高效能渦流風(fēng)扇,大幅節(jié)省整機(jī)系統(tǒng)風(fēng)扇功耗。
PCIe標(biāo)卡風(fēng)扇部件
如下圖所示,比對200G OCP網(wǎng)卡的散熱情況,整機(jī)系統(tǒng)在idle、70%load和100%load分別節(jié)能40.5W、116.5W、200.5W,最多可降低85%系統(tǒng)風(fēng)扇功耗。
整機(jī)系統(tǒng)不同業(yè)務(wù)負(fù)載下節(jié)能效果對比
全面解耦與按需供電架構(gòu)創(chuàng)新,供電效率提升3%
元腦服務(wù)器第八代平臺采用風(fēng)扇板、管理板與主板完全解耦的全新架構(gòu),一方面,極大降低了因風(fēng)扇板及管理板故障導(dǎo)致計(jì)算主板更換的概率,減小業(yè)務(wù)異常中斷風(fēng)險(xiǎn);另一方面,相較于上一代產(chǎn)品,在相同空間布局下,與上一代產(chǎn)品相比,在相同空間布局上可以設(shè)計(jì)部署更高散熱效率、更大散熱面積的異形散熱器,以支持性能不斷升高、功耗也不斷攀升的處理器平臺,優(yōu)化整機(jī)散熱效率。
在供電設(shè)計(jì)上,元腦服務(wù)器第八代平臺首創(chuàng)按需供電架構(gòu),將3V3/5V供電接口從主板遷移至riser或者背板,實(shí)現(xiàn)主板和riser、背板的供電解耦,最大程度減少了線纜中的電能損耗。主板上POL電流從30A降至10A級別,極大簡化供電設(shè)計(jì),在CPU滿載時可提升3%供電效率,能夠依據(jù)客戶存儲及擴(kuò)展需求,精準(zhǔn)按需進(jìn)行電能供給,實(shí)現(xiàn)整機(jī)系統(tǒng)降本增效的雙重目標(biāo)。
新舊方案對比
精細(xì)化散熱策略全面升級,整機(jī)功耗降低13%
元腦服務(wù)器第八代平臺在全局部件溫度監(jiān)控策略上實(shí)現(xiàn)了全面優(yōu)化,實(shí)現(xiàn)在性能翻倍的同時,整機(jī)功耗降低13%。針對普通網(wǎng)卡、NVME、M.2、智能網(wǎng)卡、GPU 等關(guān)鍵部件,增設(shè)了更多溫度監(jiān)控傳感器,能夠依據(jù)部件 ID 進(jìn)行精準(zhǔn)的信息識別和差異化風(fēng)扇控制。
針對本身不支持溫度讀取的部件,根據(jù)部件的風(fēng)量需求特點(diǎn),區(qū)分為高、中、低風(fēng)險(xiǎn)三個等級,區(qū)分調(diào)用不同的風(fēng)扇控制策略,保證部件正常運(yùn)行、性能穩(wěn)定的同時,大幅度降低風(fēng)險(xiǎn)部件配置運(yùn)行時的功耗;根據(jù)服務(wù)器不同狀態(tài)下部件的發(fā)熱特點(diǎn),細(xì)化出部件在不同運(yùn)行狀態(tài)下的監(jiān)控需求,保證對核心部件在待機(jī)、開機(jī)過程、開機(jī)完成等狀態(tài)進(jìn)行全面監(jiān)控。
精細(xì)化散熱策略
在分區(qū)調(diào)控策略方面,平臺將原本的分區(qū)調(diào)控進(jìn)一步細(xì)化為單風(fēng)扇級的精細(xì)化調(diào)控。系統(tǒng)分區(qū)從 2 區(qū)精細(xì)擴(kuò)展至 6 區(qū)或 8 區(qū),通過更細(xì)致的區(qū)域劃分,能夠精準(zhǔn)控制單風(fēng)扇轉(zhuǎn)速,有效避免所有風(fēng)扇同時提速的情況。單個風(fēng)扇根據(jù)不同區(qū)域需求設(shè)置不同轉(zhuǎn)速,使系統(tǒng)散熱更加貼合實(shí)際情況。此外,散熱策略還完善了部件識別機(jī)制,通過判定部件位置與類型,設(shè)置差異化風(fēng)扇控制參數(shù)及溫度閾值。通過這種更為精準(zhǔn)的風(fēng)扇調(diào)控策略,整體可降低 13% 的系統(tǒng)功耗。
元腦服務(wù)器第八代平臺構(gòu)建全生命周期節(jié)能體系,從研發(fā)設(shè)計(jì)到生產(chǎn)交付形成綠色閉環(huán)。通過碳足跡追蹤技術(shù)和模塊化架構(gòu)設(shè)計(jì),實(shí)現(xiàn)產(chǎn)品全鏈條節(jié)能減排。未來將持續(xù)深耕綠色計(jì)算領(lǐng)域,以創(chuàng)新散熱解決方案與智能供電系統(tǒng)雙輪驅(qū)動,賦能千行百業(yè)搭建低碳算力基礎(chǔ)設(shè)施,推動數(shù)字經(jīng)濟(jì)可持續(xù)發(fā)展。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.