在當(dāng)下金融、政務(wù)等領(lǐng)域加速數(shù)字化轉(zhuǎn)型的背景下,數(shù)據(jù)庫不只是存儲數(shù)據(jù)的地方,更是保障業(yè)務(wù)正常運(yùn)轉(zhuǎn)的關(guān)鍵。AI 技術(shù)的發(fā)展給數(shù)據(jù)庫運(yùn)維帶來了機(jī)遇,比如非技術(shù)人員也能通過自然語言操作數(shù)據(jù)庫,AI 還能主動預(yù)測和處理故障、自動完成部署優(yōu)化,降低人工成本;但同時也有挑戰(zhàn),像 AI 可能會給出錯誤信息,技術(shù)棧變復(fù)雜、數(shù)據(jù)增長快對災(zāi)備要求更高,還有數(shù)據(jù)安全合規(guī)的壓力,傳統(tǒng)運(yùn)維方式已經(jīng)難以應(yīng)對這些問題。所以,ITPUB、福建海峽銀行和騰訊云數(shù)據(jù)庫一起編寫了這份白皮書,想給企業(yè)提供實(shí)用的運(yùn)維指導(dǎo)。
白皮書先分析了智能化運(yùn)維的發(fā)展趨勢,講了 AI 對傳統(tǒng)運(yùn)維的改變,比如讓數(shù)據(jù)庫交互更便捷、實(shí)現(xiàn)智能部署和故障診斷等,也指出了 AI 在運(yùn)維實(shí)踐中面臨的 AI 幻覺、知識召回率低等問題,還給出了運(yùn)維擁抱 AI 的方向,像構(gòu)建高質(zhì)量知識庫和智能問答助手等。接著梳理了運(yùn)維面臨的挑戰(zhàn),比如數(shù)據(jù)增長快對數(shù)據(jù)庫可靠性和災(zāi)備能力要求高,需求和邏輯實(shí)現(xiàn)難以把控可能引發(fā)安全風(fēng)險(xiǎn),技術(shù)棧復(fù)雜導(dǎo)致運(yùn)維難度和成本增加,應(yīng)急體系建設(shè)需要標(biāo)準(zhǔn)化和自動化,以及數(shù)據(jù)安全合規(guī)在新技術(shù)環(huán)境下出現(xiàn)新問題。
然后,白皮書結(jié)合福建海峽銀行和騰訊云數(shù)據(jù)庫的實(shí)踐,從六個維度給出了可靠運(yùn)維服務(wù)體系的建設(shè)方法。團(tuán)隊(duì)建設(shè)方面,需要有預(yù)算支持,可選擇自建、外包或混合模式,還要保障團(tuán)隊(duì)能力持續(xù)發(fā)展;要制定明確的權(quán)責(zé)制度,避免協(xié)作問題和違規(guī)操作;構(gòu)建覆蓋應(yīng)用、數(shù)據(jù)庫、硬件的可觀測體系,及時發(fā)現(xiàn)和定位問題;建立數(shù)據(jù)庫和應(yīng)急流程的標(biāo)準(zhǔn)化,降低管理難度;制定全面的應(yīng)急預(yù)案,從多個維度應(yīng)對故障,確保業(yè)務(wù)連續(xù)性;打造運(yùn)維知識庫體系,為智能運(yùn)維提供數(shù)據(jù)支持。
在高可用運(yùn)維實(shí)踐部分,介紹了騰訊云 TDSQL 數(shù)據(jù)庫的情況,包括其產(chǎn)品架構(gòu)、技術(shù)路線、適用場景等,還講了高可用性的設(shè)計(jì)原則,從基礎(chǔ)設(shè)施層面詳細(xì)說明了實(shí)例管理、集群管理和資源管理的方法,比如實(shí)例的多種部署模式、集群的數(shù)據(jù)同步和組件監(jiān)控、資源的精細(xì)化管控等,另外重點(diǎn)闡述了實(shí)現(xiàn)數(shù)據(jù)庫 5 個 9(99.999%)SLA 的關(guān)鍵,包括從源頭保障安全,采用兩地三中心等部署方案,以及福建海峽銀行在雙中心容災(zāi)實(shí)踐中的多維保障策略。
對于運(yùn)維風(fēng)險(xiǎn)可控,白皮書強(qiáng)調(diào)這是數(shù)據(jù)庫高可用的前提,從數(shù)據(jù)安全角度,備份與恢復(fù)是第一道防線,介紹了數(shù)據(jù)備份的類型、日志備份要點(diǎn)和回檔操作方法,容災(zāi)管理是最后一道堡壘,說明了同城和異地容災(zāi)方案以及 DCN 同步管理;還提到要嚴(yán)格把控部署與變更流程,實(shí)現(xiàn)多可用區(qū)部署和數(shù)據(jù)庫動態(tài)擴(kuò)縮容;構(gòu)建多級鑒權(quán)的安全防護(hù)體系,包括訪問控制、數(shù)據(jù)加密、SQL 防火墻和安全審計(jì);建設(shè)監(jiān)控告警與可觀測性體系,實(shí)現(xiàn)從被動響應(yīng)到主動防御的轉(zhuǎn)變,加速故障診斷和性能優(yōu)化,保障合規(guī)與風(fēng)險(xiǎn)控制。
最后,白皮書介紹了智能運(yùn)維交付能力的實(shí)踐,包括數(shù)據(jù)智能管家 DBbrain 和一站式遷移解決方案 DBbridge。DBbrain 能提供實(shí)時診斷優(yōu)化、安全防護(hù)、數(shù)據(jù)庫管理等功能,適用于多種運(yùn)維場景;DBbridge 可幫助企業(yè)實(shí)現(xiàn)異構(gòu)數(shù)據(jù)庫遷移和同步,降低遷移成本和復(fù)雜性。結(jié)語部分指出,未來數(shù)據(jù)庫運(yùn)維的目標(biāo)是構(gòu)建 “AI 賦能 + 全鏈路可控” 的新范式,智能化是必由之路,可靠性是生命線,安全與風(fēng)險(xiǎn)管控是底線,運(yùn)維團(tuán)隊(duì)將從成本中心向價(jià)值中心轉(zhuǎn)型,通過技術(shù)和管理創(chuàng)新提升核心競爭力。
報(bào)告節(jié)選
完整報(bào)告獲?。喝齻€皮匠報(bào)告
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.