如何建立大型數據中心的運維管理平臺
很多數據中心管理人員開始籌劃或者進行數據中心升級計劃,對于這些數據中心的建設,建設者和管理者往往將目光聚焦在其“綠色標簽”上,從照明、制冷的節能,到IT基礎設施的功耗,都會被上上下下掃描一番。在這種形勢下,“高大全”的數據中心建成了。如果說數據中心的正式運營標志了啟動了其生命起點,而對于其生命周期中的系統維護,則將伴隨著數據中心度過漫長的數十年。
在一些數據中心管理者的眼中,數據中心IT運維并不是新鮮事兒,無論是自建維護團隊還是外包第三方服務,都是必需必要的。然而,他們忽視了非常重要的一點——在后信息時代下,傳統的IT服務模式,還能繼續下去嗎?
后信息時代的一個重要特點是數據的大批量集聚,表現為數據來源各式各樣、數據規模飛速增長、數據結構紛繁復雜、數據處理手段百出,數據應用面面俱到。海量數據的爆發式增長,需要有足以支撐的IT硬件和軟件系統。而對于這些無論從規模還是從功能上都大幅升級的IT系統,如果還堅持傳統的“走讀式”IT服務,將會遭遇巨大的挑戰。
傳統IT運維通常采用日常巡檢與故障排除的組合式服務,需要IT服務人員要有較高的耐心和細心。對于有數十臺IT設備的中小規模數據中心,這樣的服務方式足以滿足要求。但是,當數據中心的規模以數千臺甚至上萬臺IT設備來計時,這種“手工作業”的模式則會被淘汰,取而代之的是“自動化”模式的IT管理服務。
專家認為,要支撐大型數據中心的可靠運維,必須依賴一個統一的運維管理平臺。它應該具備這樣的功能:
一、 覆蓋數據中心全部IT設備,即將所有設備統一在一個平臺上進行管理。
二、 該平臺能夠實時監控管理對象,使IT人員的管理觸角可同時延伸至所有設備。
三、 能夠預警,即通過閾值的正確設定,確定預警門檻,既能夠“防患于未然”,又不會“虛驚一場”。
四、 能夠自動數據分析,具有報表的自動生成功能,使管理運維工作及時、真實地反應出來。
具備了以上性能的運維管理平臺,應該說只是具有的基本的功能框架,還需要大量的細節來加以豐富。例如:對于該平臺的訪問模式,是采用單一模式還是多樣模式?是否接受遠程訪問?告警內容以何種方式發送給對應人員,語音、短信,抑或電子郵件?如何在自定義周期內進行自動觸發,從而完成IT運維的例行巡檢,并生產巡檢報告?如何聯動分析告警信息,從而判斷單點告警事件的影響面有多大?如何進行風險評估,并提前解決風險點?
以上種種,看似瑣碎,實則需要運維管理平臺的建設者擁有豐富的實踐管理經驗,而并非閉門造車可以產生的。比如,倘若沒有深厚的技術和經驗積淀,很難設立準確的閾值,設的高了,意味著小事件變成大事件了才為人所知;而設的低了,則動不動警報亂響,大驚小怪,白白耗費各種資源。再如,運維人員和管理人員對數據分析結果要求不同,運維管理平臺就要提前明確這些各自不同的要求,從而生成符合需要的分析報表和函數圖形。
責任編輯:廖生玨
-
碳中和戰略|趙英民副部長致辭全文
2020-10-19碳中和,碳排放,趙英民 -
兩部門:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
國家發改委、國家能源局:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業
-
碳中和戰略|趙英民副部長致辭全文
2020-10-19碳中和,碳排放,趙英民 -
深度報告 | 基于分類監管與當量協同的碳市場框架設計方案
2020-07-21碳市場,碳排放,碳交易 -
碳市場讓重慶能源轉型與經濟發展并進
2020-07-21碳市場,碳排放,重慶
-
兩部門:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
國家發改委、國家能源局:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
2020年二季度福建省統調燃煤電廠節能減排信息披露
2020-07-21火電環保,燃煤電廠,超低排放
-
四川“專線供電”身陷違法困境
2019-12-16專線供電 -
我國能源替代規范法律問題研究(上)
2019-10-31能源替代規范法律 -
區域鏈結構對于數據中心有什么影響?這個影響是好是壞呢!