如何衡量數據中心的高可用及容災水平
何為高可用性?是指在規定的條件和規定的時刻或時間區間內,數據中心處于可執行規定功能狀態的能力,它是數據中心可靠性、可維修性及可維護性的綜合體現,一般用MTBF(mean time between failure)和MTTR(mean time to repair)兩個可量化的參數衡量。容災就是容忍災難,即在災難襲來時從容不迫,應付自如。對于數據中心來說,容災就是使一個數據中心具有應對一定災難襲擊,保持系統持續或不間斷運行的能力。這些災難包括天災(水災、火災、地震、龍卷風、海嘯、環境惡化)和人禍(操作失誤、程序缺陷、軟件錯誤或故障、硬件老化或次品、蓄意破壞、病毒、黑客攻擊、恐怖襲擊、戰爭)。衡量一個數據中心的高可用性以及容災的水平,應該考慮三方面的內容。
靈活的流量管控
數據流量是數據中心的生命線,一旦流量轉發不了或者有缺失對應用肯定會有影響,所以數據中心一定要保證數據不能丟失。然而,數據中心擁有的各種設備成千上萬,不可避免會出這樣那樣的問題,要保證數據流量不受影響,就需要對流量進行靈活管控。首先要對數據流量進行監控,實時監測網絡重要端口數據流量的變化,當出現明顯的波動時要引起高度注意;其次要有管控手段,當出現流量異常時,通過調整網絡路由或者網絡聚合端口路徑,避開問題鏈路和轉發路由表,讓應用業務不受影響。很多的數據中心會考慮在網絡側做轉發路徑的負載分擔或者備份,當其中的部分數據鏈路出問題時,及時切換;最后是嚴格過濾數據流量,避免異常流量入侵,對數據中心造成攻擊。很多的病毒攻擊都是通過異常流量進入數據中心內部的,最終造成系統的癱瘓,所以在數據中心的入口要做嚴格管控,從網絡協議的數據鏈路層直到應用會話層均要做防御,通過防火墻、網絡設備、入侵檢測等設備,將異常流量拒之門外。所有這些靈活的流量管控方法,將大大提升數據中心的高可用性。
單元化的業務部署
傳統數據中心業務量少,往往通過一個數據機房的數十臺服務器和存儲設備就可以搞定,系統一旦出現故障,很多數據也就可能丟失了。然而,現在隨著信息數據對人們的工作和生活變得至關重要,數據信息變得異常珍貴。數據中心動不動就將很多數據丟失或者泄露的話是沒法玩的,遲早關門大吉。而且,現在的數據增長飛快,海量的數據需要及時處理和保存,不能出差錯,這時就要從數據層面考慮如何部署。數據中心引入了單元化的設計思想,即將一種數據業務進行細分,形成一個個的單元,這個單元往往處于一個數據中心之內,而具有相同數據的單元處于其它機房或數據中心中,單元之間的數據通過實時交互,保持數據準確性。數據中心進行單元化業務部署之后,應用系統實際上在多個數據中心上都在運行,數據被存放到各個數據中心內,在每個數據中心內部到處也都是單元化的功能模塊,相互之間耦合的地方很少,這樣同樣可以大幅提升數據中心的高可用性。
故障容忍能力
數據中心對業務故障的容忍能力決定了數據中心的建設等級,要求數據中心全年故障時間越短的數據中心等級越高。提升一個數據中心的故障容忍度,將是數據中心容災高能力的體現。數據中心可以在三個地方做容災:一個是數據中心內部。數據中心內部在服務器、網絡、存儲方面做各種冗余設計,達到容災目的,當其中某個環節出現故障,自動進行業務切換,確保業務層面不受影響,當將故障排除后,再將業務切回。第二個是同城的數據中心。有些時候數據中心遇到的可能是整體性的故障,比如供電中斷或者空調故障等,導致整個數據中心無法穩定運行,這時就可以將業務通過調整路由,轉移到同城的數據中心上。在同城的數據中心里有故障之前備份過來的數據,有相同的應用軟件提供,同城數據中心直接接管系統,向外提供服務。第三是異地數據中心。有些時候故障可能是全城的范圍,比如遇到了極端天氣,比如地震、海嘯、洪水、颶風等等,這些災害將對某個地區的數據中心都造成影響,多個數據中心都可能陷入癱瘓之中,這時通過異地數據中心做災備最安全。不過,由于數據中心在異地,有的設計為了安全,距離可達數萬公里,這樣網絡延遲對業務就會產生影響,所以做異地災備時,要將延遲時間考慮進去。比如一些數據庫數據做異地復制,可忍受的時效性延遲是3秒。在做異地災備時,就要考慮延遲時間是否滿足。通過在數據中心內部,同城和異地都部署備份,這將大大提升數據中心的容災水平。
數據中心通過以上三方面的建設和優化,將可大幅提升數據中心的高可用性及容災水平,這是提升數據中心等級水平的最有效方式。
責任編輯:售電衡衡
-
碳中和戰略|趙英民副部長致辭全文
2020-10-19碳中和,碳排放,趙英民 -
兩部門:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
國家發改委、國家能源局:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業
-
碳中和戰略|趙英民副部長致辭全文
2020-10-19碳中和,碳排放,趙英民 -
深度報告 | 基于分類監管與當量協同的碳市場框架設計方案
2020-07-21碳市場,碳排放,碳交易 -
碳市場讓重慶能源轉型與經濟發展并進
2020-07-21碳市場,碳排放,重慶
-
兩部門:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
國家發改委、國家能源局:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
2020年二季度福建省統調燃煤電廠節能減排信息披露
2020-07-21火電環保,燃煤電廠,超低排放
-
四川“專線供電”身陷違法困境
2019-12-16專線供電 -
我國能源替代規范法律問題研究(上)
2019-10-31能源替代規范法律 -
區域鏈結構對于數據中心有什么影響?這個影響是好是壞呢!