【應(yīng)用】撩開分布式存儲神秘面紗
我們在2011年開始研究試驗云計算技術(shù),到2013年形成了長距雙活資源池體系,并引入SDNOverlay技術(shù)進(jìn)行測試和試點(diǎn),通過SDN實現(xiàn)彈性網(wǎng)絡(luò)資源池,強(qiáng)化網(wǎng)絡(luò)自動化部署能力,加快資源交付時間。資源池中計算、網(wǎng)絡(luò)彈性部署能力相對較強(qiáng),而原先資源池存儲主要采用的傳統(tǒng)集中FCSan技術(shù),在面對資源池各種各樣存儲需求時逐漸成為瓶頸,存儲技術(shù)門檻高、成本高、并發(fā)IO受限、線性擴(kuò)展能力差以及不具備按需分配的能力成為急需要解決的問題。于是萌發(fā)了想利用傳統(tǒng)的X86服務(wù)器+廉價的SATA盤作為塊存儲的想法。2013年的10月,在杭州西湖邊的青騰茶館第一次遇到了顧炯炯大師,在交流了華為的虛擬化軟件的同時,我也講了基于X86存儲的基本想法,炯炯大師表示華為已經(jīng)在開發(fā)基于X86分布式塊存儲,預(yù)計可以在2014年開發(fā)完成。現(xiàn)在回想起來,當(dāng)時炯炯大師的說法給我很大的信心,而我的想法也給炯炯大師很大的信心。后來也和國內(nèi)外的存儲廠家進(jìn)行了交流很溝通。2014年通過前期測試和招標(biāo)(華為、中興、EMC、HP、HDS應(yīng)標(biāo))最終確定采用華為FusionStorage分布式塊存儲。在2014年年底投入正式商用,2015年2月6日聯(lián)合華為召開新聞發(fā)布會,是業(yè)界第一個投入商用的分布式塊存儲。在后來的使用中,和我預(yù)想的一樣成功替代傳統(tǒng)FCSAN高端存儲,自從使用FusionStorage后,就沒有新購或擴(kuò)容FCSAN。
分布式存儲的架構(gòu)
一般來說,分布式存儲不管是文件存儲、對象存儲還是塊存儲的基本架構(gòu)都是大同小異的。即客戶端或應(yīng)用端、元數(shù)據(jù)(MDS)服務(wù)器和數(shù)據(jù)節(jié)點(diǎn)服務(wù)器。
客戶端和元數(shù)據(jù)服務(wù)器之間交互是“信令交互”,而客戶端到數(shù)據(jù)節(jié)點(diǎn)是“媒體交互”。元數(shù)據(jù)服務(wù)器或通過數(shù)據(jù)節(jié)點(diǎn)服務(wù)器獲取各節(jié)點(diǎn)服務(wù)器的基本配置情況和狀態(tài)信息。
比如,客戶端需要讀取某一個文件的信息,客戶端會將相應(yīng)的要求發(fā)給元數(shù)據(jù)服務(wù)器:“喂!我需要XXX,存在哪里了”,元數(shù)據(jù)服務(wù)器查詢后回答“你到xxx服務(wù)器的xxx地址+xxx服務(wù)器的xxx地址取”。客戶端拿到這個指示后,向這2臺服務(wù)器發(fā)出指令,數(shù)據(jù)節(jié)點(diǎn)獲得指令后,將相應(yīng)的數(shù)據(jù)返回給客戶端。
大家可能都會奇怪,為什么塊存儲、對象和文件的架構(gòu)都是一樣的。有什么區(qū)別呢?我們在前面基礎(chǔ)知識講述中,塊存儲是一種裸設(shè)備,它是將存儲設(shè)備以“塊”的方式直接提供給客戶,由客戶自己的操作系統(tǒng)里的文件系統(tǒng)進(jìn)行管理。即分布式塊存儲里是沒有文件系統(tǒng)的,是通過客戶端直接將最簡單明了的命令傳遞給存儲的“塊”來執(zhí)行。而對象存儲和文件存儲雖然結(jié)構(gòu)類似,但并不將存儲底層的“塊”直接提供出來,而是通過隱藏著一個文件系統(tǒng),包裝成為“文件”或“對象”提供出來。這些存儲“不挑”操作系統(tǒng)或終端,最終執(zhí)行命令的是存儲里面的文件系統(tǒng)操控存儲執(zhí)行的,所以共享性很好。文件存儲通過“目錄+文件名+偏移量”來檢索,文件間有目錄層次的;而對象存儲采用“唯一對象ID+偏移量”來檢索,對象扁平存儲的,是沒有層次的。而且塊、對象、文件存儲是可以相互轉(zhuǎn)換的,這個問題以后單獨(dú)講。
華為的FusionStorage是一個典型的“塊”存儲,我們來了解一下結(jié)構(gòu)。
FusionStorage也分成了MDC、OSD和Client三部分。和其他分布式存儲重大的差別是,MDC是記錄、更新OSD服務(wù)器、磁盤等的狀態(tài),并把這些狀態(tài)數(shù)據(jù)實時同步給Vbs,由Vbs計算出來數(shù)據(jù)所落的位置。MDC可以單獨(dú)部署,也可以集中部署,也可以分布部署。如果MDC全出現(xiàn)故障,并不會影響存儲的正常運(yùn)行。但是如果在MDC故障期間OSD的狀態(tài)發(fā)生了改變,比如某塊磁盤故障,就會導(dǎo)致部分IO訪問不正常。所以一般MDC部署在3臺OSD上,確保安全。一般分布式存儲的MDC采用的是數(shù)據(jù)庫或內(nèi)存儲數(shù)據(jù)庫來記錄數(shù)據(jù)塊和物理位置關(guān)系。客戶端向MDC發(fā)出詢問位置的請求,MDC查詢數(shù)據(jù)庫后返回請求數(shù)據(jù)的存儲位置。這種方法存儲訪問的速度較慢,而且MDC作為交通的“樞紐”,絕對是整個存儲的核心,當(dāng)MDC發(fā)生故障,會導(dǎo)致整個存儲都不能使用。但是采取這個方式,也有好處,比如可以根據(jù)不同需求設(shè)置不同的副本策略等。
責(zé)任編輯:蔣桂云
-
重新審視“雙循環(huán)”下的光伏行業(yè)
2020-11-02光伏行業(yè),光伏技術(shù),光伏出口 -
能源轉(zhuǎn)型進(jìn)程中火電企業(yè)的下一程
2020-11-02五大發(fā)電,火電,煤電 -
國內(nèi)最高額定水頭抽蓄電站2#引水上斜井滑模混凝土施工順利完成
2020-10-30抽水蓄能電站,長龍山抽水蓄能電站,水力發(fā)電
-
能源轉(zhuǎn)型進(jìn)程中火電企業(yè)的下一程
2020-11-02五大發(fā)電,火電,煤電 -
資本市場:深度研究火電行業(yè)價值
2020-07-09火電,火電公司,電力行業(yè) -
國家能源局印發(fā)2020年能源工作指導(dǎo)意見:從嚴(yán)控制、按需推動煤電項目建設(shè)
2020-06-29煤電,能源轉(zhuǎn)型,國家能源局
-
高塔技術(shù)助力分散式風(fēng)電平價上網(wǎng)
2020-10-15分散式風(fēng)電,風(fēng)電塔筒,北京國際風(fēng)能大會 -
創(chuàng)造12項世界第一!世界首個柔性直流電網(wǎng)工程組網(wǎng)成功
2020-06-29?清潔能源,多能互補(bǔ),風(fēng)電 -
桂山風(fēng)電項目部組織集體默哀儀式
2020-04-08桂山風(fēng)電項目部組織