[導讀]在當前的許多數據中心環境下,一般多把正常運行時間定為“5個9”,即99.999%的可用性,這相當于每年的宕機時間約為5min。一般宕機時間持續一個小時甚至更長,相當于約每10-20年發生一次宕機時間。
一.在數據中心影響可用性的因素
在當前的許多數據中心環境下,一般多把正常運行時間定為“5個9”,即99.999%的可用性,這相當于每年的宕機時間約為5min。一般宕機時間持續一個小時甚至更長,相當于約每10-20年發生一次宕機時間。在通常情況下,由于眾多數據中心自系統的相互作用,要達到這個目標非常困難。99.999%的數據中心可用性意味著每個子系統的可用性級別要比這個值高得多。原因是所有子系統疊加的宕機時間必須等于或小于5min。因此對這些因素需要認真考慮,尤其是在確定減少宕機時間所需要的費用時。
在對數據中心初建、升級或審查時,應考慮每個子系統。原因是他們對于數據中心的正常運轉、宕機時間會產生巨大影響。為數據中心提供的解決方案不要一味求“全”,而是應關注所提供產品的質量。某個子系統的可用性或許能夠達到5個9,但另外有一些子系統的可用性不高,也會使整個系統的可用性級別降低。
為了實現總體系統的高可靠性,就要按子系統進行可用性“配備”。由于每個子系統實際的可用性級別不同,因此每個子系統的可用性目標也不同。例如,水冷變壓器可用性可能非常高,但泵水系統多個活動部件的可用性通常較低。這樣一來,變壓器的設計可用性標準可能是7個9,而水泵可能限制在6個9等通過為不同子系統分配可用性級別來設計可用性目標,就能夠把該解決方案應用于數據中心時使總體系統實現可用性目標。
二.設計數據中心時需考慮的幾個主要問題
物理結構
數據中心的物理結構就是能夠安裝數據中心諸設備并保護其免受環境條件影響的門窗、墻壁、地板和天花板等。檔考慮在何地建設、如何建設時,需要采取適當的預防措施,比如地板承重、建筑物的耐震等級、周圍環境(電網情況、季節雷雨情況、干擾情況)等,要留有充分的余地,一旦數據中心建成后,要想修改極其困難難。因此,必須做到細心調查,準確預測,認真規劃,以確定所需數據中心有關數據局。此外,該建筑結構一般要使用數十年,如果可能,機房結構的設計應能夠允許將來進行簡單的改造和擴建。
配電
1、機房輸入電源(俗稱一次電源)。電源是數據中心所有設備運轉的動力,從照明、加熱、冷卻、除濕,到所有的IT設備都需要它。為了保持數據中心的正常運轉,需要認真考慮如何進行電源的分配。該子系統的重要組成部分包括:市電電源輸入接口、電纜、端子排、配電盤、變壓器、斷路器、轉接開關、插座板等。如果系統對可用性的要求非常高,則需要將某些部分或全部冗余。
2、電源備份。數據中心電源備份通常是指用于保護負載免受劣質電源影響的高質量電源,并在電網掉電時為負載提供不間斷的電源。通常都采用電池做臨時供電電源,可以提供5min到幾個小時的后備時間。與其他關鍵子系統一眼個,如果需要高可用性,冗余同樣必不可少。
3、發電。如果市電斷電持續時間很長,僅使用UPS標準配置的電池是不夠的。因此,大部分數據中心都采用了現場后備發電的方法。這些發電系統以柴油、天然氣或其他碳氫化合物燃料為動力,可以為現場提供長時間的高質量電源。如遇超長時間市電斷電,發電機燃料的及時供應或大型存儲容器要有足夠的容量維持關鍵系統運轉。同樣,當系統的可用性要求很高時,也必須使發電機冗余備份。隨著技術的發展,燃料電池將很快投入使用,可省去發電機的噪聲。
空調
加熱和冷卻子系統為數據中心提供基本的環境條件。由于在大部分情況下計算機設備產生的熱量非常大,因此必須認真考慮散熱問題。尤其是大量采用占地面積小的高密度服務器,使數據中心的電源功率密度快速增加,有可能形成很多熱量難以散發的“熱點”。散熱方式、氣流方向及路徑,在規劃未來電源功率密度水平和數據中心發展時必須要考慮周全。當然,冷卻過程會伴隨著濕度的升高,故還需增加除濕手段。
在寒冷的冬季,機房需要升溫,升溫時往往伴隨著干燥,因此,需要增加加濕措施。不論是加濕還是除濕,