作者:ITValue秦麗|編輯 / 日期:2010-11-29
ITValue點評:
很多企業都在面臨一大難題,即:如何對他們的基礎設施、技術和網絡進行災難備份與恢復,以保證其業務連續性。一個高性價比的容災解決方案可以幫助企業以一定的IT投入獲得最大的產出,同時很好地保護企業的業務免于災難事件的影響。
在使用虛擬化災難恢復策略時需要考慮以下要點:
1、恢復容量
制定虛擬化災難恢復策略的時候很重要的一點是考慮容量。企業通常會認為恢復時容量利用率不會超過100%。事實上,由于恢復的啟動階段會將系統推向極致,所需容量可能會超過生產容量。此外,恢復過程中有大量的跟進工作,這些工作也需要容量。
2、配套資源
恢復能力雖然是需要考慮的重點,但其它各種支持生產環境的要素也要考慮在內。這些要素包括處理器資源(存儲、設備界面等)、磁盤資源(存儲陣列、存儲場地網絡SANs、磁盤簇等)、外圍設備(控制單元、終端、刀片等)、基礎設施(外部交換機)和網絡連通性(交換機、帶寬等)。
3、資源獨立、網絡冗余和可測量性
避免災難恢復失敗的一個重點是確保虛擬化資源保持獨立,而不需要依賴主生產環境。網絡冗余是指不僅為內部用戶,還必須為外部用戶(如客戶、業務伙伴、供應商等)提供接入??蓽y量性則是處理災難恢復和生產運營的工作量峰值所必需的。
4、恢復計劃測試
制定虛擬化災難恢復策略非常重要的一點是考慮對計劃的有效測試。測試應在系統層面上全面進行,以有效地了解特定時間段內工作量對虛擬化資源的要求,同時驗證業務的完整性和基礎設施的有效性。雖然局部的功能測試更容易安排,但卻無法保證測試結果的真實性,因此會導致測試的效果大打折扣。
5、重設工作量計劃
不論是真實情況下還是演練過程中,恢復時都應該制定詳細的計劃來管理整個過程中不斷變化的工作量。該計劃應該包括一份高層認可的正式時間表,一份恢復時資源分配的備選工作計劃,一個對偏移工作量的日常備份流程,以及一份在備用場地復原這些工作的經過測試的恢復計劃。
6、災難恢復風險控制
在制定虛擬化災難恢復策略時應考慮到給業務帶來的風險。由于虛擬化的固有弱點,距離可能會受到限制,但地理的多樣性必須被考慮在內?;謴蛨鏊鶓撆c企業已有的風險規避策略所明確的風險承受能力相符,而不應該是滿足技術要求的結果。
7、清晰明確的工作量
在確定構成虛擬池的具體資源之前,很重要的一點是要了解災難恢復的工作量。明確業務的優先次序和臨界點,制定出與處理流程、應用的集成和相互依賴性、以及IT支持模塊相關的詳細計劃,從而保證虛擬化環境的可恢復性。
8、保持完整性的規則
包括問題、變更、事件、配置和資產管理在內的嚴格的系統管理規則是實施任何新的虛擬化災難恢復策略的前提。這對保持恢復環境的完整性是至關重要的,同時對虛擬化資源池的最終操作、監控和維護的有效性也是至關重要的。
9、業務和IT報告
對災難恢復項目進程的跟蹤、狀態的傳遞和結果的報告是所有災難恢復項目的重要輸出,對于判斷IT功能虛擬化所進行的大量投入的效果是非常重要的。
文章來源:中國IDC圈