虛擬磁帶庫(Virtual Tape Library,VTL),是近年來興起的眾多磁盤備份(Backup to Disk)解決方案中,最受矚目的一項,雖然VTL問世的時間不過兩年多,在國外卻是相當熱門的產品。虛擬磁帶庫的概念非常簡單,它本質上是磁盤陣列硬件設備,但是在軟件功能上模擬磁帶備份的形式,因此對于存儲管理員來講,它就是一個磁帶庫,對它的管理如同管理一個物理磁帶庫一模一樣。
虛擬磁帶庫綜述
虛擬磁帶庫就是在備份服務器或網絡端上體現為傳統磁帶庫的磁盤或磁盤陣列。我們將用磁盤為備份介質來存儲數據,并且本身能夠仿真成物理磁帶庫的產品,稱之為虛擬磁帶庫。真正的虛擬磁帶庫,其使用方式與傳統磁帶庫幾乎相同,但由于采用磁盤作為存儲介質,備份和恢復速度可達100MB/s以上,遠遠高于目前最快的磁帶機。同時,磁盤陣列的RAID保護技術使虛擬磁帶庫系統的可用性、可靠性均比普通磁帶庫高出若干量級。
虛擬磁帶庫的概念早在10余年前即已被IBM,StorageTek等著名存儲廠商所采用。然而,受限于磁盤和虛擬磁帶技術的發展,以及廠家為了保護其既有模擬磁帶庫市場的考量,長期以來虛擬磁帶庫以價格高昂著稱,使其通常作為大型磁帶庫的前端緩存使用,且依附于特定的主機系統(“封閉系統”),市場認知度一直很低。而在近些年,磁盤技術快速發展,出現了多種類型磁盤(SCSI、FC、ATA、SATA),使單位容量磁盤存儲的價格急劇下降,進而使磁盤陣列作為備份設備的應用也愈加廣泛。
傳統磁帶庫用戶面臨的困擾
幾年前,越來越多的用戶意識到數據保護的重要性,紛紛采購磁帶庫和數據備份管理軟件來搭建自己的數據備份系統。通過磁帶庫、用戶可以進行復雜周密的介質管理,并利用備份軟件實現高度的自動化。磁帶介質還十分便于離線保存,可以定期從磁帶庫中取出,人工轉移到另一點,實現異地容災。但現在,這些用戶逐漸痛苦的意識到,自動化的數據備份雖然提供了幫助,但也帶來了很多新的問題,而這些問題正在嚴重威脅到原來設計備份方案的可行性。
讓用戶頭疼的問題
1、可靠性
磁帶庫的可靠性遠不像磁帶庫廠商宣傳的那樣,平均無故障時間(MTBF—Mean Time Between Failure)、平均無故障換帶次數(MSBF—Mean Swap Between Failure)等關鍵指標不能作為實際應用的參考基準,宣稱可以工作幾十萬小時的磁帶機在實際應用中往往一兩年就開始出現故障;磁帶庫機械臂故障的概率也很高,尤其是中端以下(包括中端)磁帶庫用戶,有相當大比例的用戶至少經歷過一次磁帶庫故障,導致備份的失敗。
磁帶遠不像想象的那樣可靠。磁帶對電磁、溫度、濕度、灰塵等條件要求十分苛刻,雖然短時間內不一定能發現問題,但往往進行數據恢復的時候,意外地發現由于磁帶的損壞,不能恢復數據。
2、性能
目前磁帶機的技術發展迅速,開放市場上主流產品中已經能夠提高單盤容量幾百GB的主流磁帶機,每秒的讀寫速度可達幾十MB。但磁帶技術的發展仍然沒有趕上數據量的爆炸式增長。同時,隨著越來越多的業務要求7×24的工作時間,每個系統能留給備份的時間越來越少。如果能夠在更短的時間內完成更多數據量的備份?用戶別無選擇,只能在磁帶庫中安裝更多的磁帶機。這意味著更多的支出、更高的故障率、當磁帶技術更新的時候還意味著更大的投資浪費。即使這樣,由于磁帶庫庫體設計的限制,能增加的磁帶機數量仍然有限。
磁帶設備的性能瓶頸不僅僅來自于讀寫速度。磁帶加載所需要的時間有時候比讀寫的時間還要長,即使是最新式的磁帶機在這一方面也沒有明顯的改進。用戶要恢復的數據可能在多盤磁帶上,如果要進行一次完整的系統恢復,由于頻繁的加載磁帶,恢復時間無法控制。
3、可擴展性
數據量不斷增加,而磁帶庫擴展的余地有限;如果一開始就采購比較大型的磁帶庫,即使采用較低的初始配置,其價格仍然很高;
4、投資回報率
一方面磁帶插槽很快就不夠使用,另一方面幾乎絕大部分磁帶空間無法充分利用。由于備份管理上的要求,很多的磁帶只寫入了幾十GB甚至幾GB,卻由于保存周期以及磁帶分類管理等要求,不能寫入新的數據。這樣,一臺號稱幾十TB的磁帶庫,可能只能利用不到一半的空間就必須考慮擴容了。
由于磁帶庫技術比較封閉,大部分配件的維修、更換必須由磁帶庫原廠商工程師完成,這使得實際故障排除時間難以控制,而且成本很高。最終,用戶會發現,用于數據保護的投資往往超出預算,最終的結果依舊不能讓人滿意或者不可預期;而備份系統本身反而增加了系統維護的工作量。這已經成為目前很多單位非常現實的問題。
5、虛擬磁帶庫:系統可用性較磁帶庫提高若干量級
虛擬磁帶庫中,一般采用磁盤陣列作為后端存儲設備。磁盤陣列采用的RAID技術能夠保證當盤陣中某一塊磁盤出現故障時,盤陣上的數據仍然可以正常讀寫。用戶可以在線更換損壞的磁盤,然后對盤陣邏輯卷進行動重建。用戶亦可設置在線熱備盤,在出現一塊磁盤(RAID6可以同時出現兩塊磁盤)損壞時,RAID控制器可以自動隔離故障盤,并立即開始邏輯卷自動重建,實現自動在線熱恢復。保持了設備的連續可用性。
而磁帶庫的機械手、磁帶驅動器和磁帶均為非封閉的精密部件,也不具備容錯能力,很容易受灰塵、潮濕等環境因素的影響而導致故障。多個部件組合后整體系統的可用性將更低。可用性低也就使維護成本提高。據統計,2002 年在美國磁帶庫的平均年維護成本高達磁帶庫采購成本的10~15%,尤其令用戶煩惱的是,磁帶庫修復必須由專業人員進行。維修反應時間長,常造成日常運營混亂。用戶常因此而被迫購買冗余磁帶驅動器 - 而驅動器恰恰是模擬磁帶庫中的主要昂貴部件,進一步加大了用戶的總體擁有成本。
6、虛擬磁帶庫:備份可靠性較傳統模擬磁帶庫提高若干量級
備份本身不是目的,必須能夠保障數據恢復,備份才有意義。而備份介質的可靠性決定了備份數據的可靠性。磁盤是密封結構,而磁帶則暴露在空氣中,易受粉塵、濕度、磁粉、粘連、霉點等因素的影響,出現讀寫錯誤。所以磁盤的MTBF(平均無故障間隔)一般為磁帶的5倍以上。顯而易見,采用受RAID保護的磁盤陣列系統存放備份數據,比只用單盤磁帶存放數據的可靠性要高得多。
為了提高磁帶存儲的可靠性,很多用戶采用磁帶復制方式,實現數據雙備份,這樣不僅費時費力,同時將造成額外的運營成本。