虛擬磁帶庫(Virtual Tape Library,VTL),是近年來興起的眾多磁盤備份(Backup to Disk)解決方案中,最受矚目的一項(xiàng),雖然VTL問世的時(shí)間不過兩年多,在國外卻是相當(dāng)熱門的產(chǎn)品。虛擬磁帶庫的概念非常簡單,它本質(zhì)上是磁盤陣列硬件設(shè)備,但是在軟件功能上模擬磁帶備份的形式,因此對于存儲(chǔ)管理員來講,它就是一個(gè)磁帶庫,對它的管理如同管理一個(gè)物理磁帶庫一模一樣。
虛擬磁帶庫綜述
虛擬磁帶庫就是在備份服務(wù)器或網(wǎng)絡(luò)端上體現(xiàn)為傳統(tǒng)磁帶庫的磁盤或磁盤陣列。我們將用磁盤為備份介質(zhì)來存儲(chǔ)數(shù)據(jù),并且本身能夠仿真成物理磁帶庫的產(chǎn)品,稱之為虛擬磁帶庫。真正的虛擬磁帶庫,其使用方式與傳統(tǒng)磁帶庫幾乎相同,但由于采用磁盤作為存儲(chǔ)介質(zhì),備份和恢復(fù)速度可達(dá)100MB/s以上,遠(yuǎn)遠(yuǎn)高于目前最快的磁帶機(jī)。同時(shí),磁盤陣列的RAID保護(hù)技術(shù)使虛擬磁帶庫系統(tǒng)的可用性、可靠性均比普通磁帶庫高出若干量級。
虛擬磁帶庫的概念早在10余年前即已被IBM,StorageTek等著名存儲(chǔ)廠商所采用。然而,受限于磁盤和虛擬磁帶技術(shù)的發(fā)展,以及廠家為了保護(hù)其既有模擬磁帶庫市場的考量,長期以來虛擬磁帶庫以價(jià)格高昂著稱,使其通常作為大型磁帶庫的前端緩存使用,且依附于特定的主機(jī)系統(tǒng)(“封閉系統(tǒng)”),市場認(rèn)知度一直很低。而在近些年,磁盤技術(shù)快速發(fā)展,出現(xiàn)了多種類型磁盤(SCSI、FC、ATA、SATA),使單位容量磁盤存儲(chǔ)的價(jià)格急劇下降,進(jìn)而使磁盤陣列作為備份設(shè)備的應(yīng)用也愈加廣泛。
傳統(tǒng)磁帶庫用戶面臨的困擾
幾年前,越來越多的用戶意識(shí)到數(shù)據(jù)保護(hù)的重要性,紛紛采購磁帶庫和數(shù)據(jù)備份管理軟件來搭建自己的數(shù)據(jù)備份系統(tǒng)。通過磁帶庫、用戶可以進(jìn)行復(fù)雜周密的介質(zhì)管理,并利用備份軟件實(shí)現(xiàn)高度的自動(dòng)化。磁帶介質(zhì)還十分便于離線保存,可以定期從磁帶庫中取出,人工轉(zhuǎn)移到另一點(diǎn),實(shí)現(xiàn)異地容災(zāi)。但現(xiàn)在,這些用戶逐漸痛苦的意識(shí)到,自動(dòng)化的數(shù)據(jù)備份雖然提供了幫助,但也帶來了很多新的問題,而這些問題正在嚴(yán)重威脅到原來設(shè)計(jì)備份方案的可行性。
讓用戶頭疼的問題
1、可靠性
磁帶庫的可靠性遠(yuǎn)不像磁帶庫廠商宣傳的那樣,平均無故障時(shí)間(MTBF—Mean Time Between Failure)、平均無故障換帶次數(shù)(MSBF—Mean Swap Between Failure)等關(guān)鍵指標(biāo)不能作為實(shí)際應(yīng)用的參考基準(zhǔn),宣稱可以工作幾十萬小時(shí)的磁帶機(jī)在實(shí)際應(yīng)用中往往一兩年就開始出現(xiàn)故障;磁帶庫機(jī)械臂故障的概率也很高,尤其是中端以下(包括中端)磁帶庫用戶,有相當(dāng)大比例的用戶至少經(jīng)歷過一次磁帶庫故障,導(dǎo)致備份的失敗。
磁帶遠(yuǎn)不像想象的那樣可靠。磁帶對電磁、溫度、濕度、灰塵等條件要求十分苛刻,雖然短時(shí)間內(nèi)不一定能發(fā)現(xiàn)問題,但往往進(jìn)行數(shù)據(jù)恢復(fù)的時(shí)候,意外地發(fā)現(xiàn)由于磁帶的損壞,不能恢復(fù)數(shù)據(jù)。
2、性能
目前磁帶機(jī)的技術(shù)發(fā)展迅速,開放市場上主流產(chǎn)品中已經(jīng)能夠提高單盤容量幾百GB的主流磁帶機(jī),每秒的讀寫速度可達(dá)幾十MB。但磁帶技術(shù)的發(fā)展仍然沒有趕上數(shù)據(jù)量的爆炸式增長。同時(shí),隨著越來越多的業(yè)務(wù)要求7×24的工作時(shí)間,每個(gè)系統(tǒng)能留給備份的時(shí)間越來越少。如果能夠在更短的時(shí)間內(nèi)完成更多數(shù)據(jù)量的備份?用戶別無選擇,只能在磁帶庫中安裝更多的磁帶機(jī)。這意味著更多的支出、更高的故障率、當(dāng)磁帶技術(shù)更新的時(shí)候還意味著更大的投資浪費(fèi)。即使這樣,由于磁帶庫庫體設(shè)計(jì)的限制,能增加的磁帶機(jī)數(shù)量仍然有限。
磁帶設(shè)備的性能瓶頸不僅僅來自于讀寫速度。磁帶加載所需要的時(shí)間有時(shí)候比讀寫的時(shí)間還要長,即使是最新式的磁帶機(jī)在這一方面也沒有明顯的改進(jìn)。用戶要恢復(fù)的數(shù)據(jù)可能在多盤磁帶上,如果要進(jìn)行一次完整的系統(tǒng)恢復(fù),由于頻繁的加載磁帶,恢復(fù)時(shí)間無法控制。
3、可擴(kuò)展性
數(shù)據(jù)量不斷增加,而磁帶庫擴(kuò)展的余地有限;如果一開始就采購比較大型的磁帶庫,即使采用較低的初始配置,其價(jià)格仍然很高;
4、投資回報(bào)率
一方面磁帶插槽很快就不夠使用,另一方面幾乎絕大部分磁帶空間無法充分利用。由于備份管理上的要求,很多的磁帶只寫入了幾十GB甚至幾GB,卻由于保存周期以及磁帶分類管理等要求,不能寫入新的數(shù)據(jù)。這樣,一臺(tái)號稱幾十TB的磁帶庫,可能只能利用不到一半的空間就必須考慮擴(kuò)容了。
由于磁帶庫技術(shù)比較封閉,大部分配件的維修、更換必須由磁帶庫原廠商工程師完成,這使得實(shí)際故障排除時(shí)間難以控制,而且成本很高。最終,用戶會(huì)發(fā)現(xiàn),用于數(shù)據(jù)保護(hù)的投資往往超出預(yù)算,最終的結(jié)果依舊不能讓人滿意或者不可預(yù)期;而備份系統(tǒng)本身反而增加了系統(tǒng)維護(hù)的工作量。這已經(jīng)成為目前很多單位非常現(xiàn)實(shí)的問題。
5、虛擬磁帶庫:系統(tǒng)可用性較磁帶庫提高若干量級
虛擬磁帶庫中,一般采用磁盤陣列作為后端存儲(chǔ)設(shè)備。磁盤陣列采用的RAID技術(shù)能夠保證當(dāng)盤陣中某一塊磁盤出現(xiàn)故障時(shí),盤陣上的數(shù)據(jù)仍然可以正常讀寫。用戶可以在線更換損壞的磁盤,然后對盤陣邏輯卷進(jìn)行動(dòng)重建。用戶亦可設(shè)置在線熱備盤,在出現(xiàn)一塊磁盤(RAID6可以同時(shí)出現(xiàn)兩塊磁盤)損壞時(shí),RAID控制器可以自動(dòng)隔離故障盤,并立即開始邏輯卷自動(dòng)重建,實(shí)現(xiàn)自動(dòng)在線熱恢復(fù)。保持了設(shè)備的連續(xù)可用性。
而磁帶庫的機(jī)械手、磁帶驅(qū)動(dòng)器和磁帶均為非封閉的精密部件,也不具備容錯(cuò)能力,很容易受灰塵、潮濕等環(huán)境因素的影響而導(dǎo)致故障。多個(gè)部件組合后整體系統(tǒng)的可用性將更低。可用性低也就使維護(hù)成本提高。據(jù)統(tǒng)計(jì),2002 年在美國磁帶庫的平均年維護(hù)成本高達(dá)磁帶庫采購成本的10~15%,尤其令用戶煩惱的是,磁帶庫修復(fù)必須由專業(yè)人員進(jìn)行。維修反應(yīng)時(shí)間長,常造成日常運(yùn)營混亂。用戶常因此而被迫購買冗余磁帶驅(qū)動(dòng)器 - 而驅(qū)動(dòng)器恰恰是模擬磁帶庫中的主要昂貴部件,進(jìn)一步加大了用戶的總體擁有成本。
6、虛擬磁帶庫:備份可靠性較傳統(tǒng)模擬磁帶庫提高若干量級
備份本身不是目的,必須能夠保障數(shù)據(jù)恢復(fù),備份才有意義。而備份介質(zhì)的可靠性決定了備份數(shù)據(jù)的可靠性。磁盤是密封結(jié)構(gòu),而磁帶則暴露在空氣中,易受粉塵、濕度、磁粉、粘連、霉點(diǎn)等因素的影響,出現(xiàn)讀寫錯(cuò)誤。所以磁盤的MTBF(平均無故障間隔)一般為磁帶的5倍以上。顯而易見,采用受RAID保護(hù)的磁盤陣列系統(tǒng)存放備份數(shù)據(jù),比只用單盤磁帶存放數(shù)據(jù)的可靠性要高得多。
為了提高磁帶存儲(chǔ)的可靠性,很多用戶采用磁帶復(fù)制方式,實(shí)現(xiàn)數(shù)據(jù)雙備份,這樣不僅費(fèi)時(shí)費(fèi)力,同時(shí)將造成額外的運(yùn)營成本。