數據安全大體上可分為傳輸安全和存儲安全。傳輸安全指在數據的生成、傳輸和訪問過程中,確保數據的完整性、準確性及排他性。黑客、防火墻等,均屬傳輸安全的概念。存儲安全指在數據保存上確保完整、可靠和有效調用,通常包括兩層含義:一是存儲設備自身的可靠性和可用性(設備安全),二是保存在存儲設備上數據的邏輯安全(應用安全)。本文著重剖析實現存儲安全的必備要素和常見誤區,以便為企業和機構提供建設性指南。
RAID——獲取設備安全的主要工具
1988年,在整個計算機業界為提高磁盤,尤其是大容量磁盤的性能和可靠性苦苦掙扎時,美國加州伯克利大學的Patterson等人發表了《A Case for Redundant Arrays of Inexpensive Disks (RAID)》,以革命性的思路指出,利用多個獨立小磁盤組成的冗余陣列構建邏輯大磁盤,可便利地實現高性能和高可靠性,RAID行業從此興起。
的確,雖然20余年來磁盤技術飛速發展,單盤容量與存取速度均有了長足提高,存儲系統的設備安全仍然是以RAID為基石。RAID技術帶來的設備安全具備兩層含義:
高可靠——設備故障時,在降級狀態下依然能夠完成數據存儲工作;
高可用——設備故障時,系統可便利恢復容錯能力,走出降級狀態。
RAID應用的發展經歷了純軟件、內置板卡和獨立外設三個階段。純軟件和內置板卡RAID成本較低,但占用主機資源,性能受限且難于優化,尤其是與應用系統沒有解耦,當主機環境損毀時,若不能保證完全恢復配置,可能導致盤陣中的數據無法恢復。因此,目前中高檔RAID系統均已采用獨立外設的形式。
RAID——對應用安全無能為力
主機操作系統及其上應用程序運行所產生的數據,一般被稱為在線數據。保存在線數據的存儲系統因之也被稱為在線存儲。近兩年來業界熱炒的近線存儲,本質上屬于在線存儲的范疇,只是將在線數據中訪問頻次較低的數據存放到二級介質中,以節約投資成本。
對在線存儲的核心要求是保障應用靈活性,具體體現為小數據量的頻繁、隨機和并行讀寫。這一方面要求存儲介質具備相應特長——SCSI磁盤以及FC磁盤應運而生,另一方面則要求數據能夠被操作系統直接訪問,保存為特定操作系統的文件格式以便快速尋址。
操作系統是在線應用的核心。權威的計算機系統安全標準之一,美國國家計算機安全中心頒布的橘皮書(Trusted Computer System Evaluation Criteria,即受信任計算機系統評量基準)指出,操作系統的易用性與安全性無法兼顧,廣泛使用的商用操作系統,如Windows、各類Unix、Linux等,均屬于中等安全的C1或C2級別。
因此操作系統對于數據來說是不安全的,因為在這些通用平臺中,用戶或應用程序可以很容易地對數據和文件進行任何操作,包括添加、刪除、修改等。人為的有意或無意誤操作、病毒的破壞、應用軟件的Bug、程序運行沖突等,均可能導致在線數據丟失。
因此,在線系統保障應用靈活性的代價是犧牲應用安全。一個“好”主機可保萬事大吉的想法是一種可怕的謬種流傳,數據備份——應用安全的惟一保障迄今為止,保障應用安全的惟一方式是數據備份。
數據備份的目的是周期性保存在線數據的歷史,以便在線數據發生損壞時,使用備份數據恢復到錯誤發生之前的狀態,以確保數據的正常訪問。備份以保障數據存儲安全為首要目的,通過嚴格的備份策略、流程等一系列手段確保數據應用不會對備份數據的安全產生影響。
“9·11”事件后,世界金融市場的大動蕩提供了一個駭人的警告。據美國德州大學調查顯示,IT應用發展到今日美國的水平,災難性數據丟失會使94%的公司在兩年之內倒閉。從概念上講,備份是為數據購買保險。IT應用水平愈高,數據就愈成為機構的生命線,所以在進入知識經濟的今天,在備份上心存僥幸, 無異于將企業主體資產用于高風險賭博。
存檔與備份的區別
正如生命周期理論將在線數據分級為在線和近線數據一樣,離線數據亦可分為備份與存檔數據,以降低投資和運維成本。
存檔的目的是將需要長期備查或轉移到異地保存/恢復的數據存放到可移動存儲介質上。嚴格意義上講,存檔的目的不是為了保障數據安全,而只是為了實現數據倉儲。如果說備份相當于桌頭的字典,工作時會經常翻用,存檔則好像日常工作中生成的一些具長期保存價值的文字資料,被轉移到書架上或檔案館里備查。
因此,雖然存檔數據量在長時間累計后總量可以很大,但在良好設計的存儲系統中的單個備份周期內,存檔量一般只有備份量的幾分之一甚至幾十分之一。