
可擴展性
對象存儲的最大需求是跟上必須存儲的數據量大且增長迅速。21世紀的數據性質發(fā)生了變化——交易數據可以很容易地存儲在結構化的存儲設備中,但是現在我們面臨著來自社交媒體平臺、音頻、視頻、電子郵件和日志文件等的、快速增長的混合數據。
將所有這些數據放在傳統(tǒng)的塊存儲或文件存儲上不僅價格昂貴,而且管理也非常困難。雖然某些形式的數據仍然適合以傳統(tǒng)形式存儲,但大部分數據不再是——目錄結構成為了傳統(tǒng)存儲難以跟上數據增長的關鍵原因。
目錄結構的目的是允許將數據組織在一個容易訪問數據的框架中,然而隨著數據增長,目錄變大,導航越來越費勁。這會嚴重影響整體結構的性能,盡管這被認為是傳統(tǒng)存儲的亮點之一。傳統(tǒng)存儲可能在需要存儲少量活動的、非結構化數據的情況下有用,但是當處理大量不活動的數據時,它就無法勝任了。
對象存儲采用不同的方法。它包含一個平面文件空間,利用元數據描述對象,并具有唯一的標識符來定位它。這樣就可以在不受限制的情況下進行擴展,而無需通過越來越大的目錄結構協(xié)調。對象存儲被設計為用于擴展和存儲企業(yè)和云中95%的非活動數據。對象存儲能夠跟上用戶希望存儲的非結構化數據常見的高增長。
成本有效
對象存儲被設計為用于與管理與交易數據相比對性能要求沒那么高的大量數據——這減少了對昂貴架構的需求。為了確保極低的延遲,用戶通常使用緩存和層級來盡可能地降低成本。在總體需求是規(guī)模而不需要多高性能的情況下,不需要投資昂貴的閃存層和持續(xù)調優(yōu)緩存來確保最佳性能。
通過設置私有云并提供自助服務,用戶可以減少成本。人為干預費用會導致訪問數據太貴,如果通過對象存儲使所有這些數據聯(lián)機,與從磁帶恢復數據相比,用戶可以減少成本。
數據完整性
理想的情況是,無論什么時候用戶需要數據,數據始終可以檢索,并且檢索到的數據是完整的數據,而不只是其中的一部分。然而,隨著磁盤驅動器和RAID重建時間的增加,這變得困難,同時也增加了數據丟失的可能性。
對于對象存儲,這種威脅以被稱為擦除編碼的方式來處理。與通過重建磁盤驅動器的信息而保護數據的RAID不同,擦除編碼重建數據塊以保護數據。這樣就創(chuàng)造了數據完整性;谶@一點,大多數對象存儲系統(tǒng)都具有強大的一致性,用戶不必擔心過時的數據。此外,一些系統(tǒng)還提供后臺數據完整性檢查和自我修復,以確保數據保持不變。
可管理性
管理TB數量級的數據已經被認為極具挑戰(zhàn)性。想一想在PB級的規(guī)模上管理數據又會需要完全不同的方法。
傳統(tǒng)的存儲提供基于機架的管理,允許添加用戶,識別失敗的HDD,添加加密,提供新的存儲和管理數據世界中的其他日常任務。
這在GB量級之前是可行的,甚至還能通過增強功能支持TB級數據,但是對于PB級數據來說,這些就無法奏效了。隨著數據的持續(xù)增長,對有效管理數據的新方法的需求越來越明顯。
通過對象存儲,只需要管理命名空間而不是存儲空間。這意味著在對象存儲中,命名空間可以表示單個或多個存儲空間,這些機架可能是本地的,也可能是地理位置擴展的。無論配置如何,所有數據都可以通過一個單一的窗格進行管理。這體現了生產效率,并提供了可用的存儲資源的更廣泛的視圖。
云基礎架構
20世紀的應用程序使用GUI或命令行接口訪問,21世紀則使用瀏覽器等門戶。瀏覽器就像一個進入云端的網關,通過對象存儲,它還可以提供對私有云的訪問。
大多數消費級應用程序利用亞馬遜的S3協(xié)議與云進行交互。業(yè)界已經認可了該協(xié)議的潛力,因此大多數對象存儲供應商都以S3為主要訪問方式。它提供的優(yōu)點包括易于訪問、高安全性和低開銷?偠灾,云是21世紀的技術,而對象存儲是支持它的基礎設施。
雖然數據向對象存儲的轉移尚未徹底清晰,但遷移的原因正在變得明顯,企業(yè)能否跟上這一趨勢是很重要的。