存儲數據檢視原始碼討論檢視歷史
存儲數據 | |
---|---|
存儲數據,是數據流在加工過程中產生的臨時文件或加工過程中需要查找的信息。數據以某種格式記錄在計算機內部或外部存儲介質上。數據存儲要命名,這種命名要反映信息特徵的組成含義。數據流反映了系統中流動的數據,表現出動態數據的特徵;數據存儲反映系統中靜止的數據,表現出靜態數據的特徵。
基本信息
中文名 數據存儲 [1]
簡介
數據存儲是數據流在加工過程中產生的臨時文件或加工過程中需要查找的信息。數據以某種格式記錄在計算機內部或外部存儲介質上。數據存儲要命名,這種命名要反映信息特徵的組成含義。數據流反映了系統中流動的數據,表現出動態數據的特徵;數據存儲反映系統中靜止的數據,表現出靜態數據的特徵。
存儲介質
常用的存儲介質為磁盤和磁帶。數據存儲組織方式因存儲介質而異。在磁帶上數據僅按順序文件方式存取;在磁盤上則可按使用要求採用順序存取或直接存取方式。數據存儲方式與數據文件組織密切相關,其關鍵在於建立記錄的邏輯與物理順序間對應關係,確定存儲地址,以提高數據存取速度。
三類簡介
DAS
一、DAS(Direct Attached Storage)直接附加存儲,DAS這種存儲方式與我們普通的PC存儲架構一樣,外部存儲設備都是直接掛接在服務器內部總線上,數據存儲設備是整個服務器結構的一部分。
DAS存儲方式主要適用以下環境: [2]
(1)小型網絡
因為網絡規模較小,數據存儲量小,且也不是很複雜,採用這種存儲方式對服務器的影響不會很大。並且這種存儲方式也十分經濟,適合擁有小型網絡的企業用戶。
(2)地理位置分散的網絡
雖然企業總體網絡規模較大,但在地理分布上很分散,通過SAN或NAS在它們之間進行互聯非常困難,此時各分支機構的服務器也可採用DAS存儲方式,這樣可以降低成本。
(3)特殊應用服務器
在一些特殊應用服務器上,如微軟的集群服務器或某些數據庫使用的原始分區,均要求存儲設備直接連接到應用服務器。
(4)提高DAS存儲性能
在服務器與存儲的各種連接方式中,DAS曾被認為是一種低效率的結構,而且也不方便進行數據保護。直連存儲無法共享,因此經常出現的情況是某台服務器的存儲空間不足,而其他一些服務器卻有大量的存儲空間處於閒置狀態卻無法利用。如果存儲不能共享,也就談不上容量分配與使用需求之間的平衡。
DAS結構下的數據保護流程相對複雜,如果做網絡備份,那麼每台服務器都必須單獨進行備份,而且所有的數據流都要通過網絡傳輸。如果不做網絡備份,那麼就要為每台服務器都配一套備份軟件和磁帶設備,所以說備份流程的複雜度會大大增加。
想要擁有高可用性的DAS存儲,就要首先能夠降低解決方案的成本,例如:LSI的12Gb/s SAS,在它有DAS直聯存儲,通過DAS能夠很好的為大型數據中心提供支持。對於大型的數據中心、雲計算、存儲和大數據,所有這一切都對DAS存儲性能提出了更高的要求,雲和企業數據中心數據的爆炸性增長也推動了市場對於可支持更高速數據訪問的高性能存儲接口的需求,因而LSI 12Gb/s SAS正好是能夠滿足這種性能增長的要求,它可以提供更高的IOPS和更高的吞吐能力,12Gb/s SAS提高了更高的寫入的性能,並且提高了RAID的整個綜合性能。
與直連存儲架構相比,共享式的存儲架構,比如SAN(storage-area network)或者NAS(network-attached storage)都可以較好的解決以上問題。於是乎我們看到DAS被淘汰的進程越來越快了。可是到2012年為止,DAS仍然是服務器與存儲連接的一種常用的模式。事實上,DAS不但沒有被淘汰,近幾年似乎還有回潮的趨勢。[1]
NAS
二、NAS(Network Attached Storage)數據存儲方式
NAS(網絡附加存儲)方式則全面改進了以前低效的DAS存儲方式。它採用獨立於服務器,單獨為網絡數據存儲而開發的一種文件服務器來連接所存儲設備,自形成一個網絡。這樣數據存儲就不再是服務器的附屬,而是作為獨立網絡節點而存在於網絡之中,可由所有的網絡用戶共享。
NAS的優點:
(1)真正的即插即用
NAS是獨立的存儲節點存在於網絡之中,與用戶的操作系統平台無關,真正的即插即用。
(2)存儲部署簡單
NAS不依賴通用的操作系統,而是採用一個面向用戶設計的,專門用於數據存儲的簡化操作系統,內置了與網絡連接所需要的協議,因此使整個系統的管理和設置較為簡單。
(3)存儲設備位置非常靈活
(4)管理容易且成本低
NAS數據存儲方式是基於現有的企業Ethernet而設計的,按照TCP/IP協議進行通信,以文件的I/O方式進行數據傳輸。
NAS的缺點:
(1)存儲性能較低 (2)可靠度不高
SAN
三、SAN(Storage Area Network)存儲方式
1991年,IBM公司在S/390服務器中推出了ESCON(Enterprise System Connection)技術。它是基於光纖介質,最大傳輸速率達17MB/s的服務器訪問存儲器的一種連接方式。在此基礎上,進一步推出了功能更強的ESCON Director(FC SWitch),構建了一套最原始的SAN系統。
SAN存儲方式創造了存儲的網絡化。存儲網絡化順應了計算機服務器體系結構網絡化的趨勢。SAN的支撐技術是光纖通道(FC Fiber Channel)技術。它是ANSI為網絡和通道I/O接口建立的一個標準集成。FC技術支持HIPPI、IPI、SCSI、IP、ATM等多種高級協議,其最大特性是將網絡和設備的通信協議與傳輸物理介質隔離開,這樣多種協議可在同一個物理連接上同時傳送。
SAN的硬件基礎設施是光纖通道,用光纖通道構建的SAN由以下三個部分組成:
(1)存儲和備份設備:包括磁帶、磁盤和光盤庫等。
(2)光纖通道網絡連接部件:包括主機總線適配卡、驅動程序、光纜、集線器、交換機、光纖通道和SCSI間的橋接器
(3)應用和管理軟件:包括備份軟件、存儲資源管理軟件和存儲設備管理軟件。
SAN的優勢:
(1)網絡部署容易;
(2)高速存儲性能。因為SAN採用了光纖通道技術,所以它具有更高的存儲帶寬,存儲性能明顯提高。SAn的光纖通道使用全雙工串行通信原理傳輸數據,傳輸速率高達1062.5Mb/s;
(3)良好的擴展能力。由於SAN採用了網絡結構,擴展能力更強。光纖接口提供了10公里的連接距離,這使得實現物理上分離,不在本地機房的存儲變得非常容易。
比較
DAS、NAS和SAN三種存儲方式比較
存儲應用最大的特點是沒有標準的體系結構,這三種存儲方式共存,互相補充,已經很好滿足企業信息化應用。
從連接方式上對比,DAS採用了存儲設備直接連接應用服務器,具有一定的靈活性和限制性;NAS通過網絡(TCP/IP,ATM,FDDI)技術連接存儲設備和應用服務器,存儲設備位置靈活,隨着萬兆網的出現,傳輸速率有了很大的提高;SAN則是通過光纖通道(Fibre Channel)技術連接存儲設備和應用服務器,具有很好的傳輸速率和擴展性能。三種存儲方式各有優勢,相互共存,占到了磁盤存儲市場的70%以上。SAN和NAS產品的價格仍然遠遠高於DAS.許多用戶出於價格因素考慮選擇了低效率的直連存儲而不是高效率的共享存儲。
客觀的說,SAN和NAS系統已經可以利用類似自動精簡配置(thin provisioning)這樣的技術來彌補早期存儲分配不靈活的短板。然而,之前它們消耗了太多的時間來解決存儲分配的問題,以至於給DAS留有足夠的時間在數據中心領域站穩腳跟。此外,SAN和NAS依然問題多多,至今無法解決。
存儲價格陷阱
有時候需要對系統進行叉車式升級,但在採購過程中稍加推敲,可以避開存儲採購中可能遇到的價格陷阱。
變化萬千
存儲設備是由技術變革而造成浪費性支出的典型,但也存在其必然性和必要性。在2005年,集成驅動電子設備(IDE)主要被用作低端數據存儲,而小型計算機系統接口(SCSI)硬盤主要用於高端服務器。IDE非常慢,直到其發展為增強型IDE,之後就是SATA技術登場。SATA III2015年以及可以與高端存儲選項--串行鏈接SCSI(SAS)媲美--而且成本更低。
所有這些存儲設備都使用旋轉硬盤,這樣的硬盤無法與2015年的閃存抗衡。閃存一開始是作為攝像機存儲介質,脆弱而小眾,但2015年已經成為大多數數據中心設備廠商首選的存儲介質。
隱藏成本
即使硬件相對便宜,管理和大部分相關工具都會增加存儲的成本。
只能識別物理陣列的工具已經被虛擬化拋棄。那些能夠處理虛擬化世界存儲的軟件,發現虛擬存儲依舊依賴於底層的物理驅動器平台支持。
需要有一個戰術策略,需要在下一次技術叉車升級之前,最大化現有技術的利用。但戰術決策並不是戰略,將兩者混為一談會導致IT機構走向錯誤的技術方向。
如果當前存儲供應商一直灌輸--你閃存存儲十分脆弱,並且可用性未經證實,那麼很可能你已經買了大型SAS陣列,作為一項戰略投資。它曾經是最好的存儲,而且你希望其能夠在很長一段時間內充分發揮性能而不至於貶值的太厲害,可是2015年該戰略已經遇到問題。
以SAS驅動器故障為例,這將導致RAID6重建而嚴重影響性能。如果遇到需要的尺寸已經停產,尋找替代故障驅動器的備件會變得困難,陣列無法接受不同類型的驅動器。用戶會抱怨所有的應用非常緩慢。你想着要添加閃存存儲層來提升性能,卻發現陣列沒有接口支持固態硬盤驅動器。
唯一的選擇是購買一台新存儲,將所有數據都搬走,然後丟掉舊系統--根本無須更換驅動器,它甚至不值得去賣掉以回收資金。
在考慮更新IT平台之前,超前思考--今天看起來正確的決定,在未來就不那麼確定了。了解戰術/戰略對立和,如果需要長期的解決方案,就必須有標準與商業化。
問問供應商,現有的產品如何與舊版本協同工作。如果廠商2015年銷售的產品與舊系列不那麼兼容,那麼很有可能--無論銷售代表如何承諾--這預示着下一個叉車升級時刻。
諮詢供應商需要堅持一些標準:是否有堅持及時了解市場變化,產品是否完全支持行業標準?超出這些標準是否會與其他廠商的產品出現互操作性方面的問題?
其他廠商是否能夠為你正在採購的產品提供互補以提高附加價值?與這些合作夥伴與第三方交流,諮詢他們在供應商產品變化時,應對和變更是否容易。
真兇
數據中心數據存儲架構和控制器的異質性,是標準化基礎設施實現支撐不同工作負載目的的一大障礙。
針對所有的意願和目標,數據存儲系統核心是產品化。然而在實現不同廠商數據存儲陣列互操作的這場戰鬥上,依舊存在着不同級別上的差異。
分布式計算意味着數據中心數據存儲必須和來自不同廠商的服務器互操作。這增加了數據存儲架構標準化的要求。雲計算促使標準化有更大的進步。
數據存儲管理
數據中心存儲容量管理一直都依賴於某個相對不變的數據存儲基本技術:傳統機械硬盤。機械硬盤只有少數幾個製造商--西部數據與希捷,還有日立和東芝--硬盤本質上是一種商品。
問題需要通過實現不同品牌的陣列和控制器協同工作來解決。有些公司購買了高端、昂貴的存儲,如EMC的Symmetrix VMAX,希望通過單一的工具集來管理整個數據存儲。然而,磁盤陣列的運行是通過陣列控制器中的專用軟件和數據存儲來控制,這對創建完整功能的數據存儲管理工具來說是存在問題的。
數據存儲供應商--IBM有SAN Volume Controller,EMC則使用VPLEX,還有日立的Hitachi Data Systems,HP以及NetApp,都在吹捧各自專有的數據存儲管理工具,宣稱其能實現虛擬化存儲架構的融合。然而這些工具基本只支持自己廠商的數據存儲系統,而且在大多數情況下,還只針對部分產品。最終用戶在尋找真正的數據存儲,高功能異構數據存儲管理工具的道路上無果而終。
雲計算正在改變我們對數據存儲的看法。工作負載變得越來越混合,數據存儲需要根據不同的I/O需求管理對象,文件和塊模式。儘管如此,要支持雲架構,數據存儲基礎設施必須被作為單一的資源池來看待,組織需要能夠自動化適應工作負載的變更。只有通過提供高度標準化的數據存儲工具才可能實現這樣的功能。這一舉措已經開始,但仍然有很長的路要走。 閃存數據
標準化數據中心數據存儲容量很難只通過磁盤存儲來單獨創建。介質依賴於磁盤盤片之間的互相作用,讀/寫刺頭需要智能磁盤控制器進行調解以管理不同工作負載的需求。
閃存數據存儲的數據管理方法不同於硬盤。閃存數據存儲是直接訪問存儲架構;不需要通過磁頭尋找正確的磁盤區域來檢索數據,所以沒有延時。數據存儲管理速度的優勢意味着閃存可以應用在相同陣列的不同工作負載類型上。它也更統一跨越不同供應商的數據存儲產品實現虛擬化。
最後,標準化數據存儲可能是個真正的承諾額,而不僅僅是個談論的焦點--但還很遙遠。
數據存儲銷售商仍舊有許多不同的方式來推銷部署閃存。許多老牌數據存儲廠商通過一種混合的方式兜售:在磁盤陣列前增加獨立的閃存層。工作負載需要的數據存儲不在這個閃存層時可能會出現問題,因為控制器需要從硬盤拉取這些數據存儲。這使得某些數據存儲操作可能比純硬盤陣列還要慢。
最大化現有數據中心數據存儲容量投資的一個必要步驟是層疊純閃存和磁盤陣列系統。儘管如此,這些現有的傳統陣列會成為建造單一管理層時候的麻煩製造者。EMC ViPR數據存儲虛擬化產品已經展示了自己的承諾,為混合數據存儲架構提供了更大的控制權限。
全閃存陣列被一起捆綁在混合數據存儲的激烈競爭中。閃存數據存儲如Pure Storage、Violin Memory和Nimble Storage,提供了智能軟件可以最小化數據存儲卷,並且提供先進的數據存儲管理系統管理整個虛擬化環境。
系統融合
融合基礎設施(CI)系統遇到雲數據存儲管理時,有點攪混水的勢頭。
Nutanix--一家以數據存儲空間起家的供應商,提供超級CI平台服務,其中包括先進的數據存儲管理軟件。IBM的PureFlex系統和PureData系統,Dell的PowerEdge FX2系統,HP的Converged Infrastructure,以及其他數據存儲產品也提供了各種方法來實現直連數據存儲與CI系統整合,不僅是現有的陣列還是新型陣列都在加緊擴張與CI的融合。
還有一招可以提高服務器端數據存儲連接的速度,如PCIe接口的閃存數據存儲器。IBM已經開發了用於自己系統內部連接的方式,可以進一步加快數據存儲速度。這個CAPI連接器再次帶來了專屬問題--這將取決於IBM是否會讓連接器能與其他廠商數據存儲系統保持高水平的統一協作。融合系統仍然必須集中資源來分享利用。這將需要比我們目前能看到的還要先進的數據存儲工具來支持。