傳統磁碟陣列(RAID)的衰落與新一代檔案系統 ZFS 之興起


JQJQ wrote:
ZFS 比較好奇的地方,當硬碟採用該格式系統後,讀寫性能剩多少,
CPU 負載呢。魚與熊掌無法兼得。


主要就靠處理器,因為不像 RAID 卡般有自己的獨立運算單元(但剛發現 Indra Network 推出了硬件 compression engine 可供 ZFS 檔案系統加速用)

但正常情況下確實是 cpu 使用率會高(一般軟件 RAID 也一樣吧)

nakamichi77 wrote:
ZFS 跟FAT32 NTFS NFS .....等等一樣, 就是一種filesystem, 而RAID 他本來就是屬於OS independent, 他是不包含filesystem 的.
NAS 基本上就等於filesystem+RAID 透過網路, 整合的一台機器. 早期要做到這樣, 就是用一台電腦主機+RAID+網卡 也是可以搞定的.
而RAID 簡單的說, 就是一顆具備HDD 容錯, 高效能, 高容量的HDD 而已. 要什麼樣的filesystem 則是由電腦主機決定的.
RAID 也可以format 成ZFS 的filesystem 吧. 也因為這樣, 這有什麼衰落興起的問題嗎? RAID 再好也是需要HDD, filesystem 再強, 也是需要Hardware RAID的. 這沒有衝突的問題~~
NAS 之所以rebuild 時間短, 是因為NAS 本身自帶filesystem, 他知道哪些需要rebuild 哪些是空白. RAID 由於不清楚是用哪一種filesystem, 所以也只能不管三七二十一整顆硬碟都rebuild, 以確保資料的完整. 效能高一點的機器, rebuild 自然時間較短~~
所以若是單一電腦資料傳輸要快, 還是只能選擇RAID. 若是要透過網路分享檔案, 就選擇NAS. 真的要高度的資料安全性, 就選擇沒有metadata 的RAID 1. 同時5顆HDD 做mirror, 哪可能不安全~~


RAID 上建 ZFS 是可以,但失去了 ZFS 原有的用處 -- 因為 RAID 的缺點而容易引發整個陣列的失效,所以 ZFS 才直接把硬碟的陣列都包攬在一起。

或者從一個較宏觀角度去看:

RAID 系統:

有不同服務的電腦主機 --- RAID HBA ---- 多個硬碟組成的陣列(所以陣列本身就是該主機獨立使用)

ZFS 系統:

有不同服務的電腦主機 ---- 內部網路(Infiniband, Fiber, iSCSI 等) -- (只做 checksum 運算的電腦主機 --- ZFS 組成的陣列) <-- 這裡一個配套就好像以前的架構,但現在的做法是網路上可把 ZFS 分享出去,而單一台專門做 ZFS checksum 運算主機就比傳統陣列卡來得快(當然 $$$$$)

其實是整個儲存架構的改進。
我一開始可能寫得不太好,引起一些誤會,當然我亦可能有些錯誤觀念,還望指正。
基本上自組RAID SERVER是較便宜的,品牌 RAID SERVER價格會超過三倍以上。

沒有實際範例並不能證明,ZFS是便宜又好用的系統。

樓主可以用現成的系統來驗證,效能與價格是否可以超越 。

大家都在等樓主分享,網路上找不到有人分享實際的範例。
downtodo wrote:
基本上自組RAID...(恕刪)


google 來的分享文.

http://blog.brianmoses.net/2015/01/diy-nas-2015-edition.html

http://louwrentius.com/74tb-diy-nas-based-on-zfs-on-linux.html
FB: Pctine
由於ZFS 每一筆data 都要checksum, 若是效能要跟RAID 來比, 肯定價格不斐. CPU的等級就會差距很大了. 屆時, 散熱 噪音都會是問題. 目前單一一台16顆HDD 的RAID 效能已經可以突破2500 MB/S, ZFS checksum 主機, 可以跑到多少?? 2500 MB/S 只要一顆PowerPC 440 or 460 就可以做到了.

換個說法. ZFS針對的是檔案的容錯, RAID 針對的是硬體的容錯(HDD) 所以本就沒有衝突. 現在陣列的做法, 整個陣列失效, 機率真的很低. 真這樣, 也就是少一顆HDD 的資料. ZFS 可以依據檔案容錯來修補, 豈不完美.

但ZFS 要浪費多少空間來做容錯或checksum? 真的可以壓縮很多嗎?

壓縮只能解釋成有效的縮減沒有用到的磁區. 一張圖檔若不失真, 要如何壓縮?? 硬碟裡不是0 就是1 若沒空白(非data)區域, 怎麼壓縮?除非電腦打破0 1 0 1 的概念, 不然不可能.

ZFS filesystem 說白了, 就是更有效率的應用及管理所有磁區, 近10年來, 很多人在玩filesystem 這部分空間還很大, 一定還會有更厲害的filesystem. 而這些, 都無法撼動目前RAID 的地位的.

ZFS 和RAID 的觀念若是整合一起, 各取其優點, 倒是不錯的選擇~~


fakeman1999 wrote:
主要就靠處理器,因...(恕刪)
以相同數量的硬碟來說,ZFS的效能是有可能贏過RAID 卡,畢竟使用的CPU頻率勝過 RAID 卡的CPU,等樓主的測試。

看看樓主這顆CPU的能力。

這會是一個很具參考價值的文章。
將使用一段時間的 Server / PC 改為NAS是不錯的方案
NAS4FREE / FreeNAS 原生系統都支援ZFS
將 系統安裝於 USB碟上 其他的 SATA PORT 全裝上 SATA HDD









FB:harlem.hsu IG:harlemhsu
nakamichi77 wrote:
由於ZFS 每一筆data 都要checksum, 若是效能要跟RAID 來比, 肯定價格不斐. CPU的等級就會差距很大了. 屆時, 散熱 噪音都會是問題. 目前單一一台16顆HDD 的RAID 效能已經可以突破2500 MB/S, ZFS checksum 主機, 可以跑到多少?? 2500 MB/S 只要一顆PowerPC 440 or 460 就可以做到了.
換個說法. ZFS針對的是檔案的容錯, RAID 針對的是硬體的容錯(HDD) 所以本就沒有衝突. 現在陣列的做法, 整個陣列失效, 機率真的很低. 真這樣, 也就是少一顆HDD 的資料. ZFS 可以依據檔案容錯來修補, 豈不完美.
但ZFS 要浪費多少空間來做容錯或checksum? 真的可以壓縮很多嗎?
壓縮只能解釋成有效的縮減沒有用到的磁區. 一張圖檔若不失真, 要如何壓縮?? 硬碟裡不是0 就是1 若沒空白(非data)區域, 怎麼壓縮?除非電腦打破0 1 0 1 的概念, 不然不可能.
ZFS filesystem 說白了, 就是更有效率的應用及管理所有磁區, 近10年來, 很多人在玩filesystem 這部分空間還很大, 一定還會有更厲害的filesystem. 而這些, 都無法撼動目前RAID 的地位的.
ZFS 和RAID 的觀念若是整合一起, 各取其優點, 倒是不錯的選擇~~


根據不少 webpage 我看到的是,用 ZFS 建 RAID 的話大約會損失 1/64 的空間(我之前使用 NAS4Free 是注意到,數字是比這個大一點點的,而我不知道為何多了一點)

壓縮目的,主要非用來增加可使用的空間(有人做過實驗,10TB 左右的檔案,通過壓縮後能得到的多餘空間只是大約 26GB,很不明顯吧),而是資料進出時如果有壓縮的話寫入的實際資料可以減少,基於硬碟存取通常是樽頸位,能讀/寫少一點,檔案處理的相對效能就會高一點,當然代價是處理器資源需求更多,現今 ZFS 處理檔案時的 lz4 壓縮機制是個可以極快速偵測到是否能壓縮(就如你所指,好像 JPG 這些真的沒很多壓縮空間)從而決定甚麼要做壓縮。當然,如果建立儲存系統時知道所針對的檔案類型就可以預先設定要不要壓宿(例如我早知道這個 pool 會多放 MP4 等影片,就不必開動壓縮功能了)
這裡有人做了個小小實驗關於 ZFS + compression:https://calomel.org/zfs_raid_speed_capacity.html

整個陣列失效,現今的 RAID 5 陣列要出現實在不難,這幾年都見過,即使有 hot spare 還是避免不了,其實原因也真的是磁碟容量過大,使得 RAID 5 重組未完成時有第二硬碟出現 unrecoverable read error(前述的 write hole 問題,HBA 若有電池保護應該能避免,但軟體 RAID 當然不能),始終 RAID 重組也是要整個來重做,如果把 ZFS 放在傳統的 RAID 上做,那麼 RAID 卡發現錯誤時會嘗試修正,失敗就宣告 RAID volume 死亡,這時候陣列上的 ZFS 還能用麼?ZFS 針對的不止是 file level 的容錯,也能做 block level 的容錯,但又如前面所指,純軟體操作就是會吃 CPU 啊,而且因為同時結合兩者,不能做到 OS independent(使用 RAID 的話,想建甚麼系統都可以)
有點我不明白是

如果我有4個硬盤, 每個4TB

做RAID 10 可以得到8TB的儲存空間, 同時可以2個硬盤壞掉

但是ZFS的話, 有多少TB能使用? 有多少硬盤能夠同時壞掉?

有簡單的例子嗎
chansaikit wrote:
如果我有4個硬盤, 每個4TB
做RAID 10 可以得到8TB的儲存空間, 同時可以2個硬盤壞掉
但是ZFS的話, 有多少TB能使用? 有多少硬盤能夠同時壞掉?...(恕刪)


小弟也是 ZFS 新手, 相信這個投影片可以了解 zpool, vdev & hard drive 之間的關係.

(click here)
FB: Pctine
文章分享
評分
評分
複製連結
請輸入您要前往的頁數(1 ~ 9)

今日熱門文章 網友點擊推薦!