相同數量下的硬碟 ,Raid6 與 Raid60 損壞機率誰高?

討論相同硬碟數量下,哪一個資料損壞的機率比較高?

例如下方A組與B組哪個資料容易損壞??

A組: 100顆硬碟組Raid6
B組: 100顆硬碟組Raid60

目前小弟IT部門對於兩邊的支持者數量差不多,大家也提出了自己的想法似乎也都聽起來蠻有理

想請教廣大的網友們,哪一個組合資料容易損壞?

※不討論效能
※不討論空間利用率
※不考慮有沒有熱備
※不討論用其他Raid是不是比較安全
※不討論錢
※不討論品牌、規格、保固
※不討論非硬碟的損壞,例如控制晶片、電源供應器、溫度等
※任何一顆硬碟只有好跟壞(完全無法使用)兩個情況
Raid卡 沒帶電池 跳電故障機率高.....
裝了電池 太靈敏 報錯多
企業盤 不一定靠譜 多年前Wd yyz 4tb 企業陣列專用盤 上機三百多小時就掛 半年反廠三次 最後才發現 同批 不同韌體 自檢都說對方壞 報錯 丟失分區 搞死第一線人員


另外raid 6 60 電源管理也是重點之一
大型儲存方案 不會用 nas
基本都是單盤 軟體raid 在線維護快 熱插拔
免停機 進raid卡 掛載硬碟
軟體勾一下結束
實體卡 raid基本只是檢查用的 最多做異端備份使用

過往經驗 raid60故障機率低 但故障後
重構數據攏長
Raid6 出問題機率高些 但好修復
B組的容錯率較高

A組100顆中只要同時壞3顆,整個陣列就掛了。

B組則是二組的50顆R6,再組成R0。整個陣列中允許B1壞2顆+B2壞2顆,只要單一陣列不一次掛3顆(雖說單一陣列掛,整個陣列群組也是掛),最多可同時壞4顆仍存活。從機率的角度上來看,3/100及3/50,也是3/100故障的機率較大。
簡單的判斷方式
可以使用的HDD容量/硬碟數越少,代表容錯的部分越多,就越安全。
Raid6 ,容量=100-2=98,容錯數=2
Raid60 =Raid6*n,再組成Raid0 ,因此當n=2時,容量=100-(2*2)=96,單容錯數=2,容錯數=2*2=4
你也可以看成,Raid60 =Raid6*n,再組成Raid0 ,而此時是n=1時
如果剛好都是壞在同一組radi6,那兩者容錯數是一樣的。

至於損壞機率:當然就是可用HDD容量/硬碟數越多,代表故障率越高,畢竟人多手雜,東西一多,當然故障率自然就高。
因此故障率是Raid6 > Raid60。
redfield wrote:
討論相同硬碟數量下,哪一個資料損壞的機率比較高?

例如下方A組與B組哪個資料容易損壞??

A組: 100顆硬碟組Raid6
B組: 100顆硬碟組Raid60


A 組較容易損壞.

答案在這裡:

https://www.servethehome.com/raid-calculator/raid-reliability-calculator-simple-mttdl-model/
FB: Pctine
假設各個硬碟在正常狀態下的故障率都相等,為p1,在降級和重建raid時滿負荷讀寫的故障率為p2,不考慮raid卡的負荷和故障率。

A方案(N顆硬碟組raid 6):

故障率為 (N, 3)*p1^3+[(N, 2)*p1^2*(N-2, 1)*p2]+[(N, 1)*p1*(N-1, 2)*p2^2],其中(N, 3)表示從N個元素中選取3個的選擇種類。
計算結果為



B方案(N顆硬碟分成M組,每組N/M顆硬碟組raid 6,再總和成raid 0):

設任意一組raid 6的故障率為pb,則pb=(N/M, 3)*p1^3+[(N/M, 2)*p1^2*(N/M-2, 1)*p2]+[(N/M, 1)*p1*(N/M-1, 2)*p2^2]

由於1組,2組或多組raid 6的損壞均會導致B方案損壞,所以總故障率為1-(1-pb)^M=(M, 1)*pb-(M, 2)*pb^2+(M, 3)*pb^3-...+(M, M)*pb^M=

由於pb往往比(M, k)小好幾個量級,當pb乘方時,(M, 2)以後的項迅速減小,所以可以略去,只取首項(M, 1)*pb即可。計算結果為


比較這兩個數的大小,即是比較(N-1)(N-2)和(N/M-1)(N/M-2)的大小。由於N/M必定小於N,所以B方案的損毀率必定更小。

但如果考慮實際情況,p2往往遠大於p1,且重建過程中的p2與raid中的硬碟數,容量和重建時間具備相關性,即是f(p2)~(N, V, t)。這樣,上兩式比較大小時,括號裏帶p的項就不能互相約去了。另外,如果組數M較多而pb并不太小時,(M, 1)*pb後面的項或許不可略去,這樣會使B組損毀概率的計算結果增大。
redfield wrote:
討論相同硬碟數量下,(恕刪)

當然是B RAID60比較保險 可以讓你壞4顆還能運作
RAID6 只能讓你壞2顆

如果需求這麼大 其實應該搞兩組電腦的RAID6或60比較保險
因為我前幾個月才遇到HP機箱背板故障 管你 RAID幾通通沒用
因為同時12盤位都無法通電 所以背板換好後卡還認的到RAID
但是我剛好在線上增容時壞的 馬的 還遇到卡到背板之間的8087線疑似接觸不良
再加上我當下慌了盤位亂拔 所以RAID整個失效了
HP你當顆硬碟故障時 如果沒補一樣的位置 他RAID不作動的
LSI的卡 就比較沒那麼機歪

HP的你可以硬讓他上線 但是會警告資料可能有問題
挑了幾個檔案 比對總和檢查碼 結果不一樣.......

要搞RAID 建議用LSI的卡比較好用
但我記得 LSI 的RAID60 無法線上增容
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!