網友提到在 NAS 上面建立 RAID1 並誤拔的情況下, 在緊張情況下又將誤拔的硬碟重新插回 NAS, 到底 NAS 是否能夠承受的住這樣的破壞?

正常情況下, NAS 是應該考慮到很多的突發狀況, 諸如上面所提到的誤拔, 誤插回等動作, 只要不是在如 RAID0 下操作, NAS 應該還是要能正常運作才對.

這裡是以 Synology DS916+ 採用兩顆硬碟建立 RAID1 的實測. 當 RAID 同步完成後, 於開機運作的情況下, 去拔除第一顆硬碟.

此時系統顯示 RAID degraded(降級), 真正運作中的是 HDD#2, 由於是建立 RAID1, 所以 NAS 還是能正常存取.
Synology NAS RAID degraded & roaming 實測

此時關機, 將 Tray#1 重新插回再開機, 主要是測試 NAS 是不是傻傻的, 會從 Tray#1 去啟動? (因為真正最後正常的系統及資料是在 Tray#2 上), 開完機後重新 check, 系統正確的從 Tray#2 啟動及運作.
Synology NAS RAID degraded & roaming 實測

我們再關機惡搞它, 關機後, 將 Tray#1 & Tray#2 調換, 重新開機. 此處是觀察, NAS 會不會很聰明的曉得 Tray#1 裡面的系統此時才是正常的. (因為 NAS 支援 disk roaming, 即使我們調換硬碟序號, 系統應該也要能正確識別出來)

重新 check, 發覺系統正確的從 tray#1 啟動及運作. (此時故障的被調換到 tray#2)
Synology NAS RAID degraded & roaming 實測
Synology NAS RAID degraded & roaming 實測

最後我們執行 rebuild 去修復被我們故意破壞的 RAID.
Synology NAS RAID degraded & roaming 實測

屋漏偏逢連夜雨, 更倒霉的是, 你沒有買 UPS, 結果在 rebuild 中又斷電(實際上是我們把插頭拔掉了).
市電恢復, RAID 繼續 rebuild 中.
Synology NAS RAID degraded & roaming 實測


上面這些測試, 正常情況下 NAS 應該要能承受的住這樣的操作, 在 Synology DS916+ 實測也是正確及資料無遺失, 但建議網友還是不要這樣惡搞自己的系統, 雖然它有如此的設計
文章關鍵字
pctine wrote:
網友提到在 NAS...(恕刪)


通常NAS是正常的狀態除非手癢應該不會隨意拔

我提一個實際的案例

NAS DS415+
HDD SG ST3000VN00 *4 RAID 5 Btrfs

狀況 :
DSM UI 無法進入但燈號皆正常,按下電源鍵正常關機但一直卡住且無限閃藍燈
按住電源鍵強迫斷電後重開一樣卡再開機階段且無限閃藍燈

推測某顆硬碟呈現半死不活狀態了,但無法由DSM確認且Synology並無硬碟故障燈可以供辨識
拔錯顆硬碟整組RAID有可能掛點的,一般使用者遇到這問題根本沒辦法處理

可行解法有兩個

硬碟全抽出來用外接盒撿查最保顯,但如果手邊沒有外接盒無法使用此方式

再來是偏方(幫硬碟把脈),故障硬碟發出有規律的震動,四顆都摸摸看感受一下
很明顯的有一顆不一樣,抽掉後再開機果然就正常的運作了

事後去檢查那顆硬碟SMART值 C4 C5 一堆錯誤
System Engineer

HOPE000 wrote:
推測某顆硬碟呈現半死不活狀態了,但無法由DSM確認且Synology並無硬碟故障燈可以供辨識
拔錯顆硬碟整組RAID有可能掛點的,一般使用者遇到這問題根本沒辦法處理...(恕刪)


這情況我之前也有遇過, 這的確是兩難, 因為硬碟並非全壞, 遇到這種情況就直接 call 客服協助處理.
FB: Pctine
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!