它其實是我家裡一台老舊中國製工控小主機上的一塊購入日期 104/12/31 的 mSATA,這部小主機跑過 windows,還做過一堆其他亂七八糟 server 性質的工作,會有這件事是因為 08/27 中午的一場雷雨,而當時它的工作是在跑最新版的 opnsense 軟路由,作為我家網路的主要路由器。

小主機 BIOS 是設定成復電後自動開機,症狀是事發當時雷雨造成的不管是瞬間停電還是電壓 surging,反正路由器就是起不來了,手動啟動的話,是會開機,路由也能啟動,但是上線兩、三分鐘機器就會熄燈,怪的是,如果我單用一台 NB 接在 LAN 除錯,又一切正常沒事?於是展開除錯找問題的漫長程序。

通常這個狀況第一個會去懷疑 PSU 是不是被雷打壞了,但是換了兩、三個都不能解決問題,所以 power 的問題不成立。

opnsense 每天都排程儲存當日 config 檔並保留一個月份到 NAS 上,restore 回前一天的,沒用。

回復到上一回更新 firmware 版本之前保存的 snapshot,沒用。 啊...嗒... 電腦老舊壞了? 不像哩,各項操作看起來還不算不聽話。

在 opnsense 系統裡沒工具沒辦法查問題,只好找別的工具,一查,好了,看到了這個 SSD 只剩 1% 壽命問題,這好辦,手上 mSATA 是沒有了,應該也不值得再去買這東西,但是 SATA3 的 SSD 還有一堆,於是整個 SSD 克隆過去,都很順利,可是....上線兩、三分鐘機器還是會熄燈,這.....難道 mSATA 真的壞了,所以克隆過來的當然也不行?拜託,該不會要逼我整個重新安裝吧,有一個月份的 config 存檔背書,重灌也不算是什麼難事,就只是個不甘願,因為重點是還沒弄清楚到底中了什麼招術?

被 1% 健康度 SSD 修理的故事

陷入了長考,一樣一樣來,想了好久.... 單一台 NB 可以,全家設備都上線就不行... 哪個跟哪個犯沖了? 那為什麼已經跑了那麼久又從來就沒沖過?514 remote syslog? 不會吧? 機器真的老舊退化到廉頗飯都不能好好吃?

莫非定律指出,通常你要找的,最後那一個就是了,真的是這樣。

機器會被關機,最後想到比較有關連性的是,我在 opnsense 裝了 nut 這個 plugin,配合群暉 NAS UPS 系統運作,於是我移除了這個插件再試,結果... BINGO!!! 一切問題都解決了。不懂的是,nut 裝上去也不是只這一天兩天的事啊?

結論只有兩個:
1、只剩 1% 壽命的 SSD 不是兇手。
2、要玩免費開源的東西,就不要講道理,要先秤一下自己陪著玩當白老鼠能力的斤兩,這回我碰到這種的還算是小兒科。

這個換下來只剩 1% 壽命的 mSATA,我 PC 上有一個應該可以用的插槽,找時間搞上去操看看有沒有到 -100% 壽命的機會。

至於這個 nut,牽涉到我的問題? NAS 的問題? opnsense 的問題? nut 這個插件的問題? 反正上一回也被 opnsense 搞過,雖然後來他很快就釋出修正,但是被搞了這幾天我真的累了,現在不想管這個,至少沒裝 nut 不會死。
健康度那個只是參考

洗選後 還是新的產品的開始

https://www.mobile01.com/topicdetail.php?f=492&t=6863805


不少市面上固態隨身碟 靠主控糾錯能力 延續顆粒生命歷程 半容 1/4容不在少見
綠色環保就是這麼回事
ulimie
嗯, 是吧,這是我人生碰到的第一顆 不知算不算壞掉? 而且只剩 1% 壽命的 SSD。只好邊走著邊看....
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!