小主機 BIOS 是設定成復電後自動開機,症狀是事發當時雷雨造成的不管是瞬間停電還是電壓 surging,反正路由器就是起不來了,手動啟動的話,是會開機,路由也能啟動,但是上線兩、三分鐘機器就會熄燈,怪的是,如果我單用一台 NB 接在 LAN 除錯,又一切正常沒事?於是展開除錯找問題的漫長程序。
通常這個狀況第一個會去懷疑 PSU 是不是被雷打壞了,但是換了兩、三個都不能解決問題,所以 power 的問題不成立。
opnsense 每天都排程儲存當日 config 檔並保留一個月份到 NAS 上,restore 回前一天的,沒用。
回復到上一回更新 firmware 版本之前保存的 snapshot,沒用。 啊...嗒... 電腦老舊壞了? 不像哩,各項操作看起來還不算不聽話。
在 opnsense 系統裡沒工具沒辦法查問題,只好找別的工具,一查,好了,看到了這個 SSD 只剩 1% 壽命問題,這好辦,手上 mSATA 是沒有了,應該也不值得再去買這東西,但是 SATA3 的 SSD 還有一堆,於是整個 SSD 克隆過去,都很順利,可是....上線兩、三分鐘機器還是會熄燈,這.....難道 mSATA 真的壞了,所以克隆過來的當然也不行?拜託,該不會要逼我整個重新安裝吧,有一個月份的 config 存檔背書,重灌也不算是什麼難事,就只是個不甘願,因為重點是還沒弄清楚到底中了什麼招術?

陷入了長考,一樣一樣來,想了好久.... 單一台 NB 可以,全家設備都上線就不行... 哪個跟哪個犯沖了? 那為什麼已經跑了那麼久又從來就沒沖過?514 remote syslog? 不會吧? 機器真的老舊退化到廉頗飯都不能好好吃?
莫非定律指出,通常你要找的,最後那一個就是了,真的是這樣。
機器會被關機,最後想到比較有關連性的是,我在 opnsense 裝了 nut 這個 plugin,配合群暉 NAS UPS 系統運作,於是我移除了這個插件再試,結果... BINGO!!! 一切問題都解決了。不懂的是,nut 裝上去也不是只這一天兩天的事啊?
結論只有兩個:
1、只剩 1% 壽命的 SSD 不是兇手。
2、要玩免費開源的東西,就不要講道理,要先秤一下自己陪著玩當白老鼠能力的斤兩,這回我碰到這種的還算是小兒科。
這個換下來只剩 1% 壽命的 mSATA,我 PC 上有一個應該可以用的插槽,找時間搞上去操看看有沒有到 -100% 壽命的機會。
至於這個 nut,牽涉到我的問題? NAS 的問題? opnsense 的問題? nut 這個插件的問題? 反正上一回也被 opnsense 搞過,雖然後來他很快就釋出修正,但是被搞了這幾天我真的累了,現在不想管這個,至少沒裝 nut 不會死。




























































































