唉人禍吧我前公司在臺灣有正式(4機 Cluster)備機(平常當上線測試2 機Cluster)雙網路迴路加雙電源走SAN 機制外加在大陸有一套同等出力的異地備援結果上次死是因為人都裁光了所以臺灣停機保養後沒人會啟動外加沒人知道如何切大陸備援這就是電子廠亂裁一通的慘狀(其實沒人會之後 , 系統自己全自動跑了三個月沒問題 )這次多半也是換廠商沒人會亂搞一通吧因為如果有熟練的演練SOP8小時可以回復的資料量是很驚人的只是會不會回復的問題
大同轉神X 公司......價格標,品質就......桃園機楊的軟硬體實在是.....不過,機場的預算真是太少了,那些立法委員的薪水,真是高到嚇人...政府官員還是「不知民何苦」,這才是問題。做不好,還是得換吧!!! 唉...........
這認為是人為疏失!硬體一定會有掛點的時候, 所以才會有 Raid 以及第二套備援 ( 也許是使用 Cluster)Raid 能容許一定量的硬碟掛點而不影響系統運作, 但重點是有沒有去巡檢機房並定即更換修復.就算同時會掛點, 那麼 Fail over 機制為何沒能自動切換至第二套系統上?第二套系統也同時故障???那也是人為問題, 為何第二套系統的設置沒使用異地備援? 難道都放在同一個機房????那就有點誇張了.其實這些應該都是資訊人員應該有的基本概念.所以"沒有人為疏失!!" 真的是說不過去.難道是硬體的不對?若硬體不應該掛點, 那麼花大錢去設置二套系統的用意是什麼?(不就是防止硬體掛點)
這次移民暑當機確實凸顯了嚴重缺乏備援的機制不過對於磁碟陣列來說一般規劃時最常見的就是RAID5除此之外還會有一顆硬碟作為spare也就是說容許壞兩顆硬碟不過這些作法都只是降低風險畢竟沒有百分之佰可靠度的電腦設備啊除了日常資料的備份之外備援機制也是很重要的現在很多系統所能容許停機的時間都不長如果能有完善的備援機制這次移民署的當機就不會弄到人仰馬翻了題外話囉這次當機的系統據說是Solaris磁碟陣列是EXX的這些都算是蠻穩定的設備結果還是一樣出狀況以上是個人的一些看法如有錯誤還請各位多多包涵