stupids1978 wrote:納悶的是,這樣嚴苛需求的工作需求,還會發生有了RAID,兩套系統同時掛點的問題,真的非常少見說。 常見的啦,但機率很高,WHY1.硬碟的 MTBF 假設 30,000小時,表示3.5年以上一次掛2顆可能性很大2.假設是RAID5,N N=5,共5顆硬碟 第一顆掛,換上去未回覆時,第2顆掛 => RAID 掛3.假設是RAID5,N+1 N=5,共6顆硬碟 第一顆掛,第2顆自動載入,換上去未回覆時,第2顆掛 => RAID 掛4.CLUSTER 都出現2,3的問題..掛...5.CLUSTER 下的主備一直互換,換太多次...有可能掛6.當初買的時候,買到龜毛貨,CLUSTER卡要認RAID卡,RAID卡要認所有硬碟韌體版本一致才動作,每每東西一故障就驚心膽戰....再這行做這麼久,這類從新品採購就遺留下的罪惡,看多了尤其現在硬體價透明又公開,客戶都要自己用中信標價格買硬體,系統公司只剩賣軟體整合硬體,我反而最開心硬體掛,因為不關我的事,哈哈stupids1978 wrote:這兩天的大新聞,就是機場系統出槌的事情。 7.尤其他們一定要走中信標,不是我再說,我對中信標連PC都沒信心
說真的神X電腦也滿倒楣的就好像當個醫生,一個病人在別的醫院醫了很久,結果轉到你的醫院來看診,連掛號(簽約)都還沒,病人就死在你的診所,結果你要負責,我這也講也許有點誇張啦,不過~還是覺得很神奇,怎麼會那麼"剛好",總覺得事情不簡單啊~~~
更正一下~raid5有熱備援的硬碟~也是不能一次壞兩個,壞掉一個後,要時間重建到熱備援的硬碟上,如果重建未完成,就壞第二顆的話~raid5一樣是在見~怕就是怕沒人去巡,熱備援搞不好早就上線用掉了,還放給他撐,~基本上raid5少一顆還是能用的,所以熱備援用上了表示壞一顆~然後又壞了一顆~系統還是能動~~在壞一顆就在見了~ok機房人員丟著給他壞三顆~就該拖去扁了~我同意樓上說的是人為的問題,兩套系統除非"兩套硬體"同時間掛掉~不然就是人為了~程式出錯也是人為呀~只是機器不會說話~所以問題都丟給機器~~機器被fire也不會痛~哈~可憐的機器之前公司一台伺服器HX的,主機上兩顆硬碟做mirror然後用scsi接一台磁碟陣列~11顆硬碟做raid5+1熱備援~,主機上的硬碟灌linux系統,其中mysql資料庫的"資料"部份放在陣列上~結果怎樣咧~主機系統硬碟的控制板壞掉~= =mirror的兩顆系統硬碟同時離線~哇靠~死人啦!!~~結果~mysql 居然沒事~還能正常讀寫耶!!~原來linux開機完後~系統碟抽掉還是可以運做的= =!!不知道windows有沒有辦法咧?有沒有人試過?
rs_sking wrote:說真的神X電腦也滿倒...(恕刪) 我也覺得發生的時間太巧了,神X 2008/12/31得標,過二,三天就出問題了,硬碟壞了RAID機制沒保護到,備援機也沒辦法接替營運,如果以剛得標廠商在未和前維護廠商做交接或還沒了解架構,要馬上接手迅速處理問題實在不容易。奇怪的是後來是移民署的資深分析師二小時就解決了,不解的是那位分析師怎會撐到最後廠商無法處理才出面接手處理,難道這時候還要測試一下廠商的維護能力,計時看看新的維護廠商能不能在合約時間內處理完成,真的不行再接手。
Raid 並不是萬靈丹,有熱備援的 Raid 5,最多只能壞兩顆硬碟,第三顆故障就挫賽了話說根據不負責任的馬路消息,機器好像是 SUN V890 配上 HDS Storage大機器跟大儲存設備是不在中信標清單內移民署每年預算不夠,建 DR 應該是有困難的,然而完整雙套異地可運作之系統應該才是移民署最需要的Storage 如果沒簽維護合約,就等著被原廠搶劫,以這次故障來看,原廠出馬的話在半天內解決問題的機率相當高希望立委可以撥點預算並且要求一下移民署建個 DR (也算是擴大內需小方案),以免再度名揚國際,貽笑大方