有RAID,還兩套系統同時出槌的機率有多低?


PTT有個無聊的八卦


一個血淋淋的乖乖事件

http://www.plurk.com/p/canum



....原來椰香乖乖是真的有用啊?

我一直以為只是無稽之談而已....

stupids1978 wrote:
納悶的是,這樣嚴苛需求的工作需求,還會發生有了RAID,兩套系統同時掛點的問題,

真的非常少見說。


常見的啦,但機率很高,WHY
1.硬碟的 MTBF 假設 30,000小時,表示3.5年以上一次掛2顆可能性很大
2.假設是RAID5,N N=5,共5顆硬碟 第一顆掛,換上去未回覆時,第2顆掛 => RAID 掛
3.假設是RAID5,N+1 N=5,共6顆硬碟 第一顆掛,第2顆自動載入,換上去未回覆時,第2顆掛 => RAID 掛
4.CLUSTER 都出現2,3的問題..掛...
5.CLUSTER 下的主備一直互換,換太多次...有可能掛
6.當初買的時候,買到龜毛貨,CLUSTER卡要認RAID卡,RAID卡要認所有硬碟韌體版本一致才動作,每每東西一故障就驚心膽戰....

再這行做這麼久,這類從新品採購就遺留下的罪惡,看多了
尤其現在硬體價透明又公開,
客戶都要自己用中信標價格買硬體,
系統公司只剩賣軟體整合硬體,
我反而最開心硬體掛,
因為不關我的事,哈哈

stupids1978 wrote:
這兩天的大新聞,就是機場系統出槌的事情。


7.尤其他們一定要走中信標,不是我再說,我對中信標連PC都沒信心
因為有人吃掉他的乖乖,所以他不喜歡~~~就掛點~~~
說真的神X電腦也滿倒楣的
就好像當個醫生,一個病人在別的醫院醫了很久,結果轉到你的醫院來看診,連掛號(簽約)都還沒,病人就死在你的診所,結果你要負責,我這也講也許有點誇張啦,不過~還是覺得很神奇,怎麼會那麼"剛好",總覺得事情不簡單啊~~~
多大的容量? 有 50TB 麻

現在儲存也不是太貴了呀
更正一下~raid5有熱備援的硬碟~也是不能一次壞兩個,壞掉一個後,要時間重建到熱備援的硬碟上,如果重建未完成,就壞第二顆的話~raid5一樣是在見~怕就是怕沒人去巡,熱備援搞不好早就上線用掉了,還放給他撐,~基本上raid5少一顆還是能用的,所以熱備援用上了表示壞一顆~然後又壞了一顆~系統還是能動~~在壞一顆就在見了~ok機房人員丟著給他壞三顆~就該拖去扁了~

我同意樓上說的是人為的問題,兩套系統除非"兩套硬體"同時間掛掉~不然就是人為了~程式出錯也是人為呀~只是機器不會說話~所以問題都丟給機器~~機器被fire也不會痛~哈~可憐的機器

之前公司一台伺服器HX的,主機上兩顆硬碟做mirror然後用scsi接一台磁碟陣列~11顆硬碟做raid5+1熱備援~,主機上的硬碟灌linux系統,其中mysql資料庫的"資料"部份放在陣列上~結果怎樣咧~主機系統硬碟的控制板壞掉~= =mirror的兩顆系統硬碟同時離線~哇靠~死人啦!!~~結果~mysql 居然沒事~還能正常讀寫耶!!~原來linux開機完後~系統碟抽掉還是可以運做的= =!!不知道windows有沒有辦法咧?有沒有人試過?
rs_sking wrote:
說真的神X電腦也滿倒...(恕刪)


我也覺得發生的時間太巧了,神X 2008/12/31得標,過二,三天就出問題了,硬碟壞了RAID機制沒保護到,備援機也沒辦法接替營運,如果以剛得標廠商在未和前維護廠商做交接或還沒了解架構,要馬上接手迅速處理問題實在不容易。奇怪的是後來是移民署的資深分析師二小時就解決了,不解的是那位分析師怎會撐到最後廠商無法處理才出面接手處理,難道這時候還要測試一下廠商的維護能力,計時看看新的維護廠商能不能在合約時間內處理完成,真的不行再接手。
呵呵~明眼人都看的出來~一組磁碟陣列要在一天內連壞三顆硬碟~機會有多少?




應該是..
想等新廠商違約金被扣光後再出手
這樣裡子面子都賺到
1.幫公司省錢
2.在老闆面前證明自己的重要性
3.排除不喜歡的包商?
Raid 並不是萬靈丹,有熱備援的 Raid 5,最多只能壞兩顆硬碟,第三顆故障就挫賽了

話說根據不負責任的馬路消息,機器好像是 SUN V890 配上 HDS Storage
大機器跟大儲存設備是不在中信標清單內
移民署每年預算不夠,建 DR 應該是有困難的,然而完整雙套異地可運作之系統應該才是移民署最需要的

Storage 如果沒簽維護合約,就等著被原廠搶劫,以這次故障來看,原廠出馬的話在半天內解決問題的機率相當高
希望立委可以撥點預算並且要求一下移民署建個 DR (也算是擴大內需小方案),以免再度名揚國際,貽笑大方
習慣了你的聲音, 你的氣味, 你的存在...連思念都變成了習慣...
文章分享
評分
評分
複製連結

今日熱門文章 網友點擊推薦!