[起死回生]IBM ServerRAID 4Mx 高階磁碟陣列卡維修實況

IBM ServerRAID 4Mx 的這張卡,在Server的長久運作之下,突然發生死當的狀況,不知道為什麼... 然而接二連三的一連串的都是相同的磁碟陣列卡掛掉,造成伺服器整台都不能運作!  都是機器死當之後,重新開機,從此之後機器就抓不到這張ServerRAID卡了。 於是小弟百忙抽空的來看看到底是什麼回事呢?! 一張卡可不便宜,但是又壞的無聲無息的! 真的是引起小弟的好奇心! 到底是發生什麼事情呢?! 怎麼剛過保固沒多久,就一一發生相同的故障的離奇事件呢!? 難道說這張卡設定有"倒數計時"的設計,當保固期過了之後,會"自爆"!? 不會吧?! 
 
那就先來看看狀況如何吧!
 
 

喔!? 這麼長的磁碟陣列卡,擁有兩個U160 SCSI的通道。 當然還包含 BBU (Backup Battery Unit) !
 
 

可以看看狀況怎樣哩! 
 
 

拿起來看看擋板部分,具有兩個 VHDCI 的介面!
 
 

翻到背後來看看,佈料也不少哩!
 
 

看看這張卡的核心部位! 奇怪?! 又沒有發生IC燒毀的狀況啊?! 怎麼會壞掉呢?!
 
 

看看 BBU 的地方。
 
 

那就拔起來看看吧! 
 
 

喔?! 難道這是兇手?! 竟然出現詭異的模樣!
 
 

既然猜出問題,那就解剖來看看內部的構造吧!
 
 

怪?! 怎麼摸起來油膩膩的!
 
 

電池的屁屁,是串聯的!
 
 

中間有分兩組,也是串聯的。
 
 

看起來構造不難的說。
 
 

看看電池的頭部與接頭。
 
 

推算出來,電路圖應該是這樣! (用小畫家隨手畫畫的!
 
 

於是跑到電子材料行來購買電池。 黃色外觀的新電池價格為 70元/個 , SANYO的電池為 100元/個。
 
 

喔?! 1.2V / 650mAh
 
 

1.2V / 650mAh 還有個回收標誌。
 
 

這種電池與坊間的充電電池有何不同呢?! 喔! 原來正負兩極都用鎳片來電鍍上去的(這句是這樣形容的嗎?!) 這樣才能夠用焊錫來進行焊接的動作。
 
 

SANYO 的電池也是一樣,正負極都有可以焊接的地方。喔?! 2300mAh哩! 會不會是俗稱的"大電容"呢?!
 
 

屁屁也有可以焊接的地方。
  
 

正極也有可以焊接的地方。
 
  

喔?! 日本做的哩! 上面有型號與製造商。 
 
 

看看小弟隨手抓的充電電池來看看,就是與普通的充電電池一樣,正負兩極並沒有可以焊接的地方。
 
 

看看小弟的"雞絲頭" 可調溫的日本烙鐵喔! (日本白光)也是這次的大功臣喔!
  
 

熱風槍! 號稱是德國製的! 不過... 這次他是配角! 不... 是觀眾啦!
  
 

特別將電路圖列印出來,以免我會忘記。
 
 

再拆開一個電池。
 
 

中間可以看到透明膠帶貼的就是"熱敏電阻",小弟猜想應該是偵測電池的溫度,若產生一定的高溫的時候,就會讓磁碟陣列卡上的供電給予斷絕
 
  

來看看電路是如何的....
 
 

已經焊好一組,用電錶測試看看。
 
 

打到 DCV 2.5的檔位上,看看.... 
 
 

拉近看看.... 是不是接近 1.2V + 1.2V = 2.4 V 的數值呢?! 不過說真的,這個電池從製造之後到小弟手上也不知道有多久了.... 應該是要充充電啦!
 
 

兩組都搞定啦! 那就來個金鋼合體吧!!! 
  
 

哀亞! 不小心讓焊錫給它滴上去啦!  
不過這裡要注意的一點就是,通常電池的外殼為接地的狀態(就是與電池的負極相通),所以焊接電池的正極的時候,千萬不要讓電池的正負極短路喔! 
 

呼叫剝線拑來剝線!
 
 

來固定線路吧!! 這樣比較好作業!
 
 

怎麼包的像木乃伊一樣哩!!!   完成後,就上場吧!
 
 
************既然搞定後,就把他接上ServerRAID 卡上吧!***********
 
  

喔?! 介面隔板與燈號!!! 
 
 

把隔板拿開,來看看上面有什麼葫蘆可賣! 喔! 有 ATTN(告警燈) 與 PWR(電源燈),當初發現這個ServerRAID卡故障的時候,發現PWR都無法亮起.... 搞的我一頭霧水... 如今真相大白啦!!!
  
  

竟然拍的技術不好。 不過可以看看!
 
 

介面卡的固定卡榫! 印象中這台好像有 熱插拔 PCI-X 的功能說!
  
 

裝上去的模樣!
 
 

開機摟! 嘿嘿! PWR 的燈號亮起來摟!!! 感覺超爽的啦!!! 經過測試後,該卡運作正常。 花小小的$$$$ 來為公司省大大的 $$$ !!! 說真的,要不是小弟追根究底的個性,可能這個問題一直發生(這種老舊伺服器捨不得換嘛! 因為有感情在了嘛!) 今日發現到這個問題之後,想必有擔任公司重責大任的MIS人員可以看看自己的伺服器的磁碟陣列卡是不是有這樣的問題呢?! 若有,建議提早盡速解決。 要不然卡壞掉還可以花大把鈔票買,但是損壞公司的服務運作可是大事。 畢竟磁碟陣列卡算是管理磁碟陣列的主角,平日就要好好的"看守"著他。 發現電池故障,也有發現電池漏液的狀況,建議每兩年半自行更換電池一次,以免電池的故障漏液來損及該ServerRAID卡之外,亦有可能的傷害主機板上面的電子組件與電路。
 
 
 
 
為何要有電池呢?! 
Battery Backup Unit
用途在於當電源波動或故障的時候,就像一個不斷電系統保護大部分的伺服器.
一個電池備份組件提供一個額外程度的保護.在電源故障的情況之下,一個電池備份組件供應電源來保留在磁碟陣列控制器快取記憶體中的資料,當電源回覆的時候再將不完整的資料從快取記憶體當中寫入到硬碟.
 
 
IBM ServerRAID 卡家族列表:請按我
 
驅動程式可拜求辜狗大神,搜尋LSI53C1010即可!
2007-02-03 20:14 #1
夠專業的文章 推 ~~~~~~~~~~小東西 大關鍵
scdgvrdgdgrfgwfwfdegrgthyjwsrwqESFRHYTJERYHRDGRG
不過小弟不知道這個電池是要提供什麼用途的(沒猜錯的話)!!!
 
是為在BBU的旁邊!
 
不知道有沒有電子材料行買的到! 還有他的壽命有多久呢?! 還煩請知道的大大告知一下!
 
 

 


標號為 M4Z32-BR00SH1 的電池
 
 

看看側面.
 
 

來個四腳朝天....
 
 

四腳朝天的側面...
 
 

這個電池是插在這個IC上面....
︿這個就是控制器,當外部電源有問題時,則會利用該IC上面的鋰電池來提供這個IC來切換外部電源與上篇文章的"大電池"來運作。
 
 

這個IC標號為 M40Z300WMH6 ... 只是小弟英文破,有看沒有懂! 說明
 
 

 
 
公司用Dell的Raid Card,有軟體可以顯示充電狀況,如果沒辦法充電,就要考慮換一個電池。
但...我怎麼記得是像水銀電池一樣?反正每次都是廠商換的,我也沒注意。

你可以找找看IBM有沒有軟體可以看充電狀況。
Ted wrote:
公司用Dell的Ra...(恕刪)

 
有查看過,並無發現任何關於電池的偵測狀態。
阿胖技研,專研資訊相關技術!
公司以前也是一堆ServeRAID 4H的RAID卡,只要抓不到,大部分都是電池的問題。
卡本身很難壞啦,之前也有想過去電子材料行買電池自行更換,後來感覺實在太花時間了。

反正跟公司報價,公司願意花錢修就好,之前我替公司省了不少錢,也沒看到有加薪....
太花時間在這個上面,公司還會以為我閒到沒事做勒....
我是頭渴望有另一半相伴的紅斑狼瘡熊...
哈,沒錯!重點是公司願不願意花錢啦!但大公司可能可以花,小公司就不一定了。
Server硬體最麻煩的就是系統商提供的軟硬體要等到用了才會感覺到差別。一般都已為大廠牌就是好,但實際叫修了,才會發覺其中的差異。

回wst2080,因為手頭上沒有IBM的機器可以試,如果有機會的話,再幫你查一下。
請問一下
IBM SeverRAID 4Mx BBU的上方有一個Battery Backup CHK 的黑色按鈕
是要做什麼用的阿?
我按了一下,沒什麼其他反應,也沒亮什麼燈號?
還是要在Power On的狀態下去按才有用阿
另外想請問一下
要怎麼知道BBU的電池容量狀態阿
irtalex wrote:
請問一下IBM Se...(恕刪)

 
燈號要在 開機 的狀態 按下去,才會亮燈號!
 
至於如何看電池容量! 小弟也不知道! 不過小弟圖中有提到總容量!
 
阿胖技研,專研資訊相關技術!
阿胖技研,專研資訊相關技術!
限制級
您即將進入之討論頁 需滿18歲 方可瀏覽。
提醒:內容可能因過於寫實、驚悚而令人感到不舒服,是否繼續觀看?

根據「電腦網路內容分級處理辦法」修正條文第六條第三款規定,已於該限制級網頁,依台灣網站分級推廣基金會規定作標示。
評分
複製連結