正港台客 wrote:
專業的來了!正好請教...(恕刪)
個人意見
主要可能是X79板LAYOYUT先天就決定VRM面積不足的命運,CPU全速下VRM太過熱情,CPU上的水冷無法對VRM帶來足夠散熱氣流,加上背後MOSFET沒加散熱片,運作時的熱量大量累積,最終導致MOSFET因熱跑脫(Thermal runaway)跨越SOA(安全操作區)而擊穿,擊穿後的MOSFET無法受到控制永遠導通,讓8P上的12V直接灌入CPU核心電壓迴路,把CPU帶走,並因為CPU核心電壓電路的低阻抗導致電流大幅增加,所有的電流都集中在該顆已擊穿無法控制的MOSFET上,使該MOSFET熱量大幅上升,從一開始的冒煙變成出火花
為何系統未關機?可能原因有二,第一個原因是POWER的OCP及SCP未啟動,對於單路機種,為避免誤觸發保護OCP會比較不敏感,當發生裝置因損壞呈現低阻抗時,只要在OCP容許範圍內,POWER都當作是大負載去推,所以POWER不會截止輸出,而SCP動作條件是阻抗要夠低(短路),所以裝置尚未損壞至完全短路程度前,SCP也不會動作。第二個原因是主機板電源管理未把PS-ON恢復高位(POWER OFF),正常來說主機板電源管理系統,只要偵測到板上任一電源迴路異常,應該要把PS-ON信號恢復高位並鎖住,讓電源供應器輸出停止且無法再觸發起動,避免損壞擴大,此案例可能電源管理未及時將PS-ON信號解除,在未觸動POWER OCP及SCP保護下持續供電給故障的VRM電路,而導致這次的燒毀事件
港都狼仔 wrote:
MOSFET擊穿了,然後POWER的OCP/SCP以及主機板電源控制(關掉PS-ON信號)沒及時介入,最後就冒煙著火
從發文者採CPU水冷配置,VRM旁邊無氣流加上CPU全負載,推測應該是溫度過高導致MOSFET超出SOA(安全作業區)而擊穿
X79的VRM粉熱情滴....
港都狼仔 wrote:
個人意見
主要可能是X79板LAYOYUT先天就決定VRM面積不足的命運,CPU全速下VRM太過熱情,CPU上的水冷無法對VRM帶來足夠散熱氣流,加上背後MOSFET沒加散熱片,運作時的熱量大量累積,最終導致MOSFET因熱跑脫(Thermal runaway)跨越SOA(安全操作區)而擊穿,擊穿後的MOSFET無法受到控制永遠導通,讓8P上的12V直接灌入CPU核心電壓迴路,把CPU帶走,並因為CPU核心電壓電路的低阻抗導致電流大幅增加,所有的電流都集中在該顆已擊穿無法控制的MOSFET上,使該MOSFET熱量大幅上升,從一開始的冒煙變成出火花
為何系統未關機?可能原因有二,第一個原因是POWER的OCP及SCP未啟動,對於單路機種,為避免誤觸發保護OCP會比較不敏感,當發生裝置因損壞呈現低阻抗時,只要在OCP容許範圍內,POWER都當作是大負載去推,所以POWER不會截止輸出,而SCP動作條件是阻抗要夠低(短路),所以裝置尚未損壞至完全短路程度前,SCP也不會動作。第二個原因是主機板電源管理未把PS-ON拉低,正常來說主機板電源管理系統,只要偵測到板上任一電源迴路異常,應該要把PS-ON信號拉低並鎖住,讓電源供應器輸出停止且無法再觸發起動,避免損壞擴大,此案例可能電源管理未及時將PS-ON信號拉低,在未觸動POWER OCP及SCP保護下持續供電給故障的VRM電路,而導致這次的燒毀事件
不愧是狼大給您
chiang:加減點一下啦,不然最近要買server,總價快5百多萬,貴到想罵髒話.......
IRFH8330:
http://www.irf.com/product-info/datasheets/data/irfh8330pbf.pdf
IRFH8318:
http://www.irf.com/product-info/datasheets/data/irfh8318pbf.pdf
VRM的散熱片看起來蠻單薄的,並未有其他廠家有加入熱導管擴大散熱片面積的作法,可能也是散熱不足導致熱量堆積的原因之一


























































































