H5885 V3 裝Windows server 2012R2 物理機自動重啟藍屏 8臺服務器Hyper-V 集群
處理過程
從事件日志來看,機器近期有一次藍屏行為(2021/9/12 8:34),7月也有一次,比較舊了,也為0x50。但由于C盤下沒有足夠大的剩余空間,pagefile配置沒有成功,只有一個minidump,信息較少。
====Dump 分析====
// bugcheck 為0x50,意為訪問到一個無效內存地址,callstck解析信息量很少,看到有一個三方安全驅動nxup_ext_a有相關動作,且該驅動版本也比較舊了,建議做升級操作。另外一份dump是7月份的,比較舊了,callstack與此類似,也沒有太多信息,涉及到的三方驅動為fltsrv,版本為2017年,建議先對這兩個驅動進行升級,再做進一步觀察。
Dump Info
============================================
Dump Name: 091221-57890-01.dmp
Windows 8.1 Kernel Version 9600 MP (64 procs) Free x64
Product: Server, suite: TerminalServer SingleUserTS
Built by: 9600.19678.amd64fre.winblue_ltsb_escrow.200330-1737
Kernel base = 0xfffff801`e6c78000 PsLoadedModuleList = 0xfffff801`e6f3d5f0
Debug session time: Sun Sep 12 08:27:04.004 2021 (UTC + 8:00)
System Uptime: 53 days 23:47:30.527
。。。。。。。。。。
。。。。。
。。。
。。
。
硬件日志詳細分析如下:(收集到帶外日志的2臺均一致)
1.Sel日志中記錄到9月22日有系統未知原因復位,復位前無硬件異常告警:
2.FDM日志為空,排除硬件存在UCE等引發系統復位可能性:
3.操作日志無相關記錄,排除對設備進行復位等操作引發系統復位可能性:
4.硬件日志未發現異常,微軟反饋的nxup的驅動是多路徑的,建議找存儲的看看。Fltsrv這個也不是華為硬件提供的驅動,建議找對應驅動廠家看看。
根據微軟反饋的分析結論,可能與以下驅動模塊相關,其中nxup_ext_a.sys這個驅動是華為多路徑的,建議可以讓存儲那邊看看。
Fltsrv.sys這個驅動也不是服務器這邊提供的,建議客戶找到對應的驅動廠家看看。
建議:
1.升級驅動nxup_ext_a.sys和fltsrv.sys 后,進一步觀察。
2.由于minidump信息量過少,請參考如下步驟配置kernel dump(pagefile 為20G),等待下次藍屏發生:
以管理員身份打開命令提示符依次運行如下命令:
reg add "HKLM/System/CurrentControlSet/Control/Session Manager/Memory Management" /v PagingFiles /t REG_MULTI_SZ /d "C:/pagefile.sys 20480 20480" /f
reg add "HKLM/System/CurrentControlSet/Control/CrashControl" /v DumpFile /t REG_EXPAND_SZ /d "C:/Windows/Memory.dmp" /f
reg add "HKLM/System/CurrentControlSet/Control/CrashControl" /v CrashDumpEnabled /t REG_DWORD /d 2 /f
reg add "HKLM/System/CurrentControlSet/Control/CrashControl" /v AutoReboot /t REG_DWORD /d 1 /f
重啟服務器配置生效。
注:確保C盤剩余空間大于2倍PagingFile大小。
解決方案
硬件日志未發現異常,微軟反饋的nxup的驅動是多路徑的,建議找存儲的看看。Fltsrv這個也不是華為硬件提供的驅動,建議找對應驅動廠家看看。
根據微軟反饋的分析結論,可能與以下驅動模塊相關,其中nxup_ext_a.sys這個驅動是華為多路徑的,建議可以讓存儲那邊看看。
Fltsrv.sys這個驅動也不是服務器這邊提供的,建議客戶找到對應的驅動廠家看看。
建議:
1.升級驅動nxup_ext_a.sys和fltsrv.sys 后,進一步觀察。
2.由于minidump信息量過少,請參考如下步驟配置kernel dump(pagefile 為20G),等待下次藍屏發生:
以管理員身份打開命令提示符依次運行如下命令:
reg add "HKLM/System/CurrentControlSet/Control/Session Manager/Memory Management" /v PagingFiles /t REG_MULTI_SZ /d "C:/pagefile.sys 20480 20480" /f
reg add "HKLM/System/CurrentControlSet/Control/CrashControl" /v DumpFile /t REG_EXPAND_SZ /d "C:/Windows/Memory.dmp" /f
reg add "HKLM/System/CurrentControlSet/Control/CrashControl" /v CrashDumpEnabled /t REG_DWORD /d 2 /f
reg add "HKLM/System/CurrentControlSet/Control/CrashControl" /v AutoReboot /t REG_DWORD /d 1 /f
重啟服務器配置生效。
注:確保C盤剩余空間大于2倍PagingFile大小。