えげつないぐらい意味不明で多種多様なブルースクリーンに苦しめられた件について

Computer

青は心が落ち着く色って言ってたよな?じゃあこの殺意ってどこから生まれたんだろうね?

正直ブルースクリーンって絶滅したと思ってたのですが、ここ最近はご近所さんより面を拝ませられているALVAです、こんちくしょう!

ちょっとした[閲覧注意]画像より最悪な気分にさせられるブルースクリーン、またの名をBSODを毎日見ていました。

あまりにもキツい日々だったので、ここにどういう状態でどのような対処をしたかを書いていきたいと思います。
意外と人間喉元すぎると忘れてしまうので、自分用の備忘録です。

ちなみにあまりにも初歩的なトラブルだったので、PCに詳しい方が見たら「バカすぎる」と思うでしょうけど、どうか暖かな目で「バカすぎる」と思ってくださいませ。

トライ・アンド・エラーしながら書いているのでつながりが変だったりするかもしれません。

スペック・使用機材

OSWindows 10 Pro
CPUAMD Ryzen 7 7800X3D
マザーボードMSI MPG B650 CARBON WIFI
RAMCORSAIR Corsair DDR5-5600MHz
GPUMSI GeForce RTX 4080 16GB GAMING X TRIO
SSDADATA LEGEND 1TB(OSのみ)
 KIOXIA-EXCERIA G2 2TB(ちょっとしたアプリなど)
 Acer Predator SSD 2TB(ゲーム入れ)
 Crucial P2シリーズ 2TB(なんでも入れれる)
電源CORSAIR RM1000x Shift
CPUクーラーDeepCool LS720 SE(水冷360mm・ファン換装済み)
PCケースNZXT H7 Flow
前面ファン×3Cooler Master MasterFan MF140 Halo2(吸気)
背面ファン×1Cooler Master MasterFan MF140 Halo2(排気)
上面ファン×3
(水冷ラジエーター)
Cooler Master MasterFan MF120 Halo2
(ラジエーター下面取り付け・排気)
メインモニタInnocn INNOCN 27M2V 4K 27インチ 160Hz
サブモニタ(左)INNOCN 27C1U-D 4K 27インチ 60Hz
サブモニタ(右)INNOCN 27C1U-D 4K 27インチ 60Hz

(今後登場する機材)

・モバイルモニター(MAGICRAVEN モバイルモニター 15.6インチ 1080P)
・シリコンパワー XPOWER Zenith DDR5 64GB (32GBx2) 5600MHz

ブルースクリーンの状況

BSODが発生した状況を以下に箇条書きします。

・大きな負荷があるかないかは関係ない
・特定のアプリケーションで発生するわけではない
・時間帯は関係ない
・特定のデバイス使用時などの条件は無さそう
・ブラウザのみ(タブ2~3個)でも発生する、ゲーム中に落ちることもある
・1日に数回起きることもあれば、発生しない日もあった
・スリープから復帰した後に通常使用中に発生しやすいような気もする
・USB機器の有無は関係ない
・BSODが発生しない時は普通にゲームなどをプレイできる

BSODで表示されたエラーを以下に箇条書きします。

・KMODE_EXCEPTION_NOT_HANDLED(一番多い)
・DRIVER_OVERRAN_STACK_BUFFER(たまに)
・UNEXPECTED_KERNEL_MODE_TRAP(1回ぐらい?)
・MEMORY_MANAGEMENT(1回ぐらい?)
・SYSTEM_THREAD_EXCEPTION_NOT_HANDLED(2~3回)
・IRQL_NOT_LESS_OR_EQUAL(1回)
・SYSTEM_SERVICE_EXCEPTION(1~2回)
・CRITICAL_STRUCTURE_CORRUPTION(1回)
こんなにバラエティ豊かなブルースクリーンが発生するのすごい。
 

前段階として発生していたトラブル

このBSOD連発のトラブルの前に発生したトラブルがありました。

「マザーボードの映像出力端子に何らかのモニターを接続しないとPCが立ち上がらない」というトラブルでした。

かなり謎なトラブルで、もちろんBIOSで映像出力をGPUでデフォルトにしています。
しかし必ずオンボード側にも何かを接続しないと立ち上がりません。
BIOSでオンボード出力をOFFにするとGPU側で映像出力がされず、裏で起動している音はしますが画面表示がされません。
またこの状態になるとBIOSに入れないので、CMOSクリアするしかなくなります。(内部的にはF2連打で入れるけど操作できない)

仮想ディスプレイのHDMIドングルを挿してみましたが、実際のディスプレイでないとだめなようです。

仕方ないのでAmazonでモバイルモニターを購入して接続、ディスプレイ設定で無効にしていました。

またスリープからの復帰が失敗するようになりました。

行った対処法

KMODE_EXCEPTION_NOT_HANDLEDで検索して出てきた対処

①高速スタートアップを切る

まずは高速スタートアップを切るというのがおすすめの方法のようです。
KMODE_EXCEPTION_NOT_HANDLEDエラーの出る人はそもそもPCが立ち上がらないことが多く、その対処のようでしたが一応私もやってみました。
→失敗

②ドライバーが古くて悪さをしている

この対処法もポピュラーなようです。
デバイスマネージャーからちまちまと接続されたデバイスのドライバーの更新を試行する方法です。
→失敗、そもそも更新が必要なドライバーがなかった。
念の為通信系のドライバーは機器名を検索して直で更新しようとしたがそれも効果はなかった。
またドライバー一括更新してくれるソフトウェアを使用期間で試してみましたが、更新はあったもののトラブルの解決には至りませんでした。

③メモリが壊れている(メモリテスト編)

メモリが壊れているとBSODとなる。なるほどその通りですね。
ということでWindows標準のメモリ診断をしてみた。
結果は特に問題なかった。
→失敗
備考としてWindowsのメモリ診断はそれほど精度が高くないとのことなのでMemtest 86を使用すると良いらしい。

④セキュリティソフトのトラブル

遥かなる過去、サードパーティ製のセキュリティソフトが必須だった時代はよくトラブルを起こしていた。
しかし現在はWindows Defenderが標準搭載されているので私は別のものは入れていない。
とりあえず指示通りファイアウォールとリアルタイム監視などをオフにしました。
→失敗
特に何も起こらなかった。

⑤Windows Updateをする

した。
→失敗
しかしKB5034441はインストールできなかった。(そういったトラブルが広く発生しているらしい)
後にCドライブの回復領域を広げてインストール完了したが、これがトラブルの原因だったのか微妙。(ちょうどBSODが改善した時期ではあった)

⑥グラフィックボードのドライバをアップデートする

した。というかいつもしてる。
→失敗

⑦USBデバイスを取り外す

マウスとキーボードだけにした。
→失敗
普通にBSODが発生する。

⑧OSクリーンインストール

しました。残念ながらまったく効果なし。
仕事用のPCじゃなくて本当に良かった。
→失敗

⑨メモリを交換する

シリコンパワー XPOWER Zenith DDR5 64GB (32GBx2) 5600MHzを購入して交換してみました。
→失敗
同じようにBSODが発生。
買ったメモリどうすればいいんだ……!?

⑩メモリスロットを変更する

→微妙?
そもそもサブ側に挿すと起動しなかったっぽい?

⑪熱暴走

最近発生しているので気温の上昇が関係しているような気がしました。
そこで控えめにしていたファンを最大出力でぶん回して爆音PCにしました。
→失敗
CPU温度、GPU温度、チップセット温度などが40℃程度でもブルースクリーンになる。

⑫BIOSアップデートする

→???
そもそも最新のBIOSだった。

その他ダンプ解析などもしましたが都度ブルースクリーンのエラー名が違うので困ってしまいました。

volsnap.sys
ntoskrnl.exe
tcpip.sys
Ntfs.sys

0x1000007e
0x1000001e

ダンプ解析などで得られる情報も毎度異なることがあり、原因が絞り込めずにいました。

⑬仕方ないので機材を剥ぎ取りする

もはやにっちもさっちもいかないので他のPCなどから部品を剥ぎ取って交換しつつ、不具合がどの部品なのかを絞り込んでいきます。

CPUをRyzen5 7600に載せ替え→不具合発生
⑨のメモリ交換を実行→不具合発生
RTX4070へ交換→不具合発生
電源を850Wへ交換→不具合発生
SSDをOSのみにする、SSDをCFDのものに交換する(クリーンインストール)→不具合発生

最後にマザーボードを交換してみました。

MSI MPG B650 CARBON WIFIからMSI X670E GAMING PLUS WIFIへと交換。

結論(結果だけ知りたい人はこの章を見てね)

結局マザーボードの不具合だとわかりました。

X670Eに変更してからはまったく問題が発生しなくなりました。

個人的に今まで何度もPCパーツを購入したのですがこういった「使えるけどなんかおかしい」というゆるめの不具合に当たったことがなく、ソフト側の問題を疑ってしまいました。

コンデンサがポップコーンになったことならあるんですけどね。
ああいう物理的な損傷は起動しなくなるのでわかりやすいのですが、今回は地味に起動して1日1回程度のブルースクリーンというのは一番厄介だなと思いました。

これだけ検証しないと原因の特定ができないのも厳しいです。
今回追加購入したパーツだけでもう一台PC組めちゃいますし。

この記事でお伝えしたいのは「特定のブルースクリーンエラーではなく複数種類表示される場合、原因はドライバや設定ではなくてマザーボードかもよ」という話。
自作やトラブルシューティングの経験のある人には当然だろって話かもしれませんが、私は正常化バイアスもあって交換ハードルの高いハードウェアの可能性を後回しにしてしまいました。

またこのマザーボードを購入した当初からちょっと不思議な状態ではありました。
というのも高負荷のゲームでは普通の動作なのですが、低負荷のゲームでは異様にブーストが掛かり高温になるというなんだかよくわからない状態に。
同じ症状の方がCPBというマザーボードの機能をオフにすると改善したとのことで真似したところ起こらなくなりました。
その代わりスリープからの復帰が失敗するようになった気も。
もしかしたらこの時から、つまり初期不良の一種だったのかも?

ちなみにこの記事は前編。
後編ではMSIの日本代理店であるアスクさんの保証について書いていきます。

コメント

タイトルとURLをコピーしました