皆様いかがお過ごしでしょうか。歌乃です。

私のPCはいわゆる自作PCでございます。

パーツを一つづつ自分で選んで、組み上げて、PCとして稼働するようにしたわけです。

自作PCのいいところは強化したい部分に良いパーツを、そうでもないところは安いパーツまたはパーツ自体を省く、といった自由度の高い構成ができるところです。まあ、ショップのBIO (ビルトインオーダー) でも似たようなことはできるんですが (´・ω・`)

ある程度自作 PC の知識がある方向けの内容になっています。

(今回も大半は戯言です)

その他にも自作の場合、ハードウェアの不具合が発生した時に不具合を起こしているパーツのみを交換すれば問題なく使えるようになる、という事もあります。

大半のPCはメーカー品も含めて規格化されているのでその気になればメーカー品でも自分でパーツ交換できます。ただしその場合はメーカー保証外になってしまうこと、メーカー品は特殊な形状のパーツを使っている場合があり、市販品の流用が難しい場合 (規格はあっているけどケースに入らない、他のパーツと干渉するなど) があります。

今の PC は 2020年に組んだものです。つまりほぼ 5 年間稼働しているわけですね。

PC構成

  • OS : windows 10 Pro 22H2適用 OSbuild 19045.5965
  • MB : ASUS TUF GAMING B550M-PLUS(WI-FI)
  • CPU : AMD Ryzen 5 5600x
  • GPU : NVIDIA GeForce RTX 3070 (8GB) ZT-A30700H-10P
  • PSU : 850W80PLUS GOLD (CP-9020180-JP)
  • MEM : 32GB (16GB x 2) CMK32GX4M2D3200C16

PCパーツのメーカー保証は大抵 1年 長くて 3 年なのでいいかげん耐用年数超えてるんじゃないかって感じですが、調子よく動いてます。

いや、動いてました。この間までは!( ゚Д゚)


PCがフリーズするようになった

いつものように Windows UPDATE を適用したところ、再起動後しばらくして PC がフリーズしました。

ブルースクリーンなどは出ず、マウス・キー入力共に反応なし、ctrl + alt + del にも反応しないため、リセットによる強制終了>再起動をおこないました。

一度程度のフリーズであればゲーム等やっていれば茶飯事なので気にもしませんが、その後フリーズが頻発するようになりました。

いずれの場合もブルースクリーンなどはなく、いきなり再起動、または完全フリーズで強制終了>再起動のパターンです。


なんとなく修正してみる

さすがにこれはおかしいなと思い、修正を試みます。

まずは疑わしい windows update をアンインストール。

効果なし。

つぎに疑ったのは グラボのドライバーです。

GeForce Game Readyドライバ 576.xx は不具合報告が多く、環境によってはブルースクリーンやフリーズするとの記事をみて、比較的安定しているとされる 566.36 バージョンにダウングレードしました。

効果なし。

それならば、と次に試したのは MB の BIOS アップデート。

動作が安定してたので 3 年ほどアップデートしてませんでしたが、販売元の ASUS の公式から最新の BIOS がでていたので早速アップデート。

効果なし。むしろ悪化( ゚Д゚)

さすがに危機感を感じ始めたのでまじめに調べることにしました。


まじめに調査してみる

まずは windows のシステムに問題が起きてないか調べます。

windows にはさまざまなログが記録されており、必要に応じてそれを確認するためのツール (イベントビューアー) が実装されています。

イベントビューアーは「スタートボタンを右クリック」>「イベントビューアー」、または windows キー + X >「イベントビューアー」

または「ここに入力して検索」か「ファイル名を指定して実行」に「eventvwr」と入力して実行で呼び出すことができます。

pc_restore001

※画像はサンプルで当時のものではありません。

左のツリービューから「windows ログ」>「システム」を選び、システムのイベントログを確認します。

「エラー」または「致命的」となっているイベントを確認します。

致命的はそうそうありませんが、エラーは結構記録されています。

その中で気になったのは、TPM (Trusted Platform Module) と SVM (Secure Virtual Machine) に関するエラー。 TPMはセキュリティ関連、SVMは仮想マシン関連の技術です。


TPM・SVM エラー

TPM・SVM、どちらも BIOS の設定で有効・無効の切り替えが可能です。

BIOS のアップデートをおこなったせいで初期化されたようなので、再起動をおこなって BIOS の設定から両方を有効に変更します。

イベントビューアーで確認するとTPM・SVM関連のエラーは出なくなりましたが相変わらずフリーズが起こります。

効果なし。


nvlddmkm エラー

つぎに対処したのは nvlddmkm エラー、これは種類はいろいろあるけれど原因はグラボの異常になります。

あー、グラボが逝きそう (壊れかけ) なのかー、と、一度は思ったのですが、それにしてはブラックアウトするわけでもなく、ちらつきやドット抜けが起きるわけでもなく、フリーズ中も画面は表示されたままなので、壊れてるわけではないのかも?と思い直して、そういえばドライバーをダウングレードしたことに気付きました。

グラボのドライバーをアップデートしたところ、案の定、nvlddmkm は出なくなりました。

効果なし。

この時点でイベントビューアーのエラーはほとんどなくなりました。


メモリのOCを止めてみる

うちの自作マシンは初期状態で今回と似たような症状になったことがあります。

メモリスロットのA1、B1を使用していたのが原因ですが ( 本来は A2、B2 スロットに差す仕様 ) 本来のスロットに変更した後も、不安定なままで、メモリOCをすることでやっと安定したという経緯があります。

OCといっても大層なものではなく、使用しているメモリ CMK32GX4M2D3200C16 は元々そういった使い方を想定したメモリなので3200MHzでの使用に問題はないはず (寿命はちぢむかもしれませんが) 。実際ここ5年は問題なかったわけですし。

まあ、経年劣化で調子が悪くなった可能性もあるにはあるので (その場合は交換しか手段がないわけですが) 気休めと言うか、試しにと、OCを止めて 2166MHz で起動してみました。

一時的に回復したように見えましたが、使っているうちにまたフリーズしてしまいました。

効果なし。

windows には メモリの正常性をチェックする「メモリ診断」ツールがあります。

「スタートメニュー」>「ウィンドウズ管理ツール」>「windows メモリ診断」

pc_restore002

再起動後にメモリ診断ツールが起動してメモリのチェックが実行されます。結構時間がかかるのでお茶でも飲んでのんびり待ちましょう。

診断の結果は特に問題なしでした。


CPUのOCを止めてみる

実際には OC してないのですが、BIOS の設定では OC が有効になっているようだったので、一旦 BIOS の設定を初期化 (工場出荷時の状態に) してみました。

ひどいときは起動時にフリーズするように。

メモリも含めて設定を元に戻して、どうにか使えるようにしました (相変わらず突然フリーズしますが) 。

効果なし。むしろ悪化

CPUに 問題 (経年劣化による故障) があるのかと思い、AMD公式からツールをダウンロードして負荷テストを実行してみました。

結果は特に問題なしでした。


CPUのLLC (Load Line Calibration) を変更してみる

デフォルトでは LLC は AUTO 設定になっています。

公式サイトの FAQ を漁ると AUTO では LEVEL5 が適用されるとか。

なので順番に LEVEL5 ~ LEVEL1 まで変更してみました。

効果? フリーズまでの時間は長くなったような気が。フリーズ自体は起きるので根本的には解決していない。


PSU (電源) を確認してみる

CPUのLLC を変更していて、システム全体の電圧が不安定になっているせいかもしれないと思い至り、電源を確認しました。

確認と言っても電源ファンがきちんと回っているかどうか (ファンが止まっていると温度が上がって電源が止まるらしい) ぐらいしか見るところがありませんが。

たいてい背面から排気していると思うのでそこを確認すればファンが回っているかどうか確認できます。

問題なく稼働しているようです。


その他試した事

  • システムディスク (SSD) のディスクチェック。問題なし。
  • システムファイルチェッカーを使用して、システムファイルの修復。問題なし。
  • ウィルスセキュリティソフトでシステムチェック。問題なし。


最終的に効果のあった事

何をやってもフリーズが直らず途方に暮れかけてましたが、開き直って、CPUをOCしてみたらどうだろう?と思いつき、やってみました。

CORE 電圧をデフォルトで 1.410 V だったところを 1.450 Vまで上げてみました。

結果的にこの設定でシステムは安定しました。

いままでは OC 有効ではあっても OC デフォルトのままで「なんちゃってOC」状態のPCでした。

基本的に OC は 電圧を上げてclock数を稼ぐので、発熱が上がる=パーツの寿命が縮む、であり避けていました。

そのおかげかどうかはわかりませんが 5 年目でも元気に動いてくれていたのではと思っています。

ネットの噂ではもともと Ryzen 5 5600x は繊細でメモリの相性や電圧に敏感な CPU という話です。

いままでは安定していたけど何らかの理由で設定が変わってしまったか、いままでの設定では不安定になったのだろうと結論しました。

OC の電圧もそこまで負荷の高い設定ではない (思ったほど温度の上昇もない) のでこのまま様子を見ようと思っています。




このあと3日経過しましたがフリーズは起きていません (`・ω・´)

Post If you feel like it, I would be happy if you could post it.