Déjà, un grand merci à ceux qui auront le courage de lire mon roman… J’ai l’impression d’avoir quasiment tout essayé sans succès. Si vous avez quelques pistes, je suis preneur ^^
Merci.
=================
J'ai assemblé un PC mi-avril :
_ ASUS TUF B450-PLUS GAMING
_ Ryzen 5 3600X + Wraith Spire Cooler
_ MSI GeForce GTX 1660 Ti Ventus XS 6g OC
_ Corsair Vengeance LPX 16Go (2x8Go) DDR4 3200MHz C16 XMP 2.0. Kit supporté officiellement par la CM (CMK16GX4M2B3200C16 2*8GB DS Samsung 16-18-18-36 1.35V 3200MHz). J’ai une version 4.32 un peu plus récente que celle supportée officiellement (4.24) :
https://dlcdnets.asus.com/pub/ASUS/mb/S ... essors.pdf
_ Samsung 860 QVO 2.5'' SATA 1TB - MZ-76Q1T0BW
_ Seasonic MI2 II 620W EVO 80 Plus Bronze
_ Super LanBoy avec 2 ventilos Papst de 120 mm (devant + derrière)
Windows 10 Home 64bits installé depuis clé USB (media creation tool Microsoft)
Au début j’ai réussi à installer Windows (+update) sans souci.
Puis j’ai ajouté :
_ Chrome
_ des launchers (Minecraft Java, Battle.net, Steam, Xbox Bêta, Epic, Origin)
_ Norton Security (à jour + scan complet OK)
J’avais installé les drivers :
_ de la CG depuis le site de MSI
_ de la CM depuis le site d’Asus
J’ai eu quelques BSOD, j’ai donc updaté avec succès le BIOS De la v.2006 (2019/11/25) à la v.2008 (2019/12/11). Cela n’a rien solutionné, j’ai même eu l’impression que cela avait empiré les choses.
J’ai donc réinstallé les drivers :
_ de la CG depuis le site de NVIDIA
_ de la CM depuis le site d’AMD (et j’ai vérifié que les paramètres d’alimentation étaient en “AMD Ryzen Balanced” car j’ai lu que c’était un problème connu pour le BSOD)
… mais cela n’a rien solutionné.
Je me suis dit que c’était peut-être lié à l’antivirus ou aux nombreux launchers de jeux que j’ai installé. J’ai donc voulu refaire une installation fraîche de Windows (depuis la même clé USB avec suppression des anciennes partitions du SDD créées par l’ancienne installation).
Mais à partir de là, les choses ont empiré, je n’arrivais même plus à installer Windows sans me prendre des BSOD lors de l’installation (à différentes étapes).
Pour solutionner le problème :
_ J’ai passé les 2 barrettes en même temps (sur le slots A2 et B2 de la CM) sur Memtest86+ lancé à partir d’un clé USB.
_ J’ai aussi testé une seule barrette à la fois sur le slot A2. J’ai laissé tourner 12h et aucune erreur.
_ J’ai aussi testé ces barrettes sur mon PC Pro, elles ont fonctionné sans souci pendant 2 jours d’activités bureautiques.
_ J’ai testé avec le BIOS entière “par défaut” et les barrettes en configuration “automatique” (2133).
_ J’ai testé avec le BIOS “par défaut” + modification des barrettes pour une configuration “D.O.C.P.” : un seul profil m’est proposé par la CM (D.O.C.P. DDR4-3200 16-1818-36-1.35V) et correspond aux specs des barrettes.
_ J’ai changé les 2 barrettes par une barrette “no-name” que j’avais sur mon PC Pro (8 Go de DDR4-2666 non testée avec Memtest86+)
_ J’ai testé le SDD en le branchant sur mon PC Pro avec l’outil de diagnostic Samsung Magician (aucun problème détecté sur les différents tests). J’ai fait un copier/coller de 200 Go de photos sans problème dessus (pas de corruption, manipulation facile et rapide des fichiers)
_ J’ai remplacé le SDD par un HDD 2,5" d’un ancien portable que j’avais recyclé pour du stockage
_ J’ai remplacé la CG par celle d’un voisin (une Nvidia Quadro K4200).
_ Je n’ai pas pu tester ma CG sur mon PC Pro, le boîtier étant trop petit pour l'accueillir.
Aucune des manips ci-dessus n’a permis de réinstaller Windows sans BSOD. J’ai donc appelé le SAV pensant que c’était la CM. Je n’ai pu la renvoyer la CM en SAV que plusieurs mois après car le support SAV de Rue du commerce était fermé à cause du COVID. En plus transporteur a perdu la CM. Après une bataille acharnée, j’ai réussi à m’en faire renvoyer une neuve le 1er juillet… :’( (je suis sûr que ce n’est pas la même car j’ai fait une petite marque au feutre sur celle envoyée au SAV)
La nouvelle CM m’est livrée avec le BIOS déjà en v.2008 (2019/12/11) :
_ Je réinstalle Windows (+update) sans problème.
_ J’installe directement les drivers depuis les sites NVIDIA + AMD.
_ Quelques micro coupures réseau répétées sont réglées avec le drivers Realtek téléchargés sur le site ASUS.
_ Je n’installe pas d’antivirus
_ J’installe juste le launcher Blizzard (avec Hearthstone et Warzone)
Je fais de la bureautique et pendant 3 jours tout semble normal… je me dis “c’est bon, c’était la CM…” et là les BSOD reviennent notamment quand joue à Hearthstone.
Je tente alors d’installer :
_ Une CG (Asus GeForce 210 - 512 Mo : 210-SL-TC1GD3-L) qui vient du PC bureautique d’un copain
_ Une barrette no-name qui vient du PC bureautique du même copain
_ Je réinstalle les drivers NVIDIA pour la CG qui est reconnue en “GeForce 210”
… mais les BSOD continuent !
Je me rends compte qu’ASUS a publié un màj du BIOS (qui est censée stabiliser le système et la RAM), je fais donc la màj en v.2202 (2020/07/17).
… mais les BSOD persistent :’(
L’autre soir, les BSOD se sont enchaînés en usage bureautique (je naviguais entre deux onglets Chrome : je copiais-collais des infos depuis les tutos BSOD du site Malekal vers un document Google Docs). A tel point qu’un moment les BSOD se sont enchaînés au démarrage de Windows jusqu’à ce que l’interface de démarrage de la CM me propose une réparation de Windows !
J’ai donc réinstallé :
_ ma CG originale
_ mes barrettes originales
… et j’ai voulu réinstaller Windows. Et badaboum, l’installation de Windows se remet à BSOD presque à la fin : lors de la configuration quand ils demandent si on veut utiliser certains services (Cortana, les publicité ciblées, etc.) ou un peu plus tard quand on est sur le bureau et qu’il dit qu’il finalise la configuration. Les reboots rendent le système bancal (manque une icône pour l’explorateur) et les BSOD continuent.
Je teste “avec” et “sans” D.O.C.P. dans le BIOS, mais cela ne change rien.
Finalement en refaisant une clé USB avec le dernier Media creation tool de Windows j’ai réussi à réinstaller Windows (il a planté à la toute fin mais cela n’a pas semblé plomber le système). Puis, entre quelques BSOD, j’ai réinstallé les drivers Nvidia et AMD il y a deux jours. C’est avec ce système qui n’a pas encore planté ce soir (miracle !) que j’écris ce post.
Quelques infos supplémentaires :
_ Je n’ai que 2 dongles USB bluetooth pour souris + clavier Logitech
_ J’ai un câble USB pour l’imprimante Canon (que j’ai débranché)
_ J’ai teste régulièrement le BIOS “par défaut” avec la RAM à 2133 et l’option D.O.C.P.
_ J’installe toujours Windows avec la dernière version du media creation tool de Microsoft (préparé depuis un autre PC, perso ou pro) et je laisse le câble RJ45 branché durant l’installation.
_ J'ai débranché/rebranché tous les câbles modulaires de l'alim plusieurs fois (ne serait-ce qu’avec le changement de CM) et les câbles SATA
_ Le minimum vital est branché en interne et en externe (j’ai même débranché le graveur DVD).
_ J’ai changé de câble SATA pour un ancien câble de mon ancien PC
_ J’ai changé le port SATA sur lequel le SSD était branché. Je suis passé de SATA6G_1 à SATA6G_6
_ Les seuls câbles du boîtier branchés sont POWER_SW et RESET_SW
_ J’ai utilisé un logiciel pour monitorer la température du CPU
_ J’ai utilisé OCCT pendant une trentaine de minutes par test, rien de flagrant n’est ressorti. La majeur partie du temps je n’avais même pas de BSDO ! Le CPU ne dépasse pas 70° en utilisation normale et 80° avec OCCT.
_ J’ai pas vérifié la température du SSD mais il est tout seul en entrée de boitier juste devant le ventilateur.
_ mon collègue a la même CM, les mêmes CORSAIR 3200 et un Ryzen 5 3600 (le mien est un 3600X) et n’a aucun problème à part un SSD Crucial M.2 NVME non reconnu (mais pas listé comme compatible…).
_ Le CPU n’a aucun pin tordu
_ J’applique de l’Artic Silver 5 (méthode de la noisette). Quand j’ai démonté le CPU pour vérifier l’application, la pâte était correctement répartie.
Les BSOD arrivent finalement assez équitablement en bureautique et en gaming avec des délais très différentes. Parfois je peux faire de la bureautique ou du gaming (Warzone à fond pendant 4h) sans BSOD et parfois cela s’enchaîne frénétiquement, même sur une install qui était au départ plutôt “stable”. J’ai l’impression que l’instabilité avance avec le temps et les BSOD jusqu’à ce qu’une tentative de réinstallation de Windows ne soit même plus possible (sur la première CM, quand je n’arrivais plus à installer Windows, je n’arrivais même pas à installer Ubuntu18.04.4 à partir d’une autre clé USB créée avec Rufus et sans UEFI. L’install freezait vers la fin !).
La seule chose que je ne peux pas tester c’est le remplacement :
_ de l’alim. Il manque des adaptateurs à mon ancienne alim ENERMAX Noisetaker 370W (qui est très/trop short pour le 1660 Ti mais qui pourrait passer avec la petite CG passive de mon pote).
_ du CPU. Pas facile de trouver quelqu’un (même un pote) qui a un CPU compatible, qui accepte de démonter sa config et d’avoir son PC H.S. le temps de faire mes tests ^^ Quand j’ai contacté le SAV pour la CM, j’ai aussi contacté le support AMD (CPU garanti 3 ans directement par AMD car en version boîte). Ils m'autorisaient un retour SAV (aux Pays-Bas via DHL mais comme j’étais persuadé que c’était la CM je ne l’ai pas renvoyé (c’est quand même archi rare le CPU qui a des problèmes ?!). Ne sachant plus trop quoi faire, je vais leur renvoyer fin août après mes vacances (j’ai peur qu’ils me renvoient le CPU avant que je sois rentré si je l’expédie cette semaine).
L’analyse des minidumps avec Whocrashed montre une multitude de BSOD la majeure partie du temps NTOSKRNL.
Quand j’analyse post-BSOD le fichier MEMORY.DMP avec Windbg je trouve tout le temps du MEMORY_CORRUPTION_LARGE
Voici un échantillon des stop codes que j’ai eu jusqu’à maintenant :
- kernel security check failure
- driver irql not less or equal
- system service exception
- irql not less or equal
- dpc watchdog violation (freeze d’une trentaine de secondes avant l'apparition du stop code)
+ quelques freezes “avec” et “sans” BSOD
J’ai quelques doutes :
_ Quand j’ai testé deux fois de remplacer mes barrettes par des barrettes no-name de 2 PC différents était-ce une bonne idée. A côté de ça mon collègue a les mêmes barrettes sur la même CM et cela fonctionne… Et mes barrettes passent nickel sous Memtest86+
_ L’alim pourrait être en cause ? Même s’il me semble que l’alim ça ne fait pas des BSOD, cela fait des arrêts nets et/ou flingue les composants…
_ Un CPU cela peut causer des BSOD “MEMORY_CORRUPTION_LARGE” ? J’ai lu quelques posts pour des gens chez qui le CPU est l'origine de maux bizarres mais c’est super rare...
=================
Merci et ceux qui auront pris le temps de lire mon pavé !
Je me doute que la réponse n'est pas évidente mais je suis preneur de vos idées et conseils… car je ne sais pas pourquoi mais j’ai le pressentiment qu’AMD va me dire fin août que le CPU va bien :’(
Merci pour votre aide !
Code : Tout sélectionner
#########################
#########################
# Voici quelques exports de WhoCrashed sur ma précédente installation
#########################
#########################
Crash Dump Analysis
Crash dumps are enabled on your computer.
Crash dump directories:
C:\Windows
C:\Windows\Minidump
On Thu 23/07/2020 20:44:57 your computer crashed or a problem was reported
crash dump file: C:\Windows\Minidump\072320-4453-01.dmp
This was probably caused by the following module: ntoskrnl.exe (nt+0x3DDB60)
Bugcheck code: 0x139 (0x1E, 0xFFFFF205169A9A90, 0xFFFFF205169A99E8, 0x0)
Error: KERNEL_SECURITY_CHECK_FAILURE
file path: C:\Windows\system32\ntoskrnl.exe
product: Microsoft® Windows® Operating System
company: Microsoft Corporation
description: NT Kernel & System
Bug check description: The kernel has detected the corruption of a critical data structure.
The crash took place in the Windows kernel. Possibly this problem is caused by another driver that cannot be identified at this time.
On Thu 23/07/2020 20:44:57 your computer crashed or a problem was reported
crash dump file: C:\Windows\MEMORY.DMP
This was probably caused by the following module: ntkrnlmp.exe (nt!setjmpex+0x8179)
Bugcheck code: 0x139 (0x1E, 0xFFFFF205169A9A90, 0xFFFFF205169A99E8, 0x0)
Error: KERNEL_SECURITY_CHECK_FAILURE
Bug check description: The kernel has detected the corruption of a critical data structure.
The crash took place in the Windows kernel. Possibly this problem is caused by another driver that cannot be identified at this time.
On Thu 23/07/2020 19:12:22 your computer crashed or a problem was reported
crash dump file: C:\Windows\Minidump\072320-4531-01.dmp
This was probably caused by the following module: ntoskrnl.exe (nt+0x3DDB60)
Bugcheck code: 0xA (0x30, 0x2, 0x1, 0xFFFFF8040D52695A)
Error: IRQL_NOT_LESS_OR_EQUAL
file path: C:\Windows\system32\ntoskrnl.exe
product: Microsoft® Windows® Operating System
company: Microsoft Corporation
description: NT Kernel & System
Bug check description: This indicates that Microsoft Windows or a kernel-mode driver accessed paged memory at DISPATCH_LEVEL or above. This is a software bug.
This bug check belongs to the crash dump test that you have performed with WhoCrashed or other software. It means that a crash dump file was properly written out.
The crash took place in the Windows kernel. Possibly this problem is caused by another driver that cannot be identified at this time.
On Wed 22/07/2020 20:32:12 your computer crashed or a problem was reported
crash dump file: C:\Windows\Minidump\072220-4921-01.dmp
This was probably caused by the following module: ntoskrnl.exe (nt+0x3DDA20)
Bugcheck code: 0x1A (0x61941, 0x7FFE3BCCAE14, 0x1D, 0xFFFFAD0E7F7C6B00)
Error: MEMORY_MANAGEMENT
file path: C:\Windows\system32\ntoskrnl.exe
product: Microsoft® Windows® Operating System
company: Microsoft Corporation
description: NT Kernel & System
Bug check description: This indicates that a severe memory management error occurred.
This might be a case of memory corruption. This may be because of a hardware issue such as faulty RAM, overheating (thermal issue) or because of a buggy driver. This problem might also be caused because of overheating (thermal issue).
The crash took place in the Windows kernel. Possibly this problem is caused by another driver that cannot be identified at this time.
On Wed 22/07/2020 19:22:53 your computer crashed or a problem was reported
crash dump file: C:\Windows\Minidump\072220-6671-01.dmp
This was probably caused by the following module: ntoskrnl.exe (nt+0x3DDA20)
Bugcheck code: 0x1 (0x7FFB4270AE14, 0x0, 0xFFFF, 0xFFFFCB81791AAB80)
Error: APC_INDEX_MISMATCH
file path: C:\Windows\system32\ntoskrnl.exe
product: Microsoft® Windows® Operating System
company: Microsoft Corporation
description: NT Kernel & System
Bug check description: This indicates that there has been a mismatch in the APC state index.
This appears to be a typical software driver bug and is not likely to be caused by a hardware problem.
The crash took place in the Windows kernel. Possibly this problem is caused by another driver that cannot be identified at this time.
On Mon 20/07/2020 23:06:10 your computer crashed or a problem was reported
crash dump file: C:\Windows\Minidump\072020-7375-01.dmp
This was probably caused by the following module: ntoskrnl.exe (nt+0x3DDA20)
Bugcheck code: 0xA (0x155A9CF2948, 0xFF, 0x12, 0xFFFFF80629E2798F)
Error: IRQL_NOT_LESS_OR_EQUAL
file path: C:\Windows\system32\ntoskrnl.exe
product: Microsoft® Windows® Operating System
company: Microsoft Corporation
description: NT Kernel & System
Bug check description: This indicates that Microsoft Windows or a kernel-mode driver accessed paged memory at DISPATCH_LEVEL or above. This is a software bug.
This bug check belongs to the crash dump test that you have performed with WhoCrashed or other software. It means that a crash dump file was properly written out.
The crash took place in the Windows kernel. Possibly this problem is caused by another driver that cannot be identified at this time.
Conclusion
6 crash dumps have been found and analyzed. No offending third party drivers have been found. Connsider using WhoCrashed Professional which offers more detailed analysis using symbol resolution. Also configuring your system to produce a full memory dump may help you.
#########################
# Voici quelques exports de WhoCrashed sur ma version installation actuelle de Windows
#########################
#########################
Code : Tout sélectionner
Crash Dump Analysis
Crash dumps are enabled on your computer.
Crash dump directories:
C:\Windows
C:\Windows\Minidump
On Sun 26/07/2020 16:07:00 your computer crashed or a problem was reported
crash dump file: C:\Windows\Minidump\072620-5421-01.dmp
This was probably caused by the following module: ntoskrnl.exe (nt+0x3DDB60)
Bugcheck code: 0xA (0x8021, 0x2, 0x0, 0xFFFFF80114F6E5BA)
Error: IRQL_NOT_LESS_OR_EQUAL
file path: C:\Windows\system32\ntoskrnl.exe
product: Microsoft® Windows® Operating System
company: Microsoft Corporation
description: NT Kernel & System
Bug check description: This indicates that Microsoft Windows or a kernel-mode driver accessed paged memory at DISPATCH_LEVEL or above. This is a software bug.
This bug check belongs to the crash dump test that you have performed with WhoCrashed or other software. It means that a crash dump file was properly written out.
The crash took place in the Windows kernel. Possibly this problem is caused by another driver that cannot be identified at this time.
On Sun 26/07/2020 16:07:00 your computer crashed or a problem was reported
crash dump file: C:\Windows\MEMORY.DMP
This was probably caused by the following module: ntkrnlmp.exe (nt!setjmpex+0x8179)
Bugcheck code: 0xA (0x8021, 0x2, 0x0, 0xFFFFF80114F6E5BA)
Error: IRQL_NOT_LESS_OR_EQUAL
Bug check description: This indicates that Microsoft Windows or a kernel-mode driver accessed paged memory at DISPATCH_LEVEL or above. This is a software bug.
This bug check belongs to the crash dump test that you have performed with WhoCrashed or other software. It means that a crash dump file was properly written out.
The crash took place in the Windows kernel. Possibly this problem is caused by another driver that cannot be identified at this time.
On Sun 26/07/2020 15:58:43 your computer crashed or a problem was reported
crash dump file: C:\Windows\Minidump\072620-5750-01.dmp
This was probably caused by the following module: ntoskrnl.exe (nt+0x3DDB60)
Bugcheck code: 0x1 (0x7FFD6420AEB4, 0x0, 0xFFFF, 0xFFFFC186A2E99B80)
Error: APC_INDEX_MISMATCH
file path: C:\Windows\system32\ntoskrnl.exe
product: Microsoft® Windows® Operating System
company: Microsoft Corporation
description: NT Kernel & System
Bug check description: This indicates that there has been a mismatch in the APC state index.
This appears to be a typical software driver bug and is not likely to be caused by a hardware problem.
The crash took place in the Windows kernel. Possibly this problem is caused by another driver that cannot be identified at this time.
Conclusion
3 crash dumps have been found and analyzed. No offending third party drivers have been found. Connsider using WhoCrashed Professional which offers more detailed analysis using symbol resolution. Also configuring your system to produce a full memory dump may help you.
#########################
#########################
# Voici l’analyse du dump MEMORY.DMP avec WinDbg (x64)
#########################
#########################
Il se base sur le BSOD dont le minidump est analysé sous “IRQL_NOT_LESS_OR_EQUAL” le 26/07/2020 16:07:00…
… avec comme toujours… un MEMORY_CORRUPTION_LARGE
------------------------
MODULE_NAME: memory_corruption
IMAGE_NAME: memory_corruption
FOLLOWUP_NAME: memory_corruption
DEBUG_FLR_IMAGE_TIMESTAMP: 0
MEMORY_CORRUPTOR: LARGE
FAILURE_BUCKET_ID: MEMORY_CORRUPTION_LARGE
BUCKET_ID: MEMORY_CORRUPTION_LARGE
PRIMARY_PROBLEM_CLASS: MEMORY_CORRUPTION_LARGE
TARGET_TIME: 2020-07-26T14:07:00.000Z
OSBUILD: 19041
OSSERVICEPACK: 0
SERVICEPACK_NUMBER: 0
OS_REVISION: 0
SUITE_MASK: 784
PRODUCT_TYPE: 1
OSPLATFORM_TYPE: x64
OSNAME: Windows 10
OSEDITION: Windows 10 WinNt TerminalServer SingleUserTS Personal
OS_LOCALE:
USER_LCID: 0
OSBUILD_TIMESTAMP: unknown_date
BUILDDATESTAMP_STR: 191206-1406
BUILDLAB_STR: vb_release
BUILDOSVER_STR: 10.0.19041.1.amd64fre.vb_release.191206-1406
ANALYSIS_SESSION_ELAPSED_TIME: 16bb
ANALYSIS_SOURCE: KM
FAILURE_ID_HASH_STRING: km:memory_corruption_large
FAILURE_ID_HASH: {e29154ac-69a4-0eb8-172a-a860f73c0a3c}
Followup: memory_corruption