Bonjour,
Un avis sur ces messages qui s'affichent dans la console SSH d'un serveur dédié ?
Ça ressemble à une erreur matériel, et ça m’inquiète un peu.
Message from syslogd@http6 at Apr 25 11:25:37 ...
kernel:[58117660.934597] mce: [Hardware Error]: CPU 1: Machine Check: 0 Bank 0: 9000004000010005
Message from syslogd@http6 at Apr 25 11:25:37 ...
kernel:[58117660.934641] mce: [Hardware Error]: TSC 2be045ab140effc
Message from syslogd@http6 at Apr 25 11:25:37 ...
kernel:[58117660.934680] mce: [Hardware Error]: PROCESSOR 0:306a9 TIME 1682414737 SOCKET 0 APIC 2 microcode 17
Merci.
Serveurs dédiés - Mce: [Hardware Error]: CPU 1
Related questions
- Proxmox VM accès internet impossible
55292
19.11.2016 12:11
- Spam et IP bloquée
52629
12.12.2016 11:53
- il y a quelqu'un ?
51748
15.12.2025 17:01
- Mise en place de VM avec IP publique sur Proxmox 6 [RESOLU]
50570
30.04.2020 17:12
- SSD NVMe Soft Raid ou SSD SATA Hard Raid
50151
29.06.2021 23:29
- Port 25 bloqué pour spam à répétition
47381
28.02.2018 13:39
- Mise à jour PHP sur Release 3 ovh
46813
11.03.2017 17:43
- Identification carte réseau
45712
05.12.2025 10:09
- Connection smtp qui ne marche plus : connect error 10060
45078
12.04.2019 10:10
- Partition sur le disque de l'OS ESXI
44819
09.05.2017 14:33
Avec des bank= j'aurais bien dit un problème mémoire ; mais CPU 1 dit le contraire ; la lecture ne m'éclaire pas plus
https://bbs.archlinux.org/viewtopic.php?id=266210
Si c'est juste au reboot ça correspond à ce qu'ils disent dans ce post ??
Oui je suis aussi arrivé sur cette page. Et du coup j'ai eu un doute....
Si c'est un problème RAM ça pourra attendre ce week-end. Si c'est le processeur, je ne sais pas du tout.
Je continu les recherches.
Les message sont apparus pendant le fonctionnement (je reboot que lorsqu’il y a un changement de kernel).
Ceci-dit les services fonctionnent correctement.
alors j'ai des messages similaires sur mon pc (une station de travail HP d'occasion).
Et en fait ça tourne malgré tout depuis des mois...
Clairement une erreur hardware quelque part, ram ou cpu...
M'enfin la RAM est théoriquement ECC, donc le serveur sait gérer les erreurs...
Et le CPU si c'est de la gamme serveur idem, il sait gérer quelques erreurs...
ça peut être la RAM, car en fait c'est la RAM attachée à un CPU... D'où l'alerte CPU 1...
Vi sur du multi cpu chaque RAM est associée physiquement à un CPU donné.
A priori pas d'urgence, mais prévoir un reboot en mode rescue pour faire les tests hardware, à programmer.
Avec changement de hardware derrière si l'origine du problème peut être identifié via les tests...
Bonjour,
ou cela peut être le CPU qui est mal serré et tous les pins du socket ne touchent plus le CPU à cause de la dilatation thermique (déjà vécu - un coup de tournevis et c'était reparti).
Sur certains CPU intel (et les derniers AMD) c'est le ventirad qui sert à mettre la bonne pression au CPU sur le socket (il n'y a plus la cage avec le levier).
Cordialement, janus57
Merci à @tous.
Je vais migrer les sites sur une autre machine et lancer les tests hardware.