Bare Metal Products - RAID SOFT - NVMe 0 disparu... je peux booter sur NVMe 1 ?
BMPCreated with Sketch.BMPZIPCreated with Sketch.ZIPXLSCreated with Sketch.XLSTXTCreated with Sketch.TXTPPTCreated with Sketch.PPTPNGCreated with Sketch.PNGPDFCreated with Sketch.PDFJPGCreated with Sketch.JPGGIFCreated with Sketch.GIFDOCCreated with Sketch.DOC Error Created with Sketch.
Frage

RAID SOFT - NVMe 0 disparu... je peux booter sur NVMe 1 ?

Von
Didier MISSON
Erstellungsdatum 2025-05-09 09:44:54 in Bare Metal Products

Bonjour. J'ai des problèmes RAID soft sur un dédié Proxmox.

Plusieurs problèmes. Je vérifie le RAID soft

# cat /proc/mdstat
Personalities : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10] 
md5 : active raid1 nvme1n1p5[1] nvme0n1p5[0](F)
      476380160 blocks super 1.2 [2/1] [_U]
      bitmap: 4/4 pages [16KB], 65536KB chunk

md3 : active raid1 nvme1n1p3[1] nvme0n1p3[0](F)
      20954112 blocks super 1.2 [2/1] [_U]
      
md2 : active raid1 nvme1n1p2[1] nvme0n1p2[0]
      1046528 blocks super 1.2 [2/2] [UU]
      
unused devices: <none>

==============

Le NVMe 0 semble disparu

# nvme smart-log /dev/nvme0
/dev/nvme0: Resource temporarily unavailable
Usage: nvme smart-log <device> [OPTIONS]

Retrieve SMART log for the given device (or optionally a namespace) in either
decoded format (default) or binary.

Options:
  [  --namespace-id=<NUM>, -n <NUM> ]   --- (optional) desired namespace
  [  --output-format=<FMT>, -o <FMT> ]  --- Output format: normal|json|binary
  [  --raw-binary, -b ]                 --- output in binary format
  [  --human-readable, -H ]             --- show info in readable format

 

Mais le NVMe 1 est correct :

# nvme smart-log /dev/nvme1
Smart Log for NVME device:nvme1 namespace-id:ffffffff
critical_warning            : 0
temperature                : 38°C (311 Kelvin)
available_spare                : 100%
available_spare_threshold        : 10%
percentage_used                : 28%
endurance group critical warning summary: 0
Data Units Read                : 268,457,491 (137.45 TB)
Data Units Written            : 182,980,744 (93.69 TB)
host_read_commands            : 4,312,217,267
host_write_commands            : 6,730,975,947
controller_busy_time            : 12,051
power_cycles                : 41
power_on_hours                : 36,006
unsafe_shutdowns            : 32
media_errors                : 0
num_err_log_entries            : 0
Warning Temperature Time        : 0
Critical Composite Temperature Time    : 0
Thermal Management T1 Trans Count    : 0
Thermal Management T2 Trans Count    : 0
Thermal Management T1 Total Time    : 0
Thermal Management T2 Total Time    : 0

==============================

Je vais ouvrir un incident chez OVH. Je suppose qu'ils remplaceront le NVMe 0.

 

Question : Le serveur Proxmox va rebooter sur son 2ème disques (NVMe 1), vu que le 1er semble mort, et après remplacement, il sera vide...

 

Je peux demander l'heure de l'intervention ?

Merci. Bonne journée

 

 


1 Antwort ( Latest reply on 2025-05-27 07:39:30 Von
^FabL
)

Bonjour @Didier MISSON,

Est-ce que votre question est toujours d’actualité ?
Si oui, pensez à ajouter quelques infos en plus (comme des tests, erreurs rencontrées, ou toute autre piste) pour que la communauté puisse mieux vous aider. Et si vous avez trouvé une solution entre-temps, n’hésitez pas à la partager ici, ça pourra sûrement servir à d’autres !

À bientôt 🙂

^FabL