Serveurs Dédiés-old - Maintenance: remplacement des 2 disques durs
... / Maintenance: remplacement...
BMPCreated with Sketch.BMPZIPCreated with Sketch.ZIPXLSCreated with Sketch.XLSTXTCreated with Sketch.TXTPPTCreated with Sketch.PPTPNGCreated with Sketch.PNGPDFCreated with Sketch.PDFJPGCreated with Sketch.JPGGIFCreated with Sketch.GIFDOCCreated with Sketch.DOC Error Created with Sketch.
Frage

Maintenance: remplacement des 2 disques durs

Von
Piboulo
Erstellungsdatum 2018-02-10 20:48:08 (edited on 2024-09-04 11:02:53) in Serveurs Dédiés-old

Bonjour à tous,

J'ai reçu ce message de la part du support Kimsufi:
"Les deux disques durs ne sont plus détecte malgré plusieurs tentatives de récupérations en vain. Ils ont étaient remplacer."

Suite à cela, le serveur a été démarré en mode Rescue.

Dois-je comprendre que l'ensemble des données du serveur sont perdues ?


22 Antworten ( Latest reply on 2021-02-09 20:00:13 Von
fritz2cat officiel (d'avant la migration)
)

Salut @Piboulo


Dois-je comprendre que l'ensemble des données du serveur sont perdues ?

c'est tout a fait ça oui...
Tu peux relancer une reinstallation si tu n'as que 2 disques et remonter tes backups.

Jalinn


Suite à cela, le serveur a été démarré en mode Rescue.


S'ils étaient en miroir (RAID 1) il se peut que le premier ait rendu l'âme il y a des mois ou des années.
Quand le second rend l'âme aussi, alors oui tout est perdu et vous n'avez plus que vos backups pour remonter votre serveur.

Des disques durs, ça doit être surveillé.
smartmontools pour questionner les staitstiques S.M.A.R.T. (détecter les bad blocks avant la panne totale)
cat /proc/mdstat pour voir l'état de vos RAID.

Sauf que les sauvegardes étaient sur le 2nd disque dur... compte tenu de la taille du site, et de ma faible connexion ADSL, je ne pouvais pas faire de sauvegardes en local... d'où le serveur avec 2 disques.

Est-ce qu'il y a possibilité de récupérer les disques auprès de OVH pour tenter de récupérer les données (site qui avait plus de 15 ans...).


d'où le serveur avec 2 disques


Tu veux dire que avant-hier, les deux disques étaient pleinement opérationnels ? (et pas en RAID) ?
Drôle de coïncidence qu'ils lâchent tous les deux en même temps.

Oui, Fritz2cat c'est bien cela.

Le serveur a été pris au mois d'Octobre 2020, sur lequel j'ai migré le site.

Les disques durs sont pas en RAID, et fonctionnaient sans soucis, je n'ai eu aucune alerte, ni par OVH, ni dans Webmin.

Ca vaut la peine de demander à les remettre sur ce serveur ou sur un autre, quitte à le payer (et le garder après pour y loger ses backups)

Je ne garantis pas la réponse.

Le mail complet reçu ce matin:

_Voici les détails de cette opération :_
_Amelioration du refroidissement du processeur_
_Date 2021-02-09 06:13:34 CET (UTC +01:00), Amelioration du refroidissement du processeur:_
_Attention :_
_Les deux disques durs ne sont plus détecte malgré plusieurs tentatives de récupérations en vain._
_Ils ont étaient remplacer._

_Détails de l'opération:_

_Un défaut avec le système de refroidissement a été détecté, nous l'avons corrigé. Les températures rapportées sont maintenant normales._

_Le serveur est démarré sur disque et est sur l'écran de connexion. Ping OK et les services sont ouverts._


Est-ce qu'il y a possibilité de récupérer les disques auprès de OVH pour tenter de récupérer les données (site qui avait plus de 15 ans...).

Il me semble que oui, mais c'est (de mémoire) autour des 100€ par disque pour une expedition a ton adresse par transporteur.

Sur les serveurs, tu as normalement acces a 500 Go de backup storage.
Tu aurais pu mettre tes data dessus.

Pour rappel, un backup n'est JAMAIS sur le serveur. Une copie de fichier ne constitue PAS un backup.
Quand tes donnée sont critique, tu dois avoir une copie en local ou sur un autre petit serveur au besoin (kimsufi par exemple).

Tu dois pouvoir t'affranchir de ton provider pour des questions de maitrise de tes données.
A tout moment, tu dois être en mesure de remonter facilement ton site avec un downtime maitrisé.


Sur les serveurs, tu as normalement acces a 500 Go de backup storage.


pas en kimsufi à ma connaissance

Ha oui, je n'ai pas fais attention a ce détail sur le premier post.

Donc non, pas de backup storage...

Je m'interroge toujours sur le fait que les 2 disques durs soient HS en même temps... sur un serveur souscrit en Novembre, au bout de 3 mois...

Peu probable, mais possible... Ca s'appelle la loi des séries. Ça peut aussi être le contrôleur qui du jour au lendemain n'aime plus tes disques. Peu probable aussi.
Je suis un spécialiste... On dit aussi poissard...

Sur Kimsufi, tu n'auras jamais du matériel neuf !
en gros, le cycle de vie des serveurs et composant chez OVH c'est, sensiblement ça :
1er cycle : Gamme de serveur OVH
2eme : SoYouStart
3eme : Kimsufi

les composant sont donc amortis, ce qui permet a OVH de proposer des prix ultra compétitif.
La contrepartie, c'est qu'il faut être vigilant sur l'état des disques et autre composant.
Pour un CPU ou de la ram => pas de soucis, une inter et c'est good.
pour les disques, qui ont probablement quelques milliers d'heures de vols, il faudra être plus vigilant.

Pour rappel, KS indique clairement que c'est pour de l'apprentissage, de la sandbox ect...
Il est toujours risqué de mettre de la prod sur ce type d'offre !!

Comme dit dans le diagnostic, il a fait chaud là-dedans, peut-être trop chaud.
C'est bête quand il y a -5 dehors et que OVH se vante du air-cooling/water cooling...

J'ai eu le cas où les 2 disques d'un serveur ont claqué en 1 semaine.
Me souviens avoir tout juste terminé de rebuild le raid après le premier disque HS que le 2° s'est fait la malle dans la foulée... Mais ça reste exceptionnel...

C'est quand même la poisse...

En attendant j'ai ouvert un ticket sur l'interface Kimsufi pour demander à récupérer les disques durs... et toujours pas de réponse. J'espère qu'ils vont me répondre avant de les balancer à la poubelle... ☹️

Il y a d'autres moyens pour leur faire cette demande ?

Le soucis c'est que c'est KS...
Déjà que sur la gamme principale le support n'est pas tjrs facile à joindre alors KS je n'ose imaginer l'horreur...


Il y a d'autres moyens pour leur faire cette demande ?


Faire une demande sur twitter: ovh_support_fr ? avec le max de renseignements, le n° du ticket, le n° du serveur ?

Bonjour,

pour le kimsufi c'est uniquement via le site KS, au dernière nouvelles le support OVH envoie boulet car pas dans leur domaine de prise en charge.

Sinon les deux disque était visible, mais le SMART des deux disque indiqué quoi ?
Car je vois le fait qu'un disque était en fin de vie et l'autre c'est pris un coup de "mort subite".

Sans compter que les disques sur les KS sont pas de première fraicheurs.

Cordialement, janus57


Car je vois le fait qu'un disque était en fin de vie


un exemple sur un de mes ks (2x 500 GB en Raid1) à base de Intel(R) Core(TM)2 Duo CPU E6550

un des disques est un ST3500418AS (date de fab probable 2009)
9 Power_On_Hours 0x0032 088 011 000 Old_age Always - 11091
11000 ? à mon avis c'est 110000

l'autre est un ST500DM002-1BC142
9 Power_On_Hours 0x0032 017 017 000 Old_age Always - 73535

Bonjour,

Perso sur 2 KS différents :

[code]
:~# ./hdsentinel
Hard Disk Sentinel for LINUX console 0.18c.8675 (c) 2019 info@hdsentinel.com
Start with -r [reportfile] to save data to report, -h for help

Examining hard disk configuration ...

HDD Device 0: /dev/sda
HDD Model ID : TOSHIBA DT01ACA050
HDD Serial No: Z2FHEPZFS
HDD Revision : MS1OA750
HDD Size : 476940 MB
Interface : S-ATA Gen3, 6 Gbps
Temperature : 17 °C
Highest Temp.: 70 °C
Health : 100 %
Performance : 100 %
Power on time: 2871 days, 3 hours
Est. lifetime: more than 100 days
The hard disk status is PERFECT. Problematic or weak sectors were not found and there are no spin up or data transfer errors.
No actions needed.
[/code]

[code]
:~# ./hdsentinel
Hard Disk Sentinel for LINUX console 0.18c.8675 (c) 2019 info@hdsentinel.com
Start with -r [reportfile] to save data to report, -h for help

Examining hard disk configuration ...

HDD Device 0: /dev/sda
HDD Model ID : TOSHIBA DT01ACA050
HDD Serial No: 83CLUSGGS
HDD Revision : MS1OA750
HDD Size : 476940 MB
Interface : S-ATA Gen3, 6 Gbps
Temperature : 29 °C
Highest Temp.: 51 °C
Health : 100 %
Performance : 100 %
Power on time: 2699 days, 1 hours
Est. lifetime: more than 100 days
The hard disk status is PERFECT. Problematic or weak sectors were not found and there are no spin up or data transfer errors.
No actions needed.
[/code]

Note : vu les variations de température je peux comprendre que certains rendent l'âme sans prévenir.

Cordialement, janus57


variations de température


12° et 51° chez moi

Je me demande à combien étaient les deux disques qui ont cuit chez @Piboulo ..