Bonjour,
Un de mes serveurs est situé dans la baie S330A01 qui est passée en vert hier.
Mon interface m'indique que la baie est UP et que mon serveur est fonctionnel (en mode rescue) pourtant je ne parviens pas à m'y connecter ? Faut-il que je redémarre le serveur ou dois-je simplement attendre ?
Pour information, je n'ai pas reçu de mail d'OVH me prévenant du redémarrage en rescue du serveur.
Merci !
Vous avez tentez l'ipmi si ça fonctionne ? Pas sûr que ce soit opérationnel.
Sinon le ping répond ?
Perso j'ai déjà 2 dédiés qui sont remontés, mais directement en prod sans passer par le mode rescue.
Le ping (sur l'IP publique classique du serveur) ne répond pas.
Je viens de faire un "test ipmi" : tout est au vert, mais quand j'essaye d'y accéder via HTTP ou Applet, j'ai un message d'erreur qui m'indique qu'IPMI n'est pas disponible… Je viens de redémarrer IPMI, mais la tâche échoue.
Vos serveurs ont redémarré en prod direct ?! je pensais qu'ils passaient forcément par l'étape "rescue" après ce genre d'incident…
Le VMS indique maintenant que 6 serveurs sont down sur la baie en question (j'imagine que le mieux fait partie du lot ?) : DOWN pour quelle raison, je ne sais pas…
Je crois que l'ipmi n'est tjrs pas opérationnel, j'ai testé hier soir et ça ne fonctionnait pas non plus.
Il faut voir ce que dit le panel ovh concernant le serveur, éventuellement ouvrir un ticket par sécurité. Histoire d'éviter d'aggraver les choses en forçant un reboot si le soucis n'est qu'au niveau du réseau.
Perso pour les 2 serveurs dédiés qui sont déjà remonté je n'ai eu ni mail ni mode rescue.
Ce sont mes sondes de monitoring qui m'ont averties que les serveurs étaient UP.
La panel du serveur indique que le serveur fonctionne normalement… Je pense que le panel n'est pas très fiable en ce moment !
Je vais ouvrir un ticket par sécurité, mais j'imagine que les techs d'OVH ont d'autres priorités qu'éplucher les tickets ces jours-ci.
Je suis surpris que les serveurs remontent directement en prod : d'après le panel, je suis en rescue alors que je n'ai pas effectué ce changement, donc soit il a été passé en rescue par un tech lors de la remise en service, soit le panel est dans les choux…
Je prends l'exemple d'un de mes serveurs, j'ai ça en mode de boot : rescue64-pro (Customer rescue system (Linux))… Et pourtant il a bien booté normalement…
Peut être que le serveur a été booté normalement a la remise en ligne et que le mode de boot a été changé après seulement, mais le serveur étant déjà up ça ne servait plus à rien…
Du coup je les ai repassé en mode boot normal sur disque dur… Histoire de pas avoir de surprise au prochain reboot ![]()
Ticket ouvert, on verra si quelqu'un trouve le temps d'y répondre !
Etonnante votre situation, mais le principal est que vous ayez pu rétablir vos services !
J'avoue que je me satisferai bien du même résultat ![]()
j'avais le même soucis en B331B05 hier, passage au vert, serveur injoignable, IPMI failed malgrès des test IPMI ok. Et aujourd'hui les rack sont de nouveau éteind.
En revanche, mes machines en 327 sont bien reparti. 1 étaient directement booté sur le bon disque, les autres j'ai simplement changé le boot sur le disque principale. tout est nickel, aucune perte de data.
Je pense qu'il faut prendre son mal ne patience pour les autres.
Le serveur est finalement remonté hier en fin d'après midi ! En prod directement comme le disait Sich, alors que le panel indique bien "rescue".
J'ai pu m'y connecter et faire quelques tests, puis le serveur est de nouveau redevenu injoignable en SSH… Il répond au ping, pas à l'IPMI, le panel l'indique "en erreur" et toujours en "rescue", et j'ai un message d'erreur quand je tente de le redémarrer via le panel (le boot est sur "server_configuration_netboot_option_internal" quand j'essaye de modifier le boot sur le panel).
Dans le même temps, j'ai eu une notification de demande de support :
L'intervention sur XXXXXXXXXX est terminée.
Cette opération a été achevée le 2021-03-26 03:35:15 CET (UTC +01:00)
Voici les détails de cette opération :
Diagnostic hardware
Date 2021-03-26 00:48:51 CET (UTC +01:00), Diagnostic hardware:
Serveur en mode 'rescue'.
Codes d'accès envoyés.
Sauf que je n'ai reçu aucun mail / codes d'accès…
Si quelqu'un y comprend quelque-chose, je suis preneur !