Proxmox 6 sans réseau
... / Proxmox 6 sans réseau
BMPCreated with Sketch.BMPZIPCreated with Sketch.ZIPXLSCreated with Sketch.XLSTXTCreated with Sketch.TXTPPTCreated with Sketch.PPTPNGCreated with Sketch.PNGPDFCreated with Sketch.PDFJPGCreated with Sketch.JPGGIFCreated with Sketch.GIFDOCCreated with Sketch.DOC Error Created with Sketch.
Question

Proxmox 6 sans réseau

by
FlorianB51
Created on 2024-03-19 20:05:07 (edited on 2024-09-04 13:39:26) in Serveurs dédiés

J'ai un serveur dédié chez OVH.

Depuis maintenant 11h30 (durée de la panne), il s'est planté soudainement.
Il est sous proxmox 6 et installé et configuré via la configuration de base d'OVH depuis juin 2022.

Je n'ai pu la main dessus et le support OVH me répète sans cesse de vérifier ma configuration car le serveur boot en rescue et est pingable mais pas sur le système.
Je répète encore une fois, la configuration n'a pas été touchée (que ce soit réseau ou autre d'ailleurs ....).
L'OS: Debian 10.

Que faire ? Des personnes s'y connaissent ?
Je suis un peu déboussolé par une panne de cette envergure et OVH qui ne résous pas le problème...


13 Replies ( Latest reply on 2024-03-20 09:01:48 by
popallo
)

Bonsoir.

Le mode rescue est une bonne idée dans la mesure où, si le serveur ne démarre plus, il est possible de monter le ou les disque-s de votre serveur afin d'analyser d'une part l'état (utilitaire fsck) et d'y lire les logs système.

Si pas d'erreur disque, l'analyse peut révéler autre chose et probablement indiquer la cause de la panne.

Quelques éléments de procédures se trouvent ici :
https://help.ovhcloud.com/csm/fr-dedicated-servers-ovhcloud-rescue?id=kb_article_view&sysparm_article=KB0043950

Etant difficile de diagnostiquer sans avoir la main, n'hésitez pas à contacter quelqu'un du forum en message privé pour échanger les informations d'accès si vous avez besoin d'aide.

Bon courage en tout cas, tant qu'un accès au serveur est possible il y a toujours espoir de pouvoir réparer ou restaurer les données.

Hello,

Si la conf n'a pas été modifié, les 2 causes les plus probables sont un changement de nom des interfaces réseaux ou un problème d'update du grub
Tu peux utiliser le mode rescue pour traiter le problème, mais je te conseils plutôt de passer par un kvm pour voir ce que le boot normal dit comme erreur.

Au moins tu seras rapidement quel est le problème
Si besoin envoi moi un message privé

Bon courage
Captainadmin

Bonsoir,
Je ne comprends pas qu'OVH n'ai toujours pas trouvé une solution étant donné que c'était eux qui avaient installé ton serveur et que tu n'as rien touché côté config depuis... C'est catastrophique ce genre de situation... Quand tu payes tu es censé avoir le service fonctionnel qui va avec.
Ca ne donne pas vraiment envie de prendre un serveur dédié ici.

@FlorianB51 ne dit pas que le serveur est info géré par OVH.

Bonjour à tous, selon moi c'était un problème de serveur DHCP, le serveur impacté ne récupérait plus d'IP. Quoi qu'il en soit cela semble résolu, sans certitude bien évidemment vu que je ne suis pas propriétaire dudit serveur.

@FlorianB51 un petit feedback svp ? :)

Bon courage à tous !


Que faire ?


A vous de répondre, svp.
Quand vous "perdez" votre serveur, que voyez-vous sur la console KVM ?

Non, OVH fournit un serveur, sur baremetal c'est au client de gérer son service.
Si le serveur fonctionne en rescue, c'est que la partie hardware est ok, par conséquent la partie software est à la charge du client...


sur baremetal c'est au client de gérer son service


Les anomalies relevées par @popallo à propos d'un bail DHCP qui expire et n'est pas renouvelé, ça fait tache.
Clairement dans ces cas il y a eu une erreur de design par OVH et que l'administrateur soigneux aura rapidement remplacé par une IP fixe dans sa configuration.

Rien ne dit que le problème de @FlorianB51 est un problème de DHCP, de GRUB ou autre (voire même un disque full ou avec des bad blocks)

Comme tu le dis, ceux qui ont eu ces problèmes, sont passés en ip fixe, problème résolu.
Même si oui, le problème du DHCP reste récurrent (quoi que je ne l'ai pas eu depuis lgtps maintenant).

Bonjour à tous !

Petit feedback maintenant que le serveur est revenu depuis 20 minutes.
Le serveur est bien de nouveau ON. La piste du DHCP était sérieuse.
Aucune intervention de notre part sur le serveur en question. OVH fait les sourds actuellement (et les muets :-) ).
@Sich, concernant ton message, le client est en charge de la partie software en effet, sauf quand celle-ci n'a pas bougée et que les logs montrent un problème d'un équipement externe au serveur (en occurrence ici, le serveur DHCP qui est censé attribuer l'ipv4 publique du serveur).

@Fritz2cat, les disques ont été vérifiés et aucun problème sur ceux-ci. La console IPMI le confirmait d'ailleurs, le serveur arrivait a démarrer sans aucun problème et on pouvait s'y connecter en root. Le problème venait de l'accès extérieur (possible en rescue puisque la configuration en rescue au niveau réseau ne fait pas appel à un DHCP mais configuration minimale en static dans le network).

Bonjour,

Pour moi les installations proxmox sont en IP fixe du moins celle fait il y a genre 2ans, ce qui doit être le cas vu que c'est un PVE6.

Cordialement, janus57

```bash
Mar 19 10:09:42 ns3173271 dhclient[824]: DHCPDISCOVER on vmbr0 to 255.255.255.255 port 67 interval 7
Mar 19 10:09:42 ns3173271 ifup[759]: DHCPDISCOVER on vmbr0 to 255.255.255.255 port 67 interval 7
Mar 19 10:09:49 ns3173271 dhclient[824]: DHCPDISCOVER on vmbr0 to 255.255.255.255 port 67 interval 7
Mar 19 10:09:49 ns3173271 ifup[759]: DHCPDISCOVER on vmbr0 to 255.255.255.255 port 67 interval 7
Mar 19 10:09:56 ns3173271 dhclient[824]: DHCPDISCOVER on vmbr0 to 255.255.255.255 port 67 interval 11
Mar 19 10:09:56 ns3173271 ifup[759]: DHCPDISCOVER on vmbr0 to 255.255.255.255 port 67 interval 11
Mar 19 10:10:07 ns3173271 dhclient[824]: DHCPDISCOVER on vmbr0 to 255.255.255.255 port 67 interval 13
Mar 19 10:10:07 ns3173271 ifup[759]: DHCPDISCOVER on vmbr0 to 255.255.255.255 port 67 interval 13
Mar 19 10:10:20 ns3173271 dhclient[824]: DHCPDISCOVER on vmbr0 to 255.255.255.255 port 67 interval 10
Mar 19 10:10:20 ns3173271 ifup[759]: DHCPDISCOVER on vmbr0 to 255.255.255.255 port 67 interval 10
Mar 19 10:10:30 ns3173271 dhclient[824]: DHCPDISCOVER on vmbr0 to 255.255.255.255 port 67 interval 8
Mar 19 10:10:30 ns3173271 ifup[759]: DHCPDISCOVER on vmbr0 to 255.255.255.255 port 67 interval 8
Mar 19 10:10:38 ns3173271 dhclient[824]: DHCPDISCOVER on vmbr0 to 255.255.255.255 port 67 interval 5
Mar 19 10:10:38 ns3173271 ifup[759]: DHCPDISCOVER on vmbr0 to 255.255.255.255 port 67 interval 5
Mar 19 10:10:43 ns3173271 dhclient[824]: No DHCPOFFERS received.
Mar 19 10:10:43 ns3173271 ifup[759]: No DHCPOFFERS received.
```

Il y avait juste ça dans les logs.

Le problème de l'ip fixe étant que si l'ip de la passerelle change, on est marron (déjà vécu, pas forcément chez OVH mais c'est à prendre en considération).

Et pas mal d'incident / maintenance sur la partie network, à prendre en considération :)

https://bare-metal-servers.1ovhcloud.com/ovhcloud.com/