Serveurs dédiés - Ks ne redémarre pas
... / Ks ne redémarre pas
BMPCreated with Sketch.BMPZIPCreated with Sketch.ZIPXLSCreated with Sketch.XLSTXTCreated with Sketch.TXTPPTCreated with Sketch.PPTPNGCreated with Sketch.PNGPDFCreated with Sketch.PDFJPGCreated with Sketch.JPGGIFCreated with Sketch.GIFDOCCreated with Sketch.DOC Error Created with Sketch.
Frage

Ks ne redémarre pas

Von
AlainT3
Erstellungsdatum 2018-02-26 13:22:32 (edited on 2024-09-04 11:44:05) in Serveurs dédiés

Ayant besoin de rebooter mon ks suite à des manips erronées sur le firewall, celui-ci ne démarre plus bien que le manager ovh me dit que la machine répond au ping. Or, elle ne répond au ping ni sur eth0 ni sur eth0:0 (fail over).
Je la redémarre donc en mode rescue pour corriger le FW et vérifier si le fstab poserait problème, comme cela m'était arrivé dans le passé avec LVM. Même en supprimant toutes les lignes LVM du fstab, en ne gardant que sda1 qui est ext4 classique, la machine ne veut pas redémarrer sur le disque. Pourtant, les partitions se montent bien manuellement en mode rescue, même les LVM.
Je ne vois pas où chercher vu que rien n'est logué dans le syslog.
Ça tourne sous jessie.


6 Antworten ( Latest reply on 2018-02-27 14:05:14 Von
AlainT3
)

Il faudrait voir quel logiciel se lance ou pas..
Et peut être mettre un script pour vider la configuration du firewall.. (toutes les ips sont peut être bloquées sauf le ping/monitoring Ovh)

Pour l'instant le FW n'est pas lancé au démarrage et ce n'est donc pas lui qui bloque.
Mais comme rien n'est logué, je ne sais pas où regarder quand j'accède à la machine en mode rescue.

que donne un traceroute vers le serveur lorsqu'il est en "fonctionnement" mais qu'il ne répond pas ?

Qu'est ce qui est sensé tourner sur le serveur ?
Apache ? SSH ?

Lorsque le serveur est en mode rescue, le traceroute répond en 12 sauts.
Lorsqu'il est configuré pour démarrer sur le disque dur, il n'affiche que des lignes vides après le 10ème saut.

Sur le serveur tournent différentes applis mais là je crois vraiment qu'elles ne tournent pas sinon le syslog consulté _via_ rescue afficherait quelque chose.
Sinon, oui, il y a ssh, apache (80,443), et d'autres choses qui d'ordinaire fonctionnaient bien.

Après l'accès rescue, **t'as bien mounté tes partition**s pour voir le syslogs de ton serveur ?
Sinon, tu te trouve avec le syslog de rescue, complètement inutile.

edit : idem pour éditer le /etc/fstab

Bien sûr, depuis rescue j'ai fait un mount /dev/sda1 sur /mnt et de là suis allé modifier le fstab.

Je me demande ce matin si je ne devrais pas réinstaller grub car tout indique que ça ne boote pas, bien que la partition bootable soit bien sda1 et que le disque est bien accessible en rescue, toutes les partitions, y compris lvm étant "montables".

Mais je ne sais pas comment faire depuis rescue.

Je me suis décidé à lancer depuis rescue :
`grub-install --root-directory=/mnt /dev/sda`
mais cela n'a rien changé, le syslog du serveur n'a pas bougé depuis 24h, il n'a donc pas démarré.
Le fstab est basique :
`/dev/sda1 / ext4 errors=remount-ro,relatime 0 1
/dev/sda3 none swap defaults 0 0
proc /proc proc defaults 0 0
sysfs /sys sysfs defaults 0 0
tmpfs /dev/shm tmpfs defaults 0 0
devpts /dev/pts devpts defaults 0 0`

pas de sda2 pour l'instant car c'est pour lvm

Et quand le serveur ne démarre pas, que dis le message du technicien ?
Même un force fsck au boot ne résoudre rien ?

Un smartctl des disques ?

Je n'ai pas encore fait appel à un technicien.
Les tests du disque depuis rescue sont ok.
Ce qui me trouble c'est qu'il n'y a aucune image linux dans /boot ni d'ailleurs dans aucun autre répertoire. Pas d'initrd.img ni de vmlinuz. N'ayant pas eu la curiosité d'aller y voir auparavant et n'ayant évidemment pas viré ces fichiers, je me demande bien pourquoi on est là sur cette machine qui tourne depuis maintenant 5 ans.


Je n'ai pas encore fait appel à un technicien.


Il intervient tout seul quand le serveur est down pour le mettre en rescue.. (sauf si vous intervenez avant)

Il faut faire un smartctl c'est mieux que le test graphique.
Idem pour le fsck..

smartctl et fsck ne renvoient pas d'erreur.

Je doute qu'un technicien se penche sur le problème de lui-même car après un redémarrage, je reçois un message comme quoi le serveur se ping (ce qui n'est pas le cas depuis l'extérieur).

Bonjour,

Du coup si il ping c'est qu'il boot et donc il doit avoir des logs.

Peut être à vérifier dans le manager qu'il boot sur le HDD et non un netboot, car j'ai un doute sur le fait que le netboot laisse une trace (je ne l'utilise pas).

Cordialement, janus57

Non, il ne ping pas en réalité ; je ne sais pas pourquoi OVH annonce le contraire.
Il est bien configuré pour booter sur le disque dur mais il ne le fait pas ; il n'y a aucun log dans /var/log depuis qu'il a planté hier.

Est-ce qu'on est bien d'accord qu'il devrait y avoir quelque part un initrc.img et un vmlinuz ? J'ignore pourquoi je n'en vois pas. Peut être suite à un apt autoremove qui s'est mal passé ?


Peut être suite à un apt autoremove qui s'est mal passe

Heu concrètement qu'avez vous fait avant qu'il ne plante ? Car les actions ne sont pas les mêmes si c'est hardware ou software..

Vous regardez bien le /boot sur le disque dur et pas le rescue ?

La machine s'est plantée suite à des manips hasardeuses sur le firewall.
Je les ai corrigées (_via_ rescue) mais ça n'a plus booté sur le disque dur.

A présent, j'ai réussi à redémarrer le serveur en mode netboot (sur un noyau à jour 4.14.15) et tout fonctionne comme avant. j'hésite à le remettre dans l'état antérieur (3.14.32) avec un apt-get install linux-image tel qu'il était installé avec les mises à jour de Jessie.

En tout cas, merci à vous tous pour votre temps passé à m'aider.