Problème GRUB après update sur CentOS 6.8

Bonjour,

Suite à une mise à jour (détails de la màj en bas) mon serveur dédié sous CentOS 6.8 ne boot plus, je n'ai absolument rien fait d'autre que la màj et un reboot.

Mar 27 12:20:08 backup1 yum[21073]: Updated: openssl-1.0.1e-48.el6_8.4.x86_64
Mar 27 12:20:11 backup1 yum[21073]: Updated: mysql-libs-5.1.73-8.el6_8.x86_64
Mar 27 12:20:11 backup1 yum[21073]: Updated: libuuid-2.17.2-12.24.el6_8.3.x86_64
Mar 27 12:20:12 backup1 yum[21073]: Updated: libblkid-2.17.2-12.24.el6_8.3.x86_64
Mar 27 12:20:15 backup1 yum[21073]: Updated: util-linux-ng-2.17.2-12.24.el6_8.3.x86_64
Mar 27 12:20:20 backup1 yum[21073]: Updated: initscripts-9.03.53-1.el6.centos.2.x86_64
Mar 27 12:20:22 backup1 yum[21073]: Updated: mysql-5.1.73-8.el6_8.x86_64
Mar 27 12:20:30 backup1 yum[21073]: Updated: kernel-firmware-2.6.32-642.15.1.el6.noarch
Mar 27 12:20:35 backup1 yum[21073]: Updated: selinux-policy-3.7.19-292.el6_8.3.noarch
Mar 27 12:21:37 backup1 yum[21073]: Updated: selinux-policy-targeted-3.7.19-292.el6_8.3.noarch
Mar 27 12:21:51 backup1 yum[21073]: Installed: kernel-2.6.32-642.15.1.el6.x86_64
Mar 27 12:21:54 backup1 yum[21073]: Updated: mysql-server-5.1.73-8.el6_8.x86_64
Mar 27 12:21:54 backup1 yum[21073]: Updated: ntpdate-4.2.6p5-10.el6.centos.2.x86_64
Mar 27 12:21:55 backup1 yum[21073]: Updated: libtiff-3.9.4-21.el6_8.x86_64
Mar 27 12:21:57 backup1 yum[21073]: Updated: kernel-headers-2.6.32-642.15.1.el6.x86_64
Mar 27 12:21:59 backup1 yum[21073]: Updated: tzdata-2017a-1.el6.noarch

Si je fais un `configfile /boot/grub/grub.conf` depuis la ligne de commande grub j'ai l'erreur suivante:
`Error 24: Attempt to access block outside partition`

J'ai vérifié ma partition de boot avec fsck mais rien d'anormal. Voici mon grub.conf:

default=0
timeout=5

title linux centos6_64
kernel /boot/vmlinuz-2.6.32-642.15.1.el6.x86_64 ro root=/dev/md2
initrd /boot/initramfs-2.6.32-642.15.1.el6.x86_64.img
root (hd0,1)

Je suis un peu perdu, si quelqu'un a des pistes.
Merci

En rescue si tu monte les partitions, que tu fais un chroot sur la partition qui contient ton os puis
grub-install /dev/sda
Ça ne marche pas ?

Merci Buddy,
mais ça donne une erreur:

[root@rescue /]# grub-install /dev/sda
df: Warning: cannot read table of mounted file systems: No such file or directory
Could not find device for

Si tu te mets en netboot, est-ce que ça démarre ?

Je n'ai pas vérifié par moi même mais d'après les techos OVH le serveur ne boot qu'en rescue.

Donc, ça pourrait ne pas être que grub qui ait cassé en cours de route. Il va d'abord falloir investiguer dans les logs. Lors de la mise à jour, tu n'as pas eu de message particulier ?

Non, j'ai mis le log de l'update dans mon premier message.
J'ai déjà fais pas mal de recherche du côté des disques, et je ne rien vu de spécial, même les techos m'ont confirmé que le hardware est OK.

Donc, en rescue, il va falloir gratter dans toutes les logs pour trouver le message qui va bien…
Quel est le message remonté par les équipes techniques, notamment ce qu'il voit sur la console ?

Je me suis connecté en KVM avec IPMI, il n'y a pas de message d'erreur. Simplement le serveur boot sur la command line de grub et c'est tout. Du coup si je me trompe pas à cette étape il n'y a pas encore de logging.

Hello,

A priori tu as quand meme cassé ton grub.
Revient à l'étape du mode rescue et fait correctement le chroot
1- monte ton filesystems dans un répertoire donnée /mnt/root par exemple
2- monte bind les répertoires systemes dans le répertoire précédent, il y en a 3 importants: /dev /proc /sys
3- chroot le /mnt/root
4- réinstalle ton grub et si c'est pas lui le problème, tu as tous les outils pour essayer de trouver l'orgine.

Bon courage
https://www.captainadmin.com

Bonjour Jean,

Oui effectivement j'avais pas bind les répertoires systèmes lors de mon test en chroot. Merci.

Malheureusement, un grub-install ne change rien. Je sens que j'en suis quitte pour une réinstall complète. Je ne sais même pas comment on fait avec un serveur OVH. :smile:

Dans le manager tu as une option pour choisir/réinstaller le OS.

Sinon pense à vérifier aussi tes disques dur avec smartctl.

Merci Buddy, je viens de voir où était le bouton.
On a déjà utiliser smartctl sur les disques avec le support technique et ils ont rien noté d'anormal.

Bonjour,

Le netboot devrait fonctionner. S'il ne fonctionne pas, c'est qu'il y a autre chose qui coince.
Grub n'intervient pas dans le netboot. Donc, ton OS a un pépin ailleurs qu'il faut investiguer.
en IPMI ou en Rescue, mais il va falloir creuser ça (sinon, tu vas être amené à te retrouver dans la même situation après la réinstallation)

Bonjour,

Oui effectivement le netboot fonctionne. J'ai pu réinstaller le kernel et le serveur à bien reboot.
Seulement SELinux à du faire un relabelling et maitenant j'ai un No BSD sub-partition found, partition type 0x0 quand je démarre du disque. Sinon le netboot fonctionne toujours. Est-ce une option sérieuse de rester en netboot?

Il y a un truc que je comprends pas, j'ai essayé de réinstaller grub mais j'ai eu cette erreur:

# grub-install /dev/sda
Could not find device for /dev/root
Could not find device for /dev/root
Could not find device for /dev/root
/dev/root: Not found or not a block device.

En faisant mount je me suis rendu compte que j'avais ce /dev/root monté en /

# mount
rootfs on / type rootfs (rw)
/dev/root on / type ext3 (rw,relatime,errors=remount-ro,user_xattr,acl,barrier=1,data=writeback)
devtmpfs on /dev type devtmpfs (rw,relatime,size=8205384k,nr_inodes=2051346,mode=755)
none on /proc type proc (rw,relatime)
none on /sys type sysfs (rw,nosuid,nodev,noexec,relatime)
devpts on /dev/pts type devpts (rw,relatime,mode=600,ptmxmode=000)
tmpfs on /dev/shm type tmpfs (rw,relatime)
/dev/md3 on /var/backup type ext4 (rw,relatime,stripe=256,data=ordered)
none on /proc/sys/fs/binfmt_misc type binfmt_misc (rw,relatime)
/dev/root on /var/named/chroot/etc/named type ext3 (rw,relatime,errors=remount-ro,user_xattr,acl,barrier=1,data=writeback)
/dev/root on /var/named/chroot/var/named type ext3 (rw,relatime,errors=remount-ro,user_xattr,acl,barrier=1,data=writeback)
/dev/root on /var/named/chroot/etc/named.conf type ext3 (rw,relatime,errors=remount-ro,user_xattr,acl,barrier=1,data=writeback)
/dev/root on /var/named/chroot/etc/named.rfc1912.zones type ext3 (rw,relatime,errors=remount-ro,user_xattr,acl,barrier=1,data=writeback)
/dev/root on /var/named/chroot/etc/rndc.key type ext3 (rw,relatime,errors=remount-ro,user_xattr,acl,barrier=1,data=writeback)
/dev/root on /var/named/chroot/usr/lib64/bind type ext3 (rw,relatime,errors=remount-ro,user_xattr,acl,barrier=1,data=writeback)
/dev/root on /var/named/chroot/etc/named.iscdlv.key type ext3 (rw,relatime,errors=remount-ro,user_xattr,acl,barrier=1,data=writeback)
/dev/root on /var/named/chroot/etc/named.root.key type ext3 (rw,relatime,errors=remount-ro,user_xattr,acl,barrier=1,data=writeback)
sunrpc on /var/lib/nfs/rpc_pipefs type rpc_pipefs (rw,relatime)
nfsd on /proc/fs/nfsd type nfsd (rw,relatime)

Seulement je n'ai ne pas fait un chroot et mon fstab ne contient pas ces entrées.

Que renvoie un fdisk -l ?
Et un df -h ?

Fdisk donne un retour normal excepté ce warning pour les 3 disques:

`WARNING: GPT (GUID Partition Table) detected on '/dev/sda'! The util fdisk doesn't support GPT. Use GNU Parted.`
Ce qui est étonnant, car ça me le faisait pas avant et je penses pas avoir fait ce changement.

Df donne:

# df -h
Filesystem Size Used Avail Use% Mounted on
rootfs 3.7T 1.4T 2.2T 39% /
/dev/root 3.7T 1.4T 2.2T 39% /
devtmpfs 7.9G 312K 7.9G 1% /dev
tmpfs 7.9G 0 7.9G 0% /dev/shm
/dev/md3 7.2T 6.6T 289G 96% /var/backup
/dev/root 3.7T 1.4T 2.2T 39% /var/named/chroot/etc/named
/dev/root 3.7T 1.4T 2.2T 39% /var/named/chroot/var/named
/dev/root 3.7T 1.4T 2.2T 39% /var/named/chroot/etc/named.conf
/dev/root 3.7T 1.4T 2.2T 39% /var/named/chroot/etc/named.rfc1912.zones
/dev/root 3.7T 1.4T 2.2T 39% /var/named/chroot/etc/rndc.key
/dev/root 3.7T 1.4T 2.2T 39% /var/named/chroot/usr/lib64/bind
/dev/root 3.7T 1.4T 2.2T 39% /var/named/chroot/etc/named.iscdlv.key
/dev/root 3.7T 1.4T 2.2T 39% /var/named/chroot/etc/named.root.key

Parted me donne:

(parted) print list
Model: ATA HGST HUS724040AL (scsi)
Disk /dev/sda: 4001GB
Sector size (logical/physical): 512B/512B
Partition Table: gpt

Number Start End Size File system Name Flags
1 20.5kB 1049kB 1029kB primary bios_grub
2 2097kB 4000GB 4000GB ext3 primary raid
3 4000GB 4001GB 536MB linux-swap(v1) primary


Model: ATA HGST HUS724040AL (scsi)
Disk /dev/sdb: 4001GB
Sector size (logical/physical): 512B/512B
Partition Table: gpt

Number Start End Size File system Name Flags
1 20.5kB 1049kB 1029kB primary bios_grub
2 2097kB 4000GB 4000GB ext3 primary raid
3 4000GB 4001GB 536MB linux-swap(v1) primary


Model: ATA HGST HUS724040AL (scsi)
Disk /dev/sdc: 4001GB
Sector size (logical/physical): 512B/512B
Partition Table: gpt

Number Start End Size File system Name Flags
1 20.5kB 1049kB 1029kB primary bios_grub
2 2097kB 4000GB 4000GB ext3 primary raid
3 4000GB 4001GB 536MB linux-swap(v1) primary


Error: /dev/md0: unrecognised disk label
Warning: Error fsyncing/closing /dev/md0: Input/output error
Retry/Ignore? I

Model: Unknown (unknown)
Disk /dev/md2: 4000GB
Sector size (logical/physical): 512B/512B
Partition Table: loop

Number Start End Size File system Flags
1 0.00B 4000GB 4000GB ext3


Model: Unknown (unknown)
Disk /dev/md3: 8000GB
Sector size (logical/physical): 512B/512B
Partition Table: loop

Number Start End Size File system Flags
1 0.00B 8000GB 8000GB ext4


Error: /dev/nbd0: unrecognised disk label

Error: /dev/nbd1: unrecognised disk label

Error: /dev/nbd2: unrecognised disk label

Error: /dev/nbd3: unrecognised disk label

Error: /dev/nbd4: unrecognised disk label

Error: /dev/nbd5: unrecognised disk label

Error: /dev/nbd6: unrecognised disk label

Error: /dev/nbd7: unrecognised disk label

Error: /dev/nbd8: unrecognised disk label

Error: /dev/nbd9: unrecognised disk label

Error: /dev/nbd10: unrecognised disk label

Error: /dev/nbd11: unrecognised disk label

Error: /dev/nbd12: unrecognised disk label

Error: /dev/nbd13: unrecognised disk label

Error: /dev/nbd14: unrecognised disk label

Error: /dev/nbd15: unrecognised disk label