Gestion RAID existant pour extension sur serveur dédié

Bonjour,
Nous avons actuellement un serveur dédié dont l'offre est HGR-HCI-3 et qui se compose d'un serveur avec :
- 2× Intel Xeon Gold 6248R - 24c/48t - 3 GHz/4 GHz
-768 GB ECC 2933 MHz
- 2×480 GB SSD SATA
- 12×3.84 TB SSD SAS en HARD Raid

Le serveur tourne pour l'instant en ESXI 6.7 et il est prévu à brève échéance de faire l'upgrade en 8.0 (les licences pour 8.0 sont déjà actives)

Faisant suite à un problème d'espace disque limité sur notre serveur et pour assurer une stabilité de notre infrastructure durant la migration de 6.7 à 8.0, nous avons commandé 12 disques de plus pour passer de 12×3.84 TB SSD SAS en HARD Raid à 24×3.84 TB SSD SAS en HARD Raid

Après qu'OVH ait fait le nécessaire pour ajouter physiquement les disques nous avons voulu de préférence étendre le RAID 10 existant et au pire ajouter un nouveau RAID 10 à coté de l'existant.

Le problème est qu'en suivant la documentation de gestion du RAID KB0043924 je n'arrive pas à gérer le RAID car la commande MegaCli n'est pas reconnue. Je rate peut être quelque chose de basique et c'est pour cela que j'aimerais votre avis.
Il est bon à savoir que la commande "lspci | grep -i lsi | grep -i megaraid" renvoie bien un contrôleur RAID tel qu'indiqué ci-dessous :
0000:af:00.0 RAID bus controller: Avago (LSI) MegaRAID SAS Intruder Controller [vmhba2]

Ce que je fais :

1. Connexion au serveur au serveur ESXI 6.7 en SSH en tant que root
2. Je tape directement la commande "MegaCli -LDInfo -Lall -aALL" et obtiens en retour "-sh: MegaCli: not found"

Est-ce qu'on doit se rendre dans un répertoire spécifique avant d'exécuter la commande ? Ca a l'air bête comme question mais là je suis un peu coincé :sweat_smile:

J'ai essayé de rajouter MegaCli dans le ESXI mais une fois ajouté cela ne fonctionne pas mieux :

1. Install de MegaCli dans le répertoire /opt/lsi/MegaCLI
2. exécution de "MegaCli -LDInfo -Lall -aALL" et réception de "-sh: MegaCli: not found" en retour
3. exécution de "./MegaCli -LDInfo -Lall -aALL" et réception de "Exit Code: 0x01" en retour
4. exécution de "./MegaCli -CfgDsply -a0" et réception de ERROR:Could not detect controller.
Failed to get ControllerId List. Failed to get CpController object. Exit Code: 0x01

Il est à remarquer que j'ai déjà redémarré le host et que j'ai aussi déjà essayé de réinstaller MegaCli selon les instructions ci-dessous après démarrage en mode Rescue :
wget https://docs.broadcom.com/docs-and-downloads/raid-controllers/raid-controllers-common-files/8-07-14_MegaCLI.zip
apt install unzip -y
unzip 8-07-14_MegaCLI.zip
apt install alien -y
cd Linux
sudo alien MegaCli-8.07.14-1.noarch.rpm
apt install libncurses5 -y
dpkg -i megacli_8.07.14-2_all.deb
/opt/MegaRAID/MegaCli/MegaCli64 -h

Est-ce que je rate quelque chose? Comment puis-je avancer pour configurer ce RAID, prérequis pour notre upgrade et la résolution d'autres modifications toutes aussi critiques?

Merci d'avance pour votre aide.

Bonjour @FrancoisG29,
En effet, notre documentation n'est plus à jour. Nous devons la réécrire pour conseiller l'utilisation de StorCLI plutôt que MegaCLI qui est déprécié. Par ailleurs, pour l'instant, aucune des deux commandes n'est présente de base sur le rescue, c'est aussi quelque chose que nous devons corriger.
Je vais faire quelques tests et je reviens vers vous avec des instructions pour installer StorCLI et lancer quelques commandes avec.

Voici les commandes que j'ai suivies depuis `rescue-customer`, je n'ai mis la sortie que pour la dernière.
```
root@rescue-customer-eu (ns123.ip-123) ~ # apt install unzip rpm2cpio
root@rescue-customer-eu (ns123.ip-123) ~ # wget https://docs.broadcom.com/docs-and-downloads/007.2705.0000.0000_storcli_rel.zip
root@rescue-customer-eu (ns123.ip-123) ~ # unzip 007.2705.0000.0000_storcli_rel.zip
root@rescue-customer-eu (ns123.ip-123) ~ # unzip storcli_rel/Unified_storcli_all_os.zip
root@rescue-customer-eu (ns123.ip-123) ~ # rpm2cpio Unified_storcli_all_os/Linux/storcli-007.2705.0000.0000-1.noarch.rpm | cpio -idv
root@rescue-customer-eu (ns123.ip-123) ~ # ./opt/MegaRAID/storcli/storcli64 show
CLI Version = 007.2705.0000.0000 August 24, 2023
Operating system = Linux 6.1.51-mod-std
Status Code = 0
Status = Success
Description = None

Number of Controllers = 1
Host Name = rescue-customer-eu
Operating System = Linux 6.1.51-mod-std
StoreLib IT Version = 07.2703.0200.0000
StoreLib IR3 Version = 16.14-0

System Overview :
===============

-------------------------------------------------------------------------------------
Ctl Model Ports PDs DGs DNOpt VDs VNOpt BBU sPR DS EHS ASOs Hlth
-------------------------------------------------------------------------------------
0 AVAGOMegaRAIDSAS9361-24i 24 6 1 0 1 0 Opt On 1&2 Y 3 Opt
-------------------------------------------------------------------------------------

Ctl=Controller Index|DGs=Drive groups|VDs=Virtual drives|Fld=Failed
PDs=Physical drives|DNOpt=Array NotOptimal|VNOpt=VD NotOptimal|Opt=Optimal
Msng=Missing|Dgd=Degraded|NdAtn=Need Attention|Unkwn=Unknown
sPR=Scheduled Patrol Read|DS=DimmerSwitch|EHS=Emergency Spare Drive
Y=Yes|N=No|ASOs=Advanced Software Options|BBU=Battery backup unit/CV
Hlth=Health|Safe=Safe-mode boot|CertProv-Certificate Provision mode
Chrg=Charging | MsngCbl=Cable Failure
```

Je vous en remercie d'avance de tout coeur car cela nous coince depuis près d'un mois et on bascule petit à petit dans le domaine du critique :sweat_smile:

J'ai mis la procédure dans mon message précédent, je ne sais pas si vous l'avez vu. J'ai lancé les commandes en rescue mais ça doit être similaire depuis ESXi.

J'ai fait la même chose après avoir installé ESXi 7.0, ça sera sûrement similaire pour 6.7, à cela près qu'il faudra peut-être prendre un autre VIB :
```
[root@ns123:~] cd /tmp/
# On autorise temporairement le HTTPS
[root@ns123:/tmp] esxcli network firewall ruleset set -r httpClient -e true
[root@ns123:/tmp] wget --no-check-certificate https://docs.broadcom.com/docs-and-downloads/007.2705.0000.0000_storcli_rel.zip
[root@ns123:/tmp] esxcli network firewall ruleset set -r httpClient -e false
[root@ns123:/tmp] unzip 007.2705.0000.0000_storcli_rel.zip
[root@ns123:/tmp] unzip storcli_rel/Unified_storcli_all_os.zip
[root@ns123:/tmp] unzip /tmp/Unified_storcli_all_os/VMware/ESXi7/BCM-vmware-storcli64_007.2705.0000.0000-01_22442561-package.zip
# Attention à bien donner le chemin absolu du zip
[root@ns123:/tmp] esxcli software vib install -d /tmp/BCM-vmware-storcli64_007.2705.0000.0000-01_22442561.zip
Installation Result
Message: Operation finished successfully.
Reboot Required: false
VIBs Installed: BCM_bootbank_vmware-storcli64_007.2705.0000.0000-01
VIBs Removed:
VIBs Skipped:
[root@ns123:/tmp] esxcli software vib list | grep storcli
vmware-storcli64 007.2705.0000.0000-01 BCM PartnerSupported 2023-12-08
[root@ns123:/tmp] /opt/lsi/storcli64/storcli64 show
CLI Version = 007.2705.0000.0000 August 24, 2023
Operating system = VMkernel 7.0.3
Status Code = 0
Status = Success
Description = None

Number of Controllers = 1
Host Name = ns123
Operating System = VMkernel 7.0.3
StoreLib IT Version = 07.2703.0200.0000
StoreLib IR3 Version = 16.14-0

System Overview :
===============

-------------------------------------------------------------------------------------
Ctl Model Ports PDs DGs DNOpt VDs VNOpt BBU sPR DS EHS ASOs Hlth
-------------------------------------------------------------------------------------
0 AVAGOMegaRAIDSAS9361-24i 24 6 1 0 1 0 Opt On 1&2 Y 3 Opt
-------------------------------------------------------------------------------------

Ctl=Controller Index|DGs=Drive groups|VDs=Virtual drives|Fld=Failed
PDs=Physical drives|DNOpt=Array NotOptimal|VNOpt=VD NotOptimal|Opt=Optimal
Msng=Missing|Dgd=Degraded|NdAtn=Need Attention|Unkwn=Unknown
sPR=Scheduled Patrol Read|DS=DimmerSwitch|EHS=Emergency Spare Drive
Y=Yes|N=No|ASOs=Advanced Software Options|BBU=Battery backup unit/CV
Hlth=Health|Safe=Safe-mode boot|CertProv-Certificate Provision mode
Chrg=Charging | MsngCbl=Cable Failure
```

Merci pour la réponse,
J'y regarde dans les plus brefs délais et reviens avec un feedback.
Désolé pour le temps que j'ai pris à répondre, un client avait un problème majeur qu'il a fallu gérer
Laurent

Après avoir télécharger le zip de storcli j'ai remarqué qu'il y avait les répertoires pour l'ESXI 7 et le 8 mais pas le 6 ou 6.7.
J'ai donc regardé sur le site de Broadcom et il semblerait que StorCli ne soit supporté qu'à partir du 7.0 :


Ce qui est "un peu" embêtant car cela voudrait dire qu'on ne sait pas gérer le raid avec Storcli sous 6.7.
Je me trompe ?
La référence est ici : https://techdocs.broadcom.com/us/en/storage-and-ethernet-connectivity/enterprise-storage-solutions/storcli-12gbs-megaraid-tri-mode/1-0/v11673324/v13474326.html

Pour l'usage de MegaCli64 sous 6.7 j'ai essayé de le rajouter en mode rescue mais je dois être trop nul en Linux car je n'arrive pas à le rajouter dans /opt. J'ai fais la copie de mon problème au cas ou une idée de mon erreur apparaîtrait et serait résolvable facilement :
root@rescue-customer-eu (nsxxxxx.ip-xxx-xx-xx.eu) ~/Linux # sudo alien MegaCli-8.07.14-1.noarch.rpm
Warning: Skipping conversion of scripts in package MegaCli: postinst postrm
Warning: Use the --scripts parameter to include the scripts.
megacli_8.07.14-2_all.deb generated
root@rescue-customer-eu (nsxxxxx.ip-xxx-xx-xx.eu) ~/Linux # apt install libncurses5 -y
Reading package lists… Done
Building dependency tree
Reading state information… Done
The following additional packages will be installed:
libtinfo5
The following NEW packages will be installed:
libncurses5 libtinfo5
0 upgraded, 2 newly installed, 0 to remove and 37 not upgraded.
Need to get 417 kB of archives.
After this operation, 838 kB of additional disk space will be used.
Get:1 https://20231129-21h42m02s-public-debian-security.snap.mirrors.ovh.net/debian-security buster/updates/main amd64 libtinfo5 amd64 6.1+20181013-2+deb10u4 [321 kB]
Get:2 https://20231129-21h42m02s-public-debian-security.snap.mirrors.ovh.net/debian-security buster/updates/main amd64 libncurses5 amd64 6.1+20181013-2+deb10u4 [96.1 kB]
Fetched 417 kB in 0s (4,832 kB/s)
Selecting previously unselected package libtinfo5:amd64.
(Reading database … 24515 files and directories currently installed.)
Preparing to unpack …/libtinfo5_6.1+20181013-2+deb10u4_amd64.deb …
Unpacking libtinfo5:amd64 (6.1+20181013-2+deb10u4) …
Selecting previously unselected package libncurses5:amd64.
Preparing to unpack …/libncurses5_6.1+20181013-2+deb10u4_amd64.deb …
Unpacking libncurses5:amd64 (6.1+20181013-2+deb10u4) …
Setting up libtinfo5:amd64 (6.1+20181013-2+deb10u4) …
Setting up libncurses5:amd64 (6.1+20181013-2+deb10u4) …
Processing triggers for libc-bin (2.28-10+deb10u1) …

root@rescue-customer-eu (nsxxxxx.ip-xxx-xx-xx.eu) ~/Linux # dpkg -i megacli_8.07.14-2_all.deb
Selecting previously unselected package megacli.
(Reading database … 24532 files and directories currently installed.)
Preparing to unpack megacli_8.07.14-2_all.deb …
Unpacking megacli (8.07.14-2) …
Setting up megacli (8.07.14-2) …
Processing triggers for libc-bin (2.28-10+deb10u1) …

root@rescue-customer-eu (nsxxxxx.ip-xxx-xx-xx.eu) ~/Linux # /opt/MegaRAID/MegaCli/MegaCli64 -h
MegaCLI SAS RAID Management Tool Ver 8.07.14 Dec 16, 2013
mode d'emploi de MegaCli…
root@rescue-customer-eu (nsxxxxx.ip-xxx-xx-xx.eu) ~/Linux # cd opt
-bash: cd: opt: No such file or directory
root@rescue-customer-eu (nsxxxxx.ip-xxx-xx-xx.eu) ~/Linux # ls
MegaCli-8.07.14-1.noarch.rpm megacli_8.07.14-2_all.deb MegaSAS.log
root@rescue-customer-eu (nsxxxxx.ip-xxx-xx-xx.eu) ~/Linux # dpkg -i megacli_8.07.14-2_all.deb /opt/MegaRAID/MegaCli/MegaCli64 -h
dpkg: error: cannot access archive '-h': No such file or directory
root@rescue-customer-eu (nsxxxxx.ip-xxx-xx-xx.eu) ~/Linux # dpkg -i megacli_8.07.14-2_all.deb /opt/MegaRAID/MegaCli/MegaCli64
(Reading database … 24541 files and directories currently installed.)
Preparing to unpack megacli_8.07.14-2_all.deb …
Unpacking megacli (8.07.14-2) over (8.07.14-2) …
dpkg-deb: error: '/opt/MegaRAID/MegaCli/MegaCli64' is not a Debian format archive
dpkg: error processing archive /opt/MegaRAID/MegaCli/MegaCli64 (–install):
dpkg-deb --control subprocess returned error exit status 2
Setting up megacli (8.07.14-2) …
Processing triggers for libc-bin (2.28-10+deb10u1) …
Errors were encountered while processing:
/opt/MegaRAID/MegaCli/MegaCli64