Bonjour à toutes et à tous,
J'utilise actuellement un serveur Game en virtualisation sous proxmox :
Il y a 5 VM sous debian 10 et 8, certaines VM utilisent plusieur volumes de stockages c.a.d plusieurs disques virtuel au format qcow2.
(j'avais choisi un serveur game car il proposait un cpu AMD très performant et la différence avec un cpu intel était très sensible)
Je rencontre la problématique suivante:
Plusieur clients me font remonter des problèmes de disponibilitées de leur sites internets et autres services web sur le réseau mobile d'Orange.
Je soupçonne que cela est due à la qualité de la bande passante publique que vous mettez à ma disposition.
La solution que j'envisage :
migrer l'ensemble de mon infrastructure sur le Public Cloud
1- Est-ce que vous pensez que c'est une bonne idée, et que cela pourra résoudre mon problème sans en créer de nouveaux?
2- si oui, pouvez-vous m'indiquer un tuto pour migrer mes VM vers le Public Cloud?
3- si par la suite, cette solution ne me convient plus, est-il facile de faire la migration inverse? avez-vous un tuto pour ça?
Merci d'avance pour vos réponses
Plusieur clients me font remonter des problèmes de disponibilitées de leur sites internets et autres services web sur le réseau mobile d'Orange.
Ce ne pourrait pas être un problème d'IPv6 ?
Quand vous dites: disponibilité, c'est lent ou c'est cassé ?
Je n'utilise pas d'adresse IP v6
problèmes de disponibilitées: ça ne charge pas du tout, c'est cassé. Mais cette indisponibilité n'est pas permanante, 9 fois sur 10 ça fonctionne.
Bonjour,
Je dirais que votre problème n'a rien à voir avec la bande passante si vous ne saturé pas ce qui vous est permis.
Et si problème de bande passante ce serait plus des lenteurs qu'une "coupure".
Est-ce que vous pouvez donner un exemple concrèt de site/service ?
Vous avez pas de firewall qui pourrait provoquer ce problème ?
Cela touche certaines VMs ou alors TOUTE les VMs ?
Cordialement, janus57
ça ne charge pas du tout, c'est cassé
Le message d'erreur serait utile.
Soit c'est votre serveur qui lance le message d'erreur et c'est à vous de savoir pourquoi, soit c'est du côté de l'utilisateur et c'est souvent utile d'avoir aussi le message dans ce cas.
Merci pour vos réponses,
- il n'y a qu'une VM qui expose des services sur le web c'est donc la seule qui est touchée.
- un exemple de site : https://www.1arbres.comarbres.com ( mais tous les sites et services sont touchés )
- pour ce qui est des firewall sur les ports 80 et 443 il y en un filtrage pour les bots mailveillants, un filtrage anti DDOS du coté d'OVH, plus quelques filtrages basés sur l'IP sur certaines adresses d'administration.
- je viens de faire un test sur un portable sur Orange, et je suis tomber sur le problème, c'était plus une lenteur, au bout de 2 minutes la page c'est chargée d'un coup.
une fois la première page chargée, toutes les autres pages fonctionne normalement.
- Pour l'instant Je n'ai pas de message d'erreur, car ce sont les clients de mes clients qui font remonter le problème, ils ne donnent aucun détails.
- je n'ai rien trouvé dans les logs.
un exemple de site : https://wwwXles-cabanes-dans-les-arbresXcom
Immédiat chez moi en Belgique IPv4 ;
sur un dédié chez OVH, wget du index.html en 0,005 secondes :)
Il n'y a pas d'adresse IPv6 (le serveur est accessible juste avec une IP failover IPv4) mais quid si le client est uniquement en IPv6 et doit passer par un tunnel ?
Est-ce que la pile IPv6 est activée au niveau de la VM ?
(je ne suis pas en situation de pouvoir tester)
> Est-ce que la pile IPv6 est activée au niveau de la VM ?
j'avoue que je ne me suis pas préoccupé de ça…
Comment vérifier? Comment la mettre en place?
Merci d'avance
j'avoue que je ne me suis pas préoccupé de ça...
Je ne dis pas que c'est la cause. Mais le comportement qui diffère selon l'origine de vos visiteurs impose de chercher du côté du routage ou des protocoles réseau ??
Comment vérifier?
Vous pouvez poser la question dans internet, et il y a plein de réponses. Soyez curieux. Exemple:
https://www.itzgeek.com/how-tos/linux/debian/how-to-disable-ipv6-on-debian-9-ubuntu-16-04.html
https://alexbacher.fr/unixlinux/desactiver-lipv6-debian_ubuntu/
du coups si je comprends bien il faudrait que cette pile soit désactivée. vous confirmez?
sur la VM la pile est activée:
(le ping sur les adresse IPv6 ci-dessous n'abouti pas)
ens18: flags=4163 mtu 1500
inet 54...98 netmask 255.255.255.255 broadcast 54...98
inet6 fe80::ff:fe10:6ff8 prefixlen 64 scopeid 0x20
ether 02:00:00:10:6f:f8 txqueuelen 1000 (Ethernet)
RX packets 79918747 bytes 10306217696 (9.5 GiB)
RX errors 0 dropped 0 overruns 0 frame 0
TX packets 67818320 bytes 290209508741 (270.2 GiB)
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0
ens19: flags=4163 mtu 1500
inet 54...245 netmask 255.255.255.255 broadcast 54...245
inet6 fe80::ff:fe6d:bcad prefixlen 64 scopeid 0x20
ether 02:00:00:6d:bc:ad txqueuelen 1000 (Ethernet)
RX packets 97129953 bytes 9138577717 (8.5 GiB)
RX errors 0 dropped 0 overruns 0 frame 0
TX packets 533 bytes 42374 (41.3 KiB)
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0
ens20: flags=4163 mtu 1500
inet 149...2 netmask 255.255.255.255 broadcast 149...2
inet6 fe80::ff:fe60:9066 prefixlen 64 scopeid 0x20
ether 02:00:00:60:90:66 txqueuelen 1000 (Ethernet)
RX packets 77544924 bytes 7394207190 (6.8 GiB)
RX errors 0 dropped 0 overruns 0 frame 0
TX packets 541 bytes 43030 (42.0 KiB)
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0
ens21: flags=4163 mtu 1500
inet 192.168.0.104 netmask 255.255.255.0 broadcast 192.168.0.255
inet6 fe80::888f:2aff:fe89:88b9 prefixlen 64 scopeid 0x20
ether 8a:8f:2a:89:88:b9 txqueuelen 1000 (Ethernet)
RX packets 2484232 bytes 246814948 (235.3 MiB)
RX errors 0 dropped 0 overruns 0 frame 0
TX packets 4969529 bytes 66199390164 (61.6 GiB)
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0
lo: flags=73 mtu 65536
inet 127.0.0.1 netmask 255.0.0.0
inet6 ::1 prefixlen 128 scopeid 0x10
loop txqueuelen 1000 (Boucle locale)
RX packets 6895314 bytes 19398884493 (18.0 GiB)
RX errors 0 dropped 0 overruns 0 frame 0
TX packets 6895314 bytes 19398884493 (18.0 GiB)
TX errors 0 dropped 0 overruns 0 carrier 0 collisions 0
fe80::ff:fe60:9066
fe80 ce sont des adresses locales. Voir https://fr.wikipedia.org/wiki/Adresse_IPv6
Je n'ai pas grande expérience avec IPv6. Mais ça me semble normal que ça ne pinge pas.
Merci pour vos réponses en tous cas.
J'ai désactivé IPv6, je vais voir si ça améliore les choses…
Bonjour,
il n'y a qu'une VM qui expose des services sur le web c'est donc la seule qui est touchée.
vous avez un monitoring qui tourne pour vérifier qu'elle est pas en souffrance (problème de ressource ou DOS par exemple) ?
Cordialement, janus57
vous avez un monitoring qui tourne pour vérifier qu'elle est pas en souffrance (problème de ressource ou DOS par exemple) ?
Il y a le monitoring basique de ProxMox et il ne montre pas de surcharge:
utilisation cpu maximum : env 13%
trafic réseau max : env 30M
E/S max: env 50M
Memoire : 95% (majoritairement pour le cache)
Je pense que la piste de l'IPv6 est la bonne, j'aimerais configurer un enregistrement AAAA dans les zones DNS des domaines qui pointent vers ce serveur. Malheureusement OVH ne propose pas d'IPv6 failover. et comme il y a plus de 90 domaines, je ne veux pas utiliser un IPv6 affectée au serveur, car dans ce cas, à chaque migration ça va rendre le travail très pénible. De plus certains de mes clients gèrent eux-même leurs DNS.
je suis un peut coincé...
Idem pour moi au niveau IP V6. Tant que pas dispo en failover c'est inutilisable -> je désactive.
Bonjour,
Il y a le monitoring basique de ProxMox
Alors malheureusement c'est pas un monitoring, ça donne juste une vue sur l'état de santé des ressources.
Je sais pas vous avez quoi sur cette VMs mais je suppute un reverse proxy (si c'est la seule a exposer des services) et perso je mettrai un monitoring plus poussé dessus pour voir si j'atteins pas une limite software et idem sur les autres.
Car votre soucis pourrait être aussi une pool de worker plein à 100% et la demande est mise en attente (lenteur), soit vraiment saturé (échec direct).
Note : par contre ça c'est visible dans les logs en général (déjà eu le cas avec une instance nextcloud ou j'ai du tripler les Child php-fpm).
Cordialement, janus57
Le monitoring de Proxmox n'est pas hyper détaillé mais il détecte quand même les surcharges cpu, réseau et E/S disque assez efficacement. Et de toute façon pour bien monitorer une VM et l'hyperviseur il vaut mieux le faire depuis "l'extérieur".
C'est pour ça que la disponibilité de l'ensembles des services et des sites internet les plus importants sont surveillés depuis un serveur tier une fois par minute et je suis notifié en cas de problème ou de lenteur. Ce n'est pas un vrai monitoring car il est tout à fait possible que des problémes de courte durée ne soient pas détectés, mais cette surveillance n'a pas détecté de disfonctionnement depuis plusieurs mois, c'est à dire qu'il n'y a pas de surcharge grave au point de rendre les services indisponible.
Rien n'est infaillible, mais je ne pense vraiment pas que mon problème vienne de ça.
Bonjour,
Le monitoring de Proxmox n'est pas hyper détaillé mais il détecte quand même les surcharges cpu, réseau et E/S disque assez efficacement. Et de toute façon pour bien monitorer une VM et l'hyperviseur il vaut mieux le faire depuis "l'extérieur".
je pense qu'on a pas la même définition de monitoring du coup.
Pour moi monitoring == surveillance active directement sur le serveur via un agent (comme le fait zabbix ou d'autre solutions) et surtout une surveillance complète (pas juste cpu/ram/disk/network, mais aussi et surtout la partie applicative).
Rien n'est infaillible, mais je ne pense vraiment pas que mon problème vienne de ça.
avez-vous tout de même analysé vos logs ?
Cordialement, janus57
oui bien sur j'ai analysé les logs, et je n'ai rien trouvé en rapport avec ce problème.
jr vais regardé du coté de zabbix, merci pour le tuyau :).
Bonjour @HildegardC,
Avez-vous réussi à trouver une solution depuis votre dernier message ?
^FabL