Bonjour à tous,
ça fait deux jours que je fais face à de gros soucis de connexions... Les sites sur le Filer 762 du Datacenter eu-west-gra ne sont plus accessibles (sauf à de rares moments) et affichent tous une erreur 504...
J'ai introduit un ticket, mais sans réponse. Est-ce que d'autres font face aux mêmes soucis?
J'ai tenté de consulter la partie État du réseau et incidents
mais je ne constate pas de gros problèmes, donc je ne comprends pas...
Merci d'avance pour vos réponses.
Bonjour,
A partir de Lundi :
Faire un ticket Incident :
Manager OVH > https://www.ovh.com/manager/#/dedicated/useraccount/dashboard > Mes demandes d'assistance > Créer une demande / ticket
puis :
Appeler le SAV OVH au +33 9 72 10 10 07.
Plutôt entre 8h et 9h le matin, ou vers 15h il y a moins d'attente.
Où déjà maintenant sur Twitter @ovh_support_fr ou #OVHcloudsupport
Merci.
Comme je le disais dans mon premier message il y a déjà un ticket (introduit vendredi, puis réintroduit samedi avec une capture d'écran du graphique des temps de réponse...).
Toujours aucune réaction ou réponse. Je sais qu'on est le WE, mais que les différents sites soient indisponible plusieurs jours me semble vraiment pénalisant même simplement au niveau des moteurs de recherche...
Bonjour,
Quel Domaine ?
Il s'agissait par exemple de https://www.gaudry.be
Sans aucune intervention de ma part, les différents sites sont à nouveau disponibles, mais sans la moindre explication de la part du service technique. Je suppose qu'ils donneront quand même une info en clôturant le ticket...
Bonjour,
Ce filerz se porte bien et est loin d'être rempli.
Est-ce que vous pouvez donner le numéro de ticket svp ?
Une erreur 504 ça peut être lié à d'autres choses.
Victor
Merci pour votre réponse.
Le numéro de ticket est CS11300883 et fait référence au ticket CS11297937 introduit vendredi.
Si le filerz se porte bien et se portait bien de vendredi à dimanche, comment expliquer que les sites soient tous injoignables, avec l'erreur 504 ?
Exemple: https://www.loadcontrolcenter.com/ et https://www.gaudry.be ne partagent pas la même base de données, comment se fait-il que tous les deux aient été impactés par la même erreur 504???
Voici en pièce jointe les temps de réponse de l'hébergement de https://www.gaudry.be qui montrent manifestement les pics pendant cette période...
Oui il y a des pics de temps de réponse, mais ce n'est pas lié au stockage.
Côté infra je vois que php prend beaucoup de CPU.
Vous avez dû recevoir un email automatique à ce sujet d'ailleurs.
Donc peut-être tenter un boost pour voir si ça va mieux et si c'est le cas voir pour optimiser le code ou monter d'offre performance.
Le seul mail reçu d'OVH me dit ceci:
Merci d'optimiser vos requêtes, d'ajouter des index ou de séparer vos bases de données en plusieurs CloudDB.
Alors je dois avouer que je suis assez mécontent.
J'avais un ancien 60GP avec 1DB d'une taille max de 2Go et 3DB d'une taille max de 1000Go chacune.
On m'a fait la remarque qu'un des sites devenait trop conséquent et je suis passé en février vers l'offre Performance.
Résultat:
Je sais que dans la nouvelle offre j'ai aussi une DB Cloud de max 8Go, mais je perds la possibilité de travailler avec une DB de repli si j'ai plus de 1Go dessus puisqu'il ne sera donc plus possible de répliquer les données entre les deux DB.
J'ai tenté de mettre en place un système de bascule automatique entre les deux DB en cas de problème, mais quand il bascule automatiquement sur la DB de repli, j'ai soit le message qui indique trop de connexions (dans les logs je constate maximum 6 connexions ouvertes en même temps dans les gros pics, sinon généralement une connexion), soit carré ment aucun affichage et ce beau message:
504 Gateway Time-out
Est-ce que c'est le monitoring sur le OVH manager qui affiche des informations erronées, ou est-ce que je m'y prends mal? Comment diminuer la consommation en RAM? Est-ce que je dois redémarrer la Web Cloud Database?
Il y a un système de mise en cache qui évite de devoir faire appel à la DB lors de l'affichage des pages, mais une modification par exemple d'un personnage a non seulement un impact sur la fiche du personnage, mais aussi sur la série dont il provient, sur les lignes du temps dans lesquelles il intervient, sur les pages de géographie des lieux dont il est originaire ou auxquels il est lié... J'ai mis en place ce WE une suppression plus ciblée des pages en cache lors d'une modification, mais ce n'est pas encore assez que pour empêcher que le site soit indisponible lorsqu'il est trop sollicité.
J'avoue que je ne vois plus trop quoi faire...
Si je constate que malgré le passage vers une offre supérieure comme le Performance je ne sais toujours pas héberger le site, je me vois mal passer encore vers une offre plus chère alors qu'il s'agit d'un site qui n'est pas commercial et qui est juste le partage de passions...
je suis obligé de me répondre à moi-même car quand je clique sur Enregistrer après avoir modifié le message, il ne se passe rien... J'ai tenté à plusieurs reprises.
Je voulais ajouter cette remarque:
Je ne comprend pas non plus comment un souci DB peut impacter un autre site qui ne se trouve pas sur la même DB, et qui se retrouve lui aussi en erreur 504... Puisque le mail d'OVH indique un souci au niveau de la DB.
Bonjour,
Est il possible d'avoir d'avantages d'informations :
- Taille db/table
- Structures des tables
- Table correctement indexé ? quel moteur ?
- Avez vous une page sans connection DB ? si oui quelles en sont les performances ?
- Requetes frequement utilisée (faire copier/coller de 4 ou requêtes sur les pages a problèmes)
- Version PHP ?
Avez ciblé les pages qui cause le probleme ?
Dèja on va débroussailler un petit peu avec ca...
Un simple fichier avec ceci comme contenu:
Quand je veux y accéder, j'ai une erreur 504 après 3.2 minutes.
Donc on peut nettement éliminer les soucis DB :-) D'autant plus que toutes les opérations que j'effectue via phpmyadmin se font rapidement et correctement.
Version php: 8.2
Pages en cause: toutes :(
A présent le test d'affichage d'un simple fichier texte est correct, mais tout ce qui est php ne passe pas, et ce n'est pas limité à un domaine... Les erreurs 504 se présentent sur tous les domaines qui sont stockés sur cet hébergement.
Update: le site semble enfin revenu, sans explications, et sans manipulation de ma part... J'attends un retour d'infos sur le ticket introduit.
Bonjour,
Vu ce que vous indiquez cela ressemble a une saturation des workers PHP, sur votre plan d'hébergement vous avez droit a un certain nombre de processus PHP (non communiqué par OVH et à priori non présent dans les stats sauf dans la partie "Dépassements du plafond de ressources" qui donne une idée).
En général cela se produit quand un script boucle et/ou attend sur une ressource (interne ou externe) et/ou fait un traitement lourd, et cela plusieurs fois jusqu'à saturer le nombre de processus (ou workers) PHP.
Cordialement, janus57
Merci pour ces précisions. je ne suis apparemment pas le seul dans le cas, je viens de lire un message similaire sur le forum.
Je vais investiguer pour voir si il est possible de couper ces processus lorsque ça se produit.
Tout fonctionnait à merveille pendant des jours, et puis à nouveau... Erreur 504... Sur tous les sites de différents domaines hébergés au même endroit. Et c'est encore une fois le moteur php qui ne répond plus :(
Bonjour,
Je confirme que la redirection de http vers https est instantanée. Il n'y a donc pas eu de problème pour lire le .htaccess.
Et ensuite ça mouline pendant de longues minutes (exactement 190 secondes) avant de lancer un 504.
Avez-vous été voir l'error log dans votre espace client > hebergement > logs ? Normalement il devrait y avoir de l'info utile dedans.
Voilà ce que je peux y voir pour les dernières entrées:
57.129.81.227 www.gaudry.be - [17/Jul/2025:09:31:22 +0200] "GET /bd/bessy/l-arme-du-crime.html HTTP/1.1" 500 - "-" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0 Safari/537.36"
154.29.65.136 www.gaudry.be - [17/Jul/2025:09:31:22 +0200] "GET /photo-rf-036544898126204311516118.jpg HTTP/1.1" 500 - "-" "-"
141.95.54.59 www.gaudry.be - [17/Jul/2025:09:31:23 +0200] "GET /bd/dessin/finch-david.html HTTP/1.1" 500 - "-" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0 Safari/537.36"
141.95.54.132 www.gaudry.be - [17/Jul/2025:09:31:23 +0200] "GET /bd/dessin/janin-mikel.html HTTP/1.1" 500 - "-" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0 Safari/537.36"
146.59.127.80 www.gaudry.be - [17/Jul/2025:09:31:24 +0200] "GET /bd/dessin/guera-r-m.html HTTP/1.1" 500 - "-" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/127.0.0 Safari/537.36"
Je n'ai pas plus d'infos...
Sur les logs d'erreurs, voici un exemple de ce qui s'affiche
Bonjour,
Pour moi vos logs confirment qu’un problème de script qui soit se met à boucler soit attend sur une ressource puis se fait tuer par la limite de temps.
Vu les 2 IPs cela ressemble éventuellement à des bots qui submergent votre site de requête sur des scripts "lourd" et vous font utiliser toutes les ressources.
Vous avez quoi dans les graphes d'utilisation au créneau horaire des erreurs ?
Au niveau des logs out ?
Cordialement, janus57
Le problème est réapparu aujourd'hui de 09h00 à 15h00 => toutes les pages étaient en Erreur 504.
Pour les graphes:
Dans les logs OUT, des adresses reviennent souvent (probablement des bots, ou les crawlers des moteurs de recherche). Voici un exemple:
Je ne sais pas si avec ces explications c'est un peu plus clair...
Votre site ne fait pas appel à un API de Wikipedia, par hasard ?
Si, tout à fait.
L'appel à l'API de Wikipedia peut causer ces incidents?
Je serais tenté de dire que si votre site bombarde Wikipedia parce qu'un robot bienveillant ou malveillant s'en prend à votre site, j'imagine bien que Wikipedia peut fermer le robinet et mettre vos connexions en 'drop' c'est-à-dire aucune réponse et timeout.
Merci.
C'est en effet une piste à explorer...
Je vais chercher une solution.
Bonjour,
Pour moi cela vos indications cela confirme l'épuisement de vos ressources (ce qui confirme le diag de OVH qui dit pas d'incident).
Maintenant question con, vos requêtes vers wikipedia sont forcément unique, ou vous avez un système de cache pour retourner une valeur identique plutôt que la piocher chez wikipedia à chaque fois ?
Requêtes anonyme ou via un compte API ?
Cordialement, janus57
C'est avec un système de double cache.
Pour l'API, c'est avec Bearer et un token.
Mais je viens de changer le système pour adapter ces points:
Je vais voir si ça a un impact...
Bonjour,
vous avez regardé si les vagues de bot ne font pas exploser votre quota (Cf : https://api.wikimedia.org/wiki/Rate_limits) ?
Cordialement, janus57
Oui il m'arrive de dépasser le quota (lorsque j'ai une réindexation des pages et que malheureusement j'ai vidé et le cache des pages et celui des appels à l'API) et dans ce cas je suis au delà des 5000 requêtes par heure, mais normalement les réponses 429 sont gérées et ne devraient pas causer un blocage du moteur php il me semble...