Les arsouyes ont les pieds dans l’eau
Divulgâchage : Les vacances scolaires sont commencées depuis deux semaines et nous prenions tout doucement un rythme plus estival lorsqu’une fuite d’eau a inondé la pièce où se trouvent nos serveurs… Techniquement, on a déplacé la baie, fait venir des plombiers puis corrigé quelques petites choses qui n’avaient pas redémarré automatiquement.
Comme vous le savez déjà, nous pratiquons l’auto-hébergement. Au départ, parce qu’on est geek et qu’on adore ça, mettre en place un réseau et configurer des services. C’est toujours valorisant de voir le résultat. Sans compter l’indépendance et le confort numérique que ça nous apporte.
Ensuite, l’auto-hébergement nous permet de rester au contact du terrain. Contrairement à beaucoup de consultants, qui on rapidement fait leur deuil technique, nous ne voyons pas comment nous pourrions conseiller efficacement nos clients, ou faire de l’informatique légale (pénale ou civil), bref, rester crédibles, sans expérience concrète du sujet et de ses problématiques réelles.
Et cette semaine, le sort avait justement décidé de nous en faire gagner, de l’expérience…
Alors qu’on déjeunait, on entend un bruit, avons-nous lancé une lessive ? Non, pas ce matin. Pourtant, le bruit est insistant et évoque de l’eau… On ouvre les portes et on découvre 2cm d’eau équitablement répartie… le temps de couper la vanne générale, le geyser s’interrompt et on va pouvoir gérer le problème.
Réagir
Après avoir coupé l’arrivée d’eau à la vanne générale, la situation n’empire plus, c’est chouette, mais on n’en est qu’au début…
Premier dans notre liste de priorité, les serveurs. Avec 2 cm d’eau, ils ne risquent pas grand chose. La baie a un débattement suffisamment haut et les câbles ne touchent pas l’eau. Par prudence (et pour dégager de la place), on va quand même les arrêter (proprement) puis les débrancher et les déménager dans l’arrière cuisine, sous la baie.
Pour les reconnaître facilement, nous avions utilisé des câbles
réseau de couleur différente. Le truc, c’est qu’on a jamais documenté ça
et, dans la précipitation, on l’a pas noté non plus… Pour l’AD, c’est
facile, une seule prise et on sait où elle va. Pour proxmox, il y en a
deux… Après un ip addr show
, on repère la carte qui supporte les
vlans et on peut brancher les deux derniers câbles.
Le temps que les serveurs démarrent, on vérifie qu’Internet et le NAS sont accessibles et on peut passer à la suite. Appeler l’assurance et le plombier et leur faire comprendre que, non, avec des enfants, on ne peut pas attendre lundi sans eau courante (5 jours). Vider les lieux de tout ce qui traine par terre et écoper l’eau.
Les plombiers nous ont casé le lendemain midi, entre d’autres clients qui avaient pris rendez-vous. On peut de nouveau prendre des douches (pour les toilettes, on puisait l’eau dans la piscine).
Respirer et corriger
Heureusement, nous n’avons eu aucun dégât. Physiquement, seuls quelques cartons vides sont foutus. Informatiquement, tout fonctionne comme avant. Enfin presque…
On a d’abord constaté quelques ratés réseaux : des latences inexplicables sur certains sites, des coupures lorsque la mibox lit un film sur le NAS… en fait, c’était l’IPv6 des routeurs qui ne s’était pas remontée toute seule. Il a suffit de redémarrer le maître pour qu’il se reconfigure correctement, puis redémarrer l’esclave dans un deuxième temps.
Certains services accessoires n’étaient pas disponibles, le temps de s’en rendre compte, de se connecter à proxmox et voir que c’est normal :
- On avait oublié de configurer le démarrage automatique de certaines,
- On avait oublié de retirer le DVD virtuel de certaine et comme le fichier correspondant avait été supprimé de proxmox, la machine ne pouvait pas démarrer.
Ces deux corrections faites, on est de nouveau en ligne 🎉.
Et maintenant ?
Il reste encore quelques petits détails, comme re-déménager les serveurs à leur place parce que là, ils ne sont pas climatisés, ce qui oblige à laisser une porte ouverte et le bruit va finir par nous taper sur le système. Mis à part quelques petits problèmes annexes, tout est revenu à la normale très rapidement (la coupure réseau n’a pas duré 15 minutes et la coupure d’eau a été corrigée en 30 heures).
La prochaine fois que nous parlerons de gestion de pannes avec un client, nous pourrons ajouter « Petite Innondation » à nos achievements :
- Coupure du fusible pour cause de raclette,
- Grillage de box pour cause de coup de foudre,
- Coupure de courant pour cause de pelleteuse,
- Rupture du câble téléphone pour cause de la neige,
- Pannes de FAI diverses (causes inconnues),
- Petite Innondation pour cause de fuite.
Un peu d’originalité avec de l’eau ne fait pas de mal. Pour le feu, on préfère attendre mais on vous racontera.