Démarrez avec Kubernetes en utilisant l’ingénierie du chaos


  • Français


  • Kubernetes fête ses 11 ans, je vais donc fêter son anniversaire en vous offrant des outils open source qui vous aideront à semer le chaos. L’ingénierie du chaos est en partie science, en partie planification et en partie expériences. C’est la discipline d’expérimenter sur un système pour renforcer la confiance dans la capacité du système à résister aux conditions turbulentes de la production.

    Avant de commencer à distribuer les cadeaux, dans cet article d’introduction, j’expliquerai les bases du fonctionnement de l’ingénierie du chaos.

    Comment démarrer avec l’ingénierie du chaos ?

    D’après mon expérience, la meilleure façon de démarrer l’ingénierie du chaos est de prendre un incident qui s’est déjà produit en production et de l’utiliser comme expérience. Utilisez vos données passées, élaborez un plan pour casser votre système de la même manière, créez une stratégie de réparation et confirmez que le résultat est exactement comme vous le souhaitez. Si votre plan échoue, vous disposez d’une nouvelle façon d’expérimenter et d’avancer vers une nouvelle façon de gérer les problèmes rapidement.

    Mieux encore, vous pouvez tout documenter au fur et à mesure, ce qui signifie qu’au fil du temps, l’ensemble de votre système sera entièrement documenté afin que tout le monde puisse être de garde sans trop d’escalades et que tout le monde puisse passer une bonne pause le week-end.

    Que faites-vous dans l’ingénierie du chaos ?

    L’ingénierie du chaos a une certaine science derrière le fonctionnement de ces expériences. J’ai documenté certaines des étapes:

    1. Définir un état stationnaire: Utilisez un outil de surveillance pour recueillir des données sur l’apparence fonctionnelle de votre système lorsqu’il n’y a pas de problèmes ou d’incidents.
    2. Faites une hypothèse ou utilisez un incident précédent: Maintenant que vous avez défini un état stable, faites une hypothèse sur ce qui se passerait (ou s’est produit) lors d’un incident ou d’une panne. Utilisez cette hypothèse pour générer une série de théories sur ce qui pourrait arriver et comment résoudre les problèmes. Ensuite, vous pouvez démarrer un plan pour provoquer délibérément le problème.
    3. Présentez le problème : Utilisez ce plan pour casser votre système et commencer les tests dans le monde réel. Rassemblez les états de vos métriques cassées, utilisez votre correctif planifié et suivez le temps qu’il faut avant d’atteindre une résolution. Assurez-vous de tout documenter pour les futures pannes.
    4. Essayez de réfuter votre propre hypothèse : La meilleure partie de l’expérimentation est d’essayer de réfuter ce que vous pensez ou planifiez. Vous voulez créer un état différent, voir jusqu’où vous pouvez le prendre et générer un état stable différent dans le système.

    Assurez-vous de créer un système de contrôle dans un état stable avant de générer les variables cassées dans un autre système. Cela permettra de repérer plus facilement les différences dans divers états stables avant, pendant et après votre expérience.

    De quoi ai-je besoin pour l’ingénierie du chaos ?

    Les meilleurs outils pour commencer l’ingénierie du chaos sont :

    • Bonnes pratiques documentaires
    • Un système de surveillance pour capturer votre système dans un état stable et un état non stable
    • Outils d’ingénierie du chaos
      • Maille du chaos
      • Tournesol
      • Et plus que je couvrirai dans les prochains articles
    • Une hypothèse
    • Un plan

    Allez de l’avant et détruisez

    Maintenant que vous avez les bases en main, il est temps d’aller de l’avant et de détruire votre système en toute sécurité. Je prévois de commencer à semer le chaos quatre fois par an et de travailler à des destructions mensuelles.

    L’ingénierie du chaos est une bonne pratique et un excellent moyen de maintenir votre documentation interne à jour. De plus, les nouvelles mises à niveau ou déploiements d’applications seront plus fluides au fil du temps, et votre quotidien sera plus facile avec l’administration de Kubernetes.

    Source

    Houssen Moshinaly

    Pour contacter personnellement le taulier :

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

    Copy code