Formation Logging, Monitoring, and Observability in Google Cloud

  • Référence : GCP200LM
  • Durée : 14 heures
  • Certification : Non
  • Eligible CPF : Non

RÉSUMÉ

Ce cours de trois jours dirigé par un instructeur enseigne aux participants des techniques de surveillance, de dépannage et d'amélioration des performances de l'infrastructure et des applications dans Google Cloud. Guidés par les principes de l'ingénierie de la fiabilité du site (SRE) et à l'aide d'une combinaison de présentations, de démonstrations, d'ateliers pratiques et d'études de cas réels, les participants acquièrent de l'expérience avec la surveillance complète de la pile, la gestion et l'analyse des journaux en temps réel, débogage du code en production, suivi des goulots d'étranglement des performances des applications et profilage de l'utilisation du processeur et de la mémoire.

CONNAISSANCES PREALABLES

  • Principes de base de Google Cloud Platform : infrastructure de base ou expérience équivalente
  • Connaissance de base des scripts ou du codage
  • Maîtrise des outils de ligne de commande et des environnements de système d'exploitation Linux

PROFIL DES STAGIAIRES

  • 1-Architectes cloud, administrateurs et personnel SysOps
  • 2-Développeurs cloud et personnel DevOps

OBJECTIFS

  • Planifier et mettre en œuvre une infrastructure de journalisation et de surveillance bien architecturée
  • Définir les indicateurs de niveau de service (SLI) et les objectifs de niveau de service (SLO)
  • Créez des tableaux de bord et des alertes de surveillance efficaces
  • Surveiller, dépanner et améliorer l'infrastructure Google Cloud
  • Analyser et exporter les journaux d'audit Google Cloud
  • Trouvez les défauts du code de production, identifiez les goulots d'étranglement et améliorez les performances
  • Optimiser les coûts de surveillance

METHODES PEDAGOGIQUES

  • 6 à 12 personnes maximum par cours, 1 poste de travail par stagiaire
  • Remise d’une documentation pédagogique papier ou numérique pendant le stage
  • La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions

METHODES D'EVALUATION DES ACQUIS

  • Auto-évaluation des acquis par le stagiaire via un questionnaire
  • Attestation de fin de stage adressée avec la facture

FORMATEUR

Consultant-Formateur expert Cloud

CONTENU DU COURS Cloud

1 - Présentation des outils de surveillance de Google Cloud

  • Comprendre l’objectif et les fonctionnalités des composants axés sur les opérations de Google Cloud : journalisation, surveillance, rapport d’erreurs et surveillance des services
  • Comprendre l’objectif et les fonctionnalités des composants axés sur la gestion des performances des applications Google Cloud : débogueur, trace et profileur

2 - Éviter la souffrance des clients

  • Construisez une base de surveillance sur les quatre signaux d’or : latence, trafic, erreurs et saturation
  • Mesurez la douleur des clients avec les SLI
  • Définir les mesures de performance critiques
  • Créer et utiliser des SLO et des SLA
  • Atteindre l’harmonie entre les développeurs et les opérations grâce aux budgets d’erreurs

3 - Surveillance des systèmes critiques

  • Choisir les meilleures pratiques de surveillance des architectures de projet
  • Différencier les rôles Cloud IAM pour la surveillance
  • Utiliser les tableaux de bord par défaut de manière appropriée
  • Créez des tableaux de bord personnalisés pour afficher la consommation des ressources et la charge des applications
  • Définir des tests de disponibilité pour suivre la vivacité et la latence

4 - Règles d'alerte

  • Développer des stratégies d’alerte
  • Définir des règles d’alerte
  • Ajouter des canaux de notification
  • Identifier les types d’alertes et les utilisations courantes de chacune
  • Construire et alerter sur les groupes de ressources
  • Gérer les règles d’alerte par programmation

5 - Journalisation et analyse avancées

  • Identifier et choisir parmi les approches d’étiquetage des ressources
  • Définir les récepteurs de journaux (filtres d’inclusion) et les filtres d’exclusion
  • Créer des métriques basées sur les journaux
  • Définir des métriques personnalisées
  • Lier les erreurs d’application à la journalisation à l’aide du rapport d’erreurs
  • Exporter les journaux vers BigQuery

6 - Utilisation des journaux d'audi

  • Journaux d’audit
  • Journalisation des accès aux données
  • Format d’entrée des journaux d’audit
  • Les meilleures pratiques

7 - Configurer les services Google Cloud pour l'observabilité

  • Intégrez des agents de journalisation et de surveillance dans les VM et les images Compute Engine
  • Activer et utiliser Kubernetes Monitoring
  • Étendez et clarifiez la surveillance de Kubernetes avec Prometheus
  • Exposez des métriques personnalisées via le code et avec l’aide d’OpenCensus

8 - Surveiller le VPC Google Cloud

  • Collecter et analyser les journaux de flux VPC et les journaux des règles de pare-feu
  • Activer et surveiller la mise en miroir de paquets
  • Expliquer les fonctionnalités de Network Intelligence Center
  • Utilisez les journaux d’audit des activités d’administration pour suivre les modifications apportées à la configuration ou aux métadonnées des ressources
  • Utilisez les journaux d’audit d’accès aux données pour suivre les accès ou les modifications apportées aux données de ressources fournies par l’utilisateur
  • Utiliser les journaux d’audit des événements système pour suivre les actions administratives de GCP

9 - Gestion des incidents

  • Définir les rôles de gestion des incidents et les canaux de communication
  • Atténuer l’impact des incidents
  • Dépanner les causes profondes
  • Résoudre les incidents
  • Documenter les incidents dans un processus post-mortem

10 - Enquête sur les problèmes de performances des applications

  • Déboguer le code de production pour corriger les défauts de code
  • Tracez la latence à travers les couches d’interaction de service pour éliminer les goulots d’étranglement des performances
  • Profiler et identifier les fonctions gourmandes en ressources dans une application

11 - Optimiser les coûts de surveillance

  • Analyser l’utilisation des ressources pour surveiller les composants associés dans Google Cloud
  • Mettre en œuvre les bonnes pratiques pour contrôler le coût de la surveillance dans Google Cloud
Cookies