Formation Google Cloud Platform – Form Data to Insights
- Référence : GCP200DA
- Durée : 21 heures
- Certification : Non
- Eligible CPF : Non
CONNAISSANCES PREALABLES
- Une certaine maîtrise d’ANSI SQL
PROFIL DES STAGIAIRES
- Data Analysts, Business Analysts, Business Intelligence, Cloud Data Engineers qui s’associeront à des Data Analysts pour créer des solutions de données évolutives sur Google Cloud Platform
OBJECTIFS
- Obtenir des informations à partir de données à l’aide des outils d’analyse et de visualisation de Google Cloud Platform
- Analyser des données à l’échelle avec BigQuery
- Charger, nettoyer et transformer les données à grande échelle à l’aide de Google Cloud Dataprep
- Explorer et visualiser les données à l’aide de Google Data Studio
- Optimiser et écrire des requêtes hautes performances et résoudre les problèmes associés
- Dériver des informations à partir de données à l’aide du Machine Learning
METHODES PEDAGOGIQUES
- 6 à 12 personnes maximum par cours, 1 poste de travail par stagiaire
- Remise d’une documentation pédagogique papier ou numérique pendant le stage
- La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions
METHODES D'EVALUATION DES ACQUIS
- Auto-évaluation des acquis par le stagiaire via un questionnaire
- Attestation de fin de stage adressée avec la facture
FORMATEUR
Consultant-Formateur expert Cloud
CONTENU DU COURS Cloud
1 - Introduction à Google Cloud Platform
- Mettre en évidence les défis analytiques rencontrés par les analystes de données
- Comparer le Big Data On-Premises vs dans le Cloud
- Apprendre des cas d’utilisation réels d’entreprises transformées grâce à l’analyse dans le cloud
- Parcourir les bases d’un projet Google Cloud Platform
2 - Analyse de grands ensembles de données avec BigQuery
- Parcourir les tâches et défis d’un analyste de données et introduction aux outils de données sur Google Cloud Platform
- Démo: Analyser 10 milliards d’enregistrements avec Google BigQuery
- Explorer 9 fonctionnalités fondamentales de Google BigQuery
- Comparer les outils GCP pour les analystes, les scientifiques et les ingénieurs de données
- Atelier: Principes de base de BigQuery
3 - Explorer votre ensemble de données public avec SQL
- Comparer les techniques courantes d’exploration de données
- Apprendre à coder du SQL standard de haute qualité
- Explorer les jeux de données publics Google BigQuery
- Aperçu de la visualisation: Google Data Studio
- Atelier: Explorer votre ensemble de données de commerce électronique avec SQL dans Google BigQuery
4 - Nettoyage et transformation de vos données avec Cloud Dataprep
- Examiner les 5 principes de l’intégrité des ensembles de données
- Caractériser la forme et le biais d’un jeu de données
- Nettoyer et transformer des données à l’aide de SQL
- Nettoyer et transformer les données à l’aide d’une nouvelle interface utilisateur: présentation de Cloud Dataprep
- Atelier: Création d’un pipeline de transformation de données avec Cloud Dataprep
5 - Visualisation des informations et création de requêtes planifiées
- Présentation des principes de visualisation des données
- Approches exploratoires vs approches explicatives
- Démonstration: interface utilisateur de Google Data Studio
- Connecter Google Data Studio à Google BigQuery
- Atelier: Comment créer un tableau de bord BI à l’aide de Google Data Studio et BigQuery
6 - Stockage et ingestion de nouveaux ensembles de données
- Comparer les tables permanentes et temporaires
- Enregistrer et exporter les résultats de requête
- Aperçu des performances: cache de requête
- Atelier: Ingestion de nouveaux jeux de données dans BigQuery
7 - Enrichir votre entrepôt de données avec JOINs
- Fusionner les tables de données historiques avec UNION
- Présentation des wildcards de tables pour des fusions faciles
- Examen des schémas de données: liaison de données entre plusieurs tables
- Exemples de jointures et pièges liés aux jointures
- Atelier: Dépannage et résolution des problèmes liés aux jointures
8 - Partitionnement de vos requêtes et tables pour des informations avancées
- Examen des instructions SQL Case
- Présentation des fonctions de fenêtre analytique
- Protéger vos données avec le cryptage de champs unidirectionnel
- Discussion autour de la conception efficace de sous-requêtes et CTE
- Comparer les UDF SQL et Javascript
- Atelier: Création de tables partitionnées par date dans BigQuery
9 - Conception de schémas à l’échelle: tableaux et structures dans BigQuery
- Comparer Google BigQuery à l’architecture des bases de données RDBMS traditionnelle
- Normalisation vs dénormalisation: compromis sur les performances
- Revue de schéma: le bon, le mauvais et le laid
- Tableaux et données imbriquées dans Google BigQuery
- Atelier: Interrogation de données imbriquées et répétées
- Atelier: Conception de schéma pour la performance: tableaux et structures dans BigQuery
10 - Optimisation des requêtes pour la performance
- Exploration d’un job BigQuery
- Calculer les tarifs BigQuery: coûts de stockage, de requête et de streaming
- Optimiser les requêtes pour le coût
11 - Contrôle de l’accès avec les meilleures pratiques de sécurité des données
- Meilleures pratiques de sécurité des données
- Contrôle des accès avec les vues autorisées
12 - Prédire les achats de retour des visiteurs avec BigQuery ML
- Introduction au ML
- Sélection de caractéristiques
- Types de modèles
- Machine learning dans BigQuery
- Atelier: Prédire les achats des visiteurs avec un modèle de classification BigQuery ML
13 - Dériver des informations à partir de données non structurées à l’aide du Machine Learning
- ML structuré vs non structuré
- Modèles ML préconstruits
- Atelier: Extraire, analyser et traduire du texte à partir d’images avec les API Cloud ML
- Atelier: Entraînement avec des modèles ML prédéfinis à l’aide de l’API Cloud Vision et d’AutoML
14 - Conclusion
- Résumé du cours