Formation Google Cloud Platform – Fondamentaux Big Data and Machine Leaning

  • Référence : GCP100B
  • Durée : 7 heures
  • Certification : Non
  • Eligible CPF : Non

CONNAISSANCES PREALABLES

  • Expérience avec un langage de requête commun tel que SQL
  • Expérience avec un ETL
  • Expérience de modélisation des données
  • Expérience en machine learning et / ou statistiques
  • Expérience avec la programmation en Python

PROFIL DES STAGIAIRES

  • Participants désirant un aperçu des produits et services Google Cloud Platform orientés traitement des données et machine learning

OBJECTIFS

  • Connaissance des produits et services de Google Cloud Platform, particulièrement ceux liés au traitement des données et au machine learning
  • Connaissance des produits et services fondamentaux concernant le calcul et le stockage
  • Connaissance de Cloud SQL et de Dataproc
  • Connaissance de Datalab et BigQuery
  • Connaissance de TensorFlow et des APIs Machine Learning
  • Connaissance de Pub / Sub et de Dataflow

METHODES PEDAGOGIQUES

  • 6 à 12 personnes maximum par cours, 1 poste de travail par stagiaire
  • Remise d’une documentation pédagogique papier ou numérique pendant le stage
  • La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions

METHODES D'EVALUATION DES ACQUIS

  • Auto-évaluation des acquis par le stagiaire via un questionnaire
  • Attestation de fin de stage adressée avec la facture

FORMATEUR

Consultant-Formateur expert Cloud

CONTENU DU COURS Cloud

1 - Présentation de Google Cloud Platform

  • Présentation des principes de base de la plateforme Google
  • Produits Big Data de Google Cloud Platform

2 - Fondamentaux du calcul et du stockage

  • CPU à la demande (Compute Engine)
  • Un système de fichiers global (Cloud Storage)
  • CloudShell
  • Atelier : Configurer un pipeline de traitement des données Ingest-Transform-Publish

3 - Data Analytics sur le Cloud

  • Tremplins vers le nuage
  • Cloud SQL: votre base de données SQL sur le cloud
  • Atelier: Importation de données dans CloudSQL et exécution de requêtes
  • Spark sur Dataproc
  • Travaux pratiques : recommandations d’apprentissage automatique avec Spark sur Dataproc

4 - Mise à l’échelle de l’analyse des données

  • Accès aléatoire rapide
  • Datalab
  • BigQuery
  • Atelier : Créer un ensemble de données d’apprentissage automatique

5 - Apprentissage automatique

  • Apprentissage automatique avec TensorFlow
  • Laboratoire : Effectuer ML avec TensorFlow
  • Modèles pré-construits pour les besoins communs
  • Atelier : Utiliser des API ML

6 - Architectures de traitement des données

  • Architectures orientées message avec Pub / Sub
  • Création de pipelines avec Dataflow
  • Architecture de référence pour le traitement de données en temps réel et par lots

7 - Résumé

  • Pourquoi GCP ?
  • Où aller en partant d’ici
  • Ressources supplémentaires
Cookies