Formation Microsoft Azure : Ingénierie de données (DP-203)

Éligible CPF LiveOnLine Certifiant
  • Référence : MSDP203
  • Durée : 28 heures
  • Certification : DP-203
  • Eligible CPF : Oui

CONNAISSANCES PREALABLES

  • 1-Avoir suivi les formations MSAZ900 - Azure : Les fondamentaux et MSDP900 - Azure : Principes fondamentaux sur les données ou avoir une connaissance du cloud computing et des concepts de base des données et avoir une expérience pratique avec des solutions de données
  • 2-Avoir des connaissances de base en langue anglaise car le support de cours et l'examen sont en langue anglaise, et les ateliers seront réalisés sur des VM en anglais

PROFIL DES STAGIAIRES

  • 1-Professionnels des données, architectes de données et professionnels BI qui souhaitent en savoir plus sur l'ingénierie des données et la création de solutions analytiques à l'aide des technologies de plate-forme de données existantes sur Microsoft Azure
  • 2-Analystes de données et data scientists qui travaillent avec des solutions analytiques basées sur Microsoft Azure

OBJECTIFS

  • Savoir explorer les options de calcul et de stockage pour les charges de travail d'ingénierie des données dans Azure
  • Apprendre à exécuter des requêtes interactives à l'aide de pools SQL sans serveur
  • Effectuer l'exploration et la transformation des données dans Azure Databricks
  • Comprendre comment explorer, transformer et charger des données dans l'entrepôt de données à l'aide d'Apache Spark
  • Pouvoir intégrer et charger des données dans l'entrepôt de données
  • Être capable de transformer les données avec Azure Data Factory ou Azure Synapse Pipelines
  • Apprendre à intégrer les données des blocs-notes avec Azure Data Factory ou Azure Synapse Pipelines
  • Pouvoir prendre en charge le traitement analytique transactionnel hybride (HTAP) avec Azure Synapse Link
  • Savoir réaliser une sécurité de bout en bout avec Azure Synapse Analytics
  • Être capable d'effectuer un traitement de flux en temps réel avec Stream Analytics
  • Apprendre à créer une solution de traitement de flux avec Event Hubs et Azure Databricks

METHODES PEDAGOGIQUES

  • 6 à 12 personnes maximum par cours, 1 poste de travail par stagiaire
  • Remise d’une documentation pédagogique papier ou numérique pendant le stage
  • La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions

METHODES D'EVALUATION DES ACQUIS

  • Auto-évaluation des acquis par le stagiaire via un questionnaire
  • Attestation de fin de stage adressée avec la facture

FORMATEUR

Consultant-Formateur expert Azure

CONTENU DU COURS Azure

1 - Explorer les options de calcul et de stockage pour les charges de travail d'ingénierie des données

  • Décrire Azure Databricks
  • Introduction à Azure Synapse Analytics
  • Travailler avec des flux de données à l’aide d’Azure Stream Analytics
  • Introduction au stockage Azure Data Lake
  • Décrire l’architecture Delta Lake

2 - Exécuter des requêtes interactives à l'aide de pools SQL sans serveur Azure Synapse Analytics

  • Explorer les fonctionnalités des pools SQL sans serveur Azure Synapse
  • Interroger des données dans le lac à l’aide de pools SQL sans serveur Azure Synapse
  • Créer des objets de métadonnées dans des pools SQL sans serveur Azure Synapse
  • Sécuriser les données et gérer les utilisateurs dans les pools SQL sans serveur Azure Synapse

3 - Exploration et transformation des données dans Azure Databricks

  • Utiliser DataFrames dans Azure Databricks
  • Utiliser les méthodes avancées DataFrames dans Azure Databricks
  • Lire et écrire des données dans Azure Databricks
  • Décrire Azure Databricks

4 - Explorer, transformer et charger des données dans l'entrepôt de données à l'aide d'Apache Spark

  • Comprendre l’ingénierie Big Data avec Apache Spark dans Azure Synapse Analytics
  • Intégrer des données avec des blocs-notes Apache Spark dans Azure Synapse Analytics
  • Transformer des données avec DataFrames dans des pools Apache Spark dans Azure Synapse Analytics
  • Intégrer des pools SQL et Apache Spark dans Azure Synapse Analytics

5 - Intégrer et charger des données dans l'entrepôt de données

  • Utiliser les meilleures pratiques de chargement des données dans Azure Synapse Analytics
  • Ingestion à l’échelle du pétaoctet avec Azure Data Factory

6 - Transformer les données avec Azure Data Factory ou Azure Synapse Pipelines

  • Transformation sans code à grande échelle avec Azure Data Factory ou Azure Synapse Pipelines
  • Intégration de données avec Azure Data Factory ou Azure Synapse Pipelines

7 - Orchestrer le mouvement et la transformation des données dans Azure Synapse Pipelines

  • Orchestrer le mouvement et la transformation des données dans Azure Data Factory

8 - Sécurité de bout en bout avec Azure Synapse Analytics

  • Sécuriser un entrepôt de données dans Azure Synapse Analytics
  • Configurer et gérer les secrets dans Azure Key Vault
  • Mettre en oeuvre des contrôles de conformité pour les données sensibles

9 - Prise en charge du traitement analytique transactionnel hybride (HTAP) avec Azure Synapse Link

  • Concevoir un traitement transactionnel et analytique hybride à l’aide d’Azure Synapse Analytics
  • Configurer Azure Synapse Link avec Azure Cosmos DB
  • Interroger Azure Cosmos DB avec des pools Apache Spark
  • Interroger Azure Cosmos DB avec des pools SQL sans serveur

10 - Traitement de flux en temps réel avec Stream Analytics

  • Utiliser des flux de données à l’aide d’Azure Stream Analytics
  • Ingérer des flux de données avec Azure Stream Analytics
  • Activer une messagerie fiable pour les applications Big Data à l’aide d’Azure Event Hubs

11 - Créer une solution de traitement de flux avec Event Hubs et Azure Databricks

  • Traiter les données de streaming avec le streaming structuré Azure Databricks

12 - Certification Microsoft Data Engineering on Microsoft Azure

  • Cette formation prépare au passage de la certification Microsoft Data Engineering on Microsoft Azure
  • Les compétences attestées par cette certification sont :
  • Concevoir et développer des solutions de stockage et de traitement de données pour l’entreprise
  • Configurer et déployer des services de données cloud tels que des services Blob, des bases de données et des fonctionnalités d’analytique
  • Sécuriser la plateforme et les données stockées. Vérifier que seuls les utilisateurs autorisés peuvent accéder aux données
  • Assurer la continuité de l’activité dans les situations exceptionnelles à l’aide des techniques de haute disponibilité et de reprise d’activité après sinistre
  • Assurer la supervision des systèmes pour vérifier qu’ils s’exécutent correctement et qu’ils sont économiques
Cookies