SQL Server 2016
IT Informatique et Technique
Formation Perform Data Engineering on Microsoft HD Insight

Connaissances préalables pour suivre cette formation SQL Server 2016 :

• En plus de leur expérience professionnelle, les participants devraient avoir : Expérience de programmation R et être familiarisé avec les paquets R communs ; Connaissance des méthodes statistiques communes et des meilleures pratiques d'analyse de données ; Connaissances de base du système d'exploitation Microsoft Windows et de ses fonctionnalités principales ; Connaissance pratique des bases de données relationnelles

Public de cette formation SQL Server 2016 :

• 1-Ingénieurs de données
• 2-Architectes de données
• 3-Data Scientists
• 4-Développeurs de données

Objectifs de cette formation SQL Server 2016 :

• Donner aux participants les capacités pour planifier et mettre en œuvre de grands flux de données sur HDInsight



Méthodes pédagogiques de cette formation SQL Server 2016 :

• 6 à 12 personnes maximum par cours, 1 poste de travail par stagiaire
• Remise d’une documentation pédagogique papier ou numérique pendant le stage
• La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions

Formateur de cette formation SQL Server 2016 :

• Consultant-formateur expert SQL Server 2016

Méthodes d'évaluation des acquis de cette formation SQL Server 2016 :

• Auto-évaluation des acquis par le stagiaire via un questionnaire
• Attestation de fin de stage adressée avec la facture

Contenu détaillé de cette formation Perform Data Engineering on Microsoft HD Insight :


     Démarrer avec HDInsight

    • Que sont les Big Data ?
    • Introduction à Hadoop
    • Travailler avec les fonctions de MapReduce
    • Présentation de HDInsight

     Déployer des clusters HDInsight

    • Identification des types de cluster HDInsight
    • Gestion des clusters HDInsight en utilisant le portail Azure
    • Gestion des clusters HDInsight en utilisant Azure PowerShell

     Autoriser les utilisateurs à accéder aux ressources

    • Clusters non connectés au domaine
    • Configuration de clusters HDInsight connectés au domaine
    • Gestion des clusters HDInsight connectés au domaine

     Charger des données dans HDInsight

    • Stockage des données pour le traitement HDInsight
    • Utilisation des outils de chargement de données
    • Maximiser la valeur des données stockées

     Dépanner HDInsight

    • Analyse des journaux HDInsight
    • YARN logs
    • Heap dumps
    • Operations Management Suit

     Mettre en œuvre des solutions par lot

    • Stockage Apache Hive
    • Requêtes de données HDInsight utilisant Hive and Pig
    • Opérations HDInsight

     Concevoir des solutions ETL par lot pour de grands volumes de données avec Spark

    • Qu'est-ce que Spark ?
    • ETL avec Spark
    • Performance de Spark

     Analyser les données avec Spark SQL

    • Implémentation de requêtes itératives et interactives
    • Effectuer une analyse de données exploratoires

     Analyser les données avec Hive et Phoenix

    • Mettre en place des requêtes interactives pour les grandes données avec Hive
    • Effectuer une analyse de données exploratoires à l'aide de Hive
    • Effectuer un traitement interactif en utilisant Apache Phoenix

     Analyse de flux

    • Analyse de flux
    • Processus de diffusion des données à partir de l'analyse des flux
    • Gérer les travaux d'analyse de flux

     Implémenter des solutions en streaming avec Kafka et Hbase

    • Création et déploiement d'un cluster Kafka
    • Publication, consommation et traitement des données à l'aide du Cluster Kafka
    • Utilisation de HBase pour stocker et rechercher des données

     Développer de grandes solutions de traitement en temps réel avec Apache Storm

    • Péréniser les données sur le long terme
    • Transmission des données avec Storm
    • Création de topologies Storm
    • Configurer Apache Storm

     Créer des applications Spark Streaming

    • Utilisation de Spark Streaming
    • Création d'applications Spark structurée pour le Streaming
    • Persistance et visualisation


INTER INTRA

Produit : Formation SQL Server 2016

Code du stage : MS20775

Langue du support : Anglais

Certification(s) Préparée(s) : Non

Durée de la formation : 5 jours

Prix (HT) :

  • Silver : 2495 €
  • Gold : 2730 €
  • Platinum : 2935 €

Bons Software Assurance :
1 bon de 5 jours

PDF
Plan de cours PDF
Bulletin
Bulletin d'inscription
Prochaines sessions
Nous consulter par mail
Tél: 01 71 19 70 30
Autres formations
Haut de page