Formation Hadoop : Analytics
- Référence : PYCB036
- Durée : 14 heures
- Certification : Non
- Eligible CPF : Non
CONNAISSANCES PREALABLES
- Connaissances des principes du BigData, d'un langage de programmation comme Java ou Scala ou Python
PROFIL DES STAGIAIRES
- Chefs de projet, développeurs, data scientists, architectes souhaitant mettre en œuvre des solutions analytics avec hadoop
OBJECTIFS
- Savoir mettre en œuvre les frameworks analytics dans un environnement hadoop
METHODES PEDAGOGIQUES
- Mise à disposition d’un poste de travail par participant
- Remise d’une documentation pédagogique papier ou numérique pendant le stage
- La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions
METHODES D'EVALUATION DES ACQUIS
- Auto-évaluation des acquis par le stagiaire via un questionnaire
- Attestation de fin de stage adressée avec la facture
FORMATEUR
Consultant-Formateur expert Bigdata
CONTENU DU COURS Bigdata
1 - Introduction
- Arbres de décision, de régression, régression automatique
- Apprentissage supervisé, apprentissage automatique
- Présentation du data munging
- Définitions : Analytics
2 - Hadoop et les outils d'analyse
- Rôle des différents composants : socle hadoop, yarn, hdfs
- Frameworks analytics : Mahout, Flink, Spark ML
3 - Mahout
- Compatibilité avec Hadoop Yarn, Spark, H2O, Flink
- Présentation des algorithmes les plus courants
- Exemples de base : génération de recommandations, traitement, filtrage
- Génération de recommandations, traitement, filtrage
- Sources de données, format de stockage des données
- Principe de fonctionnement
4 - Flink
- Origine du projet, fonctionnalités
- Traitement distribué de flux de données, en temps réel ou batch
- APIs disponibles
- Mise en oeuvre avec des programmes Java/Scala
- Analyse de graphe avec l’API Gelly
5 - Spark MLib
- Fonctionnalités : Machine Learning avec Spark, algorithmes standards, gestion de la persistence,statistiques
- Support de RDD
- Mise en oeuvre avec les DataFrames
6 - GraphX
- Fourniture d’algorithmes, d’opérateurs simples pour des calculs statistiques sur les graphes
- Travaux pratiques : exemples d’opérations sur les graphes