Bigdata
IT Informatique et Technique
Formation Apache Mahout : analyse de données

Connaissances préalables pour suivre cette formation Bigdata :

• Connaissance d'un langage de développement objet et connaissances générales sur le Bigdata, le data-mining, l'analyse de données.

Public de cette formation Bigdata :

• Chefs de projet, architectes, développeurs, data-scientists souhaitant utiliser Mahout et mettre en oeuvre des algorithmes d'apprentissage distribués

Objectifs de cette formation Bigdata :

• Comprendre le fonctionnement de Mahout
• Connaître l'architecture et savoir implémenter les algorithmes de Machine Learning en local ou en environnement distribué



Méthodes pédagogiques de cette formation Bigdata :

• 6 à 12 personnes maximum par cours, 1 poste de travail par stagiaire
• Remise d’une documentation pédagogique papier ou numérique pendant le stage
• La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions

Formateur de cette formation Bigdata :

• Consultant-formateur expert Bigdata

Méthodes d'évaluation des acquis de cette formation Bigdata :

• Auto-évaluation des acquis par le stagiaire via un questionnaire
• Attestation de fin de stage adressée avec la facture

Contenu détaillé de cette formation Apache Mahout : analyse de données :


     Introduction

    • Présentation Mahout
    • Origine du projet, licence, positionnement dans l'offre BigData et Machine Learning : Hadoop, Spark,..
    • Fonctionnalités
    • Définitions : apprentissage supervisé, apprentissage automatique
    • Arbres de décision, de régression, régression automatique
    • Classifieurs. Scoring

     Architecture

    • Principe de fonctionnement
    • Sources de données, format de stockage des données
    • Génération de recommandations, traitement, filtrage
    • Mode local ou distribué

     Mise en oeuvre

    • Installation en mode autonome
    • Exemples de base : génération de recommandations, traitement, filtrage
    • Présentation des algorithmes les plus courants.
    • Compatibilité avec Hadoop Yarn, Spark, H2O, Flink
    • Installation en mode distribué sur une ferme Spark
    • Premiers pas avec le shell interactif REPL
    • Exemple avec une classification bayesienne naïve


INTER INTRA Classe virtuelle

Produit : Formation Bigdata

Code du stage : PYCB032

Certification(s) Préparée(s) : Non

Durée de la formation : 2 jours

Prix (HT) : 1180 €

Option déjeuner (HT) : 23 €/jour

PDF
Plan de cours PDF
Bulletin
Bulletin d'inscription
Prochaines sessions
décembre

14/12/2017

Contact
Mail
Au sujet de cette formation
Telephone
Tél. : 01 71 19 70 30
Autres formations
Haut de page