Data Science – les fondamentaux

  • Référence : DATASC
  • Durée : 1 jour (7 heures)
  • Certification : Non
  • Eligible CPF : Non

CONNAISSANCES PREALABLES

  • Connaître l’utilité du Data Mining et les problématiques du Big Data dans les approches statistiques

PROFIL DES STAGIAIRES

  • Ingénieurs, analystes, responsables marketing
  • Toute personne intéressée par les techniques de Data Science

OBJECTIFS

  • Découvrir le monde de la Data Science et les grandes problématiques associées
  • Comprendre comment modéliser un problème de Data Science
  • Découvrir l'intérêt des algorithmes
  • Disposer d'une première approche du Deep Learning

METHODES PEDAGOGIQUES

  • 6 à 12 personnes maximum par cours, 1 poste de travail par stagiaire
  • Remise d’une documentation pédagogique papier ou numérique pendant le stage
  • La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions

METHODES D'EVALUATION DES ACQUIS

  • Auto-évaluation des acquis par le stagiaire via un questionnaire
  • Attestation de fin de stage adressée avec la facture

FORMATEUR

Consultant-Formateur expert Bigdata

CONTENU DU COURS

1 - Introduction

  • Compétences
  • Data Science
  • Machine Learning
  • Big data
  • Deep learning
  • L’apprentissage machine

2 - Les fondamentaux

  • Approche fonctionnelle de base
  • Les variables prédictives
  • Les variables à prédire
  • Les fonctions hypothèses
  • Les estimateurs (biais et variances)
  • Le compromis biais – variance
  • Les fonctions de perte
  • La régularisation des paramètres
  • Optimisation des paramètres

3 - La classification

  • Régression logistique
  • Machines à vecteurs de support (SVM)
  • Arbres de décisions
  • K plus proches voisins (kNN)

4 - Les pratiques

  • Prétraitement
  • Compressions des données
  • Réglages des modèles

5 - L'apprentissage d'ensembles

  • Principes de l’apprentissage d’ensemble
  • Les forêts aléatoires
  • Le gradient boosting

6 - La régression

  • Principes de la régression
  • Explorations des données régressives
  • Performance des modèles de régression

7 - Le clustering

  • Les k-moyens (kMeans)
  • Le clustering hiérarchique
  • L’approche DBSCAN

8 - Le Deep Learning

  • Perceptron
  • Réseaux neuronaux multicouches (MLP)
  • Réseaux neuronaux convolutifs (CNN)
cookie