Formation Data Science – les fondamentaux
- Référence : DATASC
- Durée : 1 jour (7 heures)
- Certification : Non
- Eligible CPF : Non
CONNAISSANCES PREALABLES
- Connaître l’utilité du Data Mining et les problématiques du Big Data dans les approches statistiques
PROFIL DES STAGIAIRES
- Ingénieurs, analystes, responsables marketing
- Toute personne intéressée par les techniques de Data Science
OBJECTIFS
- Découvrir le monde de la Data Science et les grandes problématiques associées
- Comprendre comment modéliser un problème de Data Science
- Découvrir l'intérêt des algorithmes
- Disposer d'une première approche du Deep Learning
METHODES PEDAGOGIQUES
- 6 à 12 personnes maximum par cours, 1 poste de travail par stagiaire
- Remise d’une documentation pédagogique papier ou numérique pendant le stage
- La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions
METHODES D'EVALUATION DES ACQUIS
- Auto-évaluation des acquis par le stagiaire via un questionnaire
- Attestation de fin de stage adressée avec la facture
FORMATEUR
Consultant-Formateur expert Bigdata
CONTENU DU COURS
1 - Introduction
- Compétences
- Data Science
- Machine Learning
- Big data
- Deep learning
- L’apprentissage machine
2 - Les fondamentaux
- Approche fonctionnelle de base
- Les variables prédictives
- Les variables à prédire
- Les fonctions hypothèses
- Les estimateurs (biais et variances)
- Le compromis biais – variance
- Les fonctions de perte
- La régularisation des paramètres
- Optimisation des paramètres
3 - La classification
- Régression logistique
- Machines à vecteurs de support (SVM)
- Arbres de décisions
- K plus proches voisins (kNN)
4 - Les pratiques
- Prétraitement
- Compressions des données
- Réglages des modèles
5 - L'apprentissage d'ensembles
- Principes de l’apprentissage d’ensemble
- Les forêts aléatoires
- Le gradient boosting
6 - La régression
- Principes de la régression
- Explorations des données régressives
- Performance des modèles de régression
7 - Le clustering
- Les k-moyens (kMeans)
- Le clustering hiérarchique
- L’approche DBSCAN
8 - Le Deep Learning
- Perceptron
- Réseaux neuronaux multicouches (MLP)
- Réseaux neuronaux convolutifs (CNN)