Python pour Data-scientist

  • Référence : DELY010
  • Durée : 3 jours (21 heures)
  • Certification : Non
  • Eligible CPF : Non

CONNAISSANCES PREALABLES

  • Maîtrise de la programmation Python

PROFIL DES STAGIAIRES

  • Les développeurs en Python

OBJECTIFS

  • Savoir utiliser les principaux outils de traitement et d'analyse de données pour Python
  • Savoir extraire des données d'un fichier et les manipuler
  • Mettre en place un modèle d'apprentissage simple

METHODES PEDAGOGIQUES

  • 6 à 12 personnes maximum par cours, 1 poste de travail par stagiaire
  • Remise d’une documentation pédagogique papier ou numérique pendant le stage
  • La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions

METHODES D'EVALUATION DES ACQUIS

  • Auto-évaluation des acquis par le stagiaire via un questionnaire
  • Attestation de fin de stage adressée avec la facture

FORMATEUR

Consultant-Formateur expert Bigdata

CONTENU DU COURS

1 - Positionnement Python

  • Besoins des data-scientist:calculs, analyse d’images, machine learning, interface avec les bases de données
  • Apports de python:grande variété d’outils, expertise dans le domaine du calcul scientifique
  • Tour d’horizon des outils : pandas, agate, bokeh, scikit-learn, pybrain, tensorflow, keras, mxnet, caffe

2 - Calculs et graphiques

  • NumPy : Base du calcul sur des tableaux
  • SciPy : Scientific Tools for Python, couche scientifique
  • Manipulation de tableaux, fonctions mathématiques
  • Représentation graphique avec basemap et matplotlib
  • Mise en oeuvre de SciPy/NumPy : manipulation d’images, détection de contours

3 - Manipulation de données relationnelles

  • Pandas : manipulation de tables de données
  • Tableaux avec Pandas : indexation, opérations, algèbre relationnelle
  • Stockage dans des fichiers : CSV, h5py, netCDF
  • Comparaison et performances Pandas / NumPy

4 - Machine learning et deep learning

  • Présentation de TensorFlow, scikit-learn, keras ,mxnet, caffe
  • TensorFlow : principe de fonctionnement, plate-formes supportées, distribution, APIs fournies en standard, modèles d’apprentissage
  • Projet scikit-learn : classification, régression, validation de modèles prédictifs
  • Démonstrations avec les modèles fournis par scikit-learn
  • Positionnement et comparaison avec Keras, mxnet, caffe
cookie