Calcul sur des tableaux avec Pandas

  • Référence : PYCB055
  • Durée : 1 jour (7 heures)
  • Certification : Non
  • Eligible CPF : Non

CONNAISSANCES PREALABLES

  • Connaissance de base de Python, notion de base de données

PROFIL DES STAGIAIRES

  • Chefs de projet, data-scientists, souhaitant traiter des données avec pandas

OBJECTIFS

  • Comprendre les manipulations de données dans les bibliothèques spécialisées Python
  • Savoir traiter des tableaux de données avec Pandas

METHODES PEDAGOGIQUES

  • 6 à 12 personnes maximum par cours, 1 poste de travail par stagiaire
  • Remise d’une documentation pédagogique papier ou numérique pendant le stage
  • La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions

METHODES D'EVALUATION DES ACQUIS

  • Auto-évaluation des acquis par le stagiaire via un questionnaire
  • Attestation de fin de stage adressée avec la facture

FORMATEUR

Consultant-Formateur expert Bigdata

CONTENU DU COURS

1 - Introduction

  • Historique
  • Pourquoi Pandas ? Comparaison avec les autres bibliothèques
  • Tour d’horizon des fonctionnalités
  • Utilité Pandas dans l’écosystème Big Data

2 - Manipulations de données

  • Syntaxe
  • Types de données : Serie, DataFrame, Panel
  • Construction d’un DataFrame
  • Indexation des données
  • Opérations élémentaires : arithmétique, tris, affichage

3 - Calculs avancés

  • Algèbre relationnelle
  • Modification de la structure d’un DataFrame : ajout de colonne, renommage d’un champ
  • Tables pivot, croisement de données

4 - Mise en oeuvre pratique

  • Lecture et écriture de fichiers textes
  • Traitement des données manquantes
  • Travail Pratique : extraction, traitement et analyse de données CSV
cookie