Formation Les fondamentaux de l’analyse statistique avec R

  • Référence : PYCB052B
  • Durée : 14 heures
  • Certification : Non
  • Eligible CPF : Non

CONNAISSANCES PREALABLES

  • Avoir des connaissances de base en statistiques

PROFIL DES STAGIAIRES

  • Ingénieurs, Data analysts, statisticiens, développeurs en environnement statistique ou toute personne intéressée par l'analyse statistique avec R

OBJECTIFS

  • Être capable de réaliser une analyse statistique avec le logiciel R
  • En restituer les résultats sous forme graphique

METHODES PEDAGOGIQUES

  • 6 à 12 personnes maximum par cours, 1 poste de travail par stagiaire
  • Remise d’une documentation pédagogique papier ou numérique pendant le stage
  • La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions

METHODES D'EVALUATION DES ACQUIS

  • Auto-évaluation des acquis par le stagiaire via un questionnaire
  • Attestation de fin de stage adressée avec la facture

FORMATEUR

Consultant-Formateur expert Bigdata

CONTENU DU COURS Bigdata

1 - Savoir installer et utiliser l’environnement d'analyse R

  • Utilisation de R en mode commande
  • Commandes de base. Syntaxe de base. Interfaces et environnements : RStudio, Jupyter
  • Opérations de base. Expressions, variables, types de données, nombres, chaînes de caractères
  • Exemple de Travaux Pratiques : installation et tests d’une plateforme R
  • Le projet R Programming. R Project

2 - Comprendre comment manipuler des données avec R

  • Base de R : tests, boucles, fonctions
  • Transformations de données, conversions de types
  • Fonctions mathématiques de base
  • Exemple de Travaux Pratiques : conversion de données numériques en texte. conversion de données texte en nombres

3 - Savoir reconnaître les différents types d'objets de R

  • Manipulations de nombres, vecteurs, tableaux, matrices, listes, factors
  • Exemple de Travaux Pratiques : exercices sur les objets R (matrice, vecteur)
  • Matrices : équations linéaires, inversion, valeur propre, vecteur propre, déterminant, moindre carré, …
  • Opérations de base : produit de tableaux, transposition, produits de matrices
  • Tableaux et matrices : Déclaration, dimensionnement, indexation
  • Attachement, détachement. Chargement d’un dataframe. La fonction scan
  • Liste et DataFrames : Définitions, cas d’utilisation

4 - Savoir importer et exporter des données

  • Import/export : formats texte, csv, xml, binaire, largeur fixe, images (jpeg, png)
  • Exemple de Travaux Pratiques : importation de données géodésiques et export au format Json
  • Importation SQL. Importation depuis un socket réseau
  • Transformation d’un dataframe R en un dataframe Spark
  • Interfaçage avec le BigData : SparkR
  • Encodage. Filtrage. Bibliothèques : rjson, readr, xml2

5 - Créer des programmes d'analyse avec R

  • Structure générale d’un programme d’analyse. Découpage en sections métiers. Notion d’ETL
  • Fonctions spécifiques : définition de nouvelles fonctions. Appels. Passage d’argument
  • Construction d’une bibliothèque
  • Diffusion, installation avec R CMD INSTALL
  • Exemple de Travaux Pratiques : construction d’un programme de calcul de moyennes en trois parties : chargement, calcul, restitution

6 - Être en mesure de réaliser des analyses statistiques basiques avec R

  • Statistiques : Distributions embarquées : uniforme, normale, poisson, exponentielle, …
  • Calculs statistiques. Modèles statistiques
  • Exemple de Travuax Pratiques : analyse statistique d’une population

7 - Savoir restituer des résultats à l'aide de graphiques

  • Affichage en graphes, histogrammes : Plot, Line, Pie Charts, Scatterplot, Bars
  • Exemple de Travaux Pratiques : affichage des données de l’atelier précédent sous forme de nuage de points
Cookies