Formation Big Data : architectures et infrastructures

Référence : PYCB001
Durée : 14 heures
Certification : Non
Eligible CPF : Non

CONNAISSANCES PREALABLES

Il est demandé aux participants d'avoir une bonne culture générale sur les systèmes d'information

PROFIL DES STAGIAIRES

Chefs de projets, architectes, développeurs, data-scientists, et toute personne souhaitant connaître les outils et solutions pour mettre en place une architecture BigData

OBJECTIFS

Comprendre les concepts du BigData et savoir quelles sont les technologies implémentées
Savoir analyser les difficultés propres à un projet BigData, les freins, les apports, tant sur les aspects techniques que sur les points liés à la gestion du projet

METHODES PEDAGOGIQUES

La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions
Remise d’une documentation pédagogique papier ou numérique pendant le stage
Mise à disposition d’un poste de travail par participant

METHODES D'EVALUATION DES ACQUIS

Auto-évaluation des acquis par le stagiaire via un questionnaire
Attestation de fin de stage adressée avec la facture

FORMATEUR

Consultant-Formateur expert Bigdata

CONTENU DU COURS Bigdata

- Introduction

L'essentiel du BigData : calcul distribué, données non structurées.
Besoins fonctionnels et caractéristiques techniques des projets.
La valorisation des données.
Le positionnement respectif des technologies de cloud, BigData et noSQL, et les liens, implications.
Quelques éléments d'architecture.
L'écosystème du BigData : les acteurs, les produits, état de l'art.
Cycle de vie des projets BigData.
Emergence de nouveaux métiers : Datascientists, Data labs, …

- Stockage

Caractéristiques NoSQL : adaptabilité, extensibilité, structure de données proches des utilisateurs, développeurs
Les types de bases de données : clé/valeur, document, colonne, graphe
Données structurées et non structurées, documents, images, fichiers XML, JSON, CSV, …
Les différents modes et formats de stockage
Stockage réparti : réplication, sharding, gossip protocol, hachage
Systèmes de fichiers distribués : GFS, HDFS
Quelques exemples de produits et leurs caractéristiques : Cassandra, MongoDB, CouchDB, DynamoDB, Riak, Hadoop, HBase, BigTable, …
Qualité des données, gouvernance de données

- Indexation et recherche

Moteurs de recherche
Principe de fonctionnement
Méthodes d'indexation
Exemple de Lucene, et mise en œuvre avec solr
Recherche dans les bases de volumes importants : exemples de produits et comparaison : dremel, drill, elasticsearch, MapReduce

- Calcul et restitution, intégration

Différentes solutions : calculs en mode batch, ou en temps réel, sur des flux de données ou des données statiques
Les produits : langage de calculs statistiques, R Statistics Language, sas, RStudio
Ponts entre les outils statistiques et les bases BigData
Outils de calcul sur des volumes importants : storm en temps réel, hadoop en mode batch
Zoom sur Hadoop : complémentarité de HDFS et MapReduce
Restitution et analyse : logstash, kibana, elk, pentaho
Présentation de pig pour la conception de tâches MapReduce sur une grappe Hadoop

INTER
INTRA

Coût :

1 670,00 € HT

Dates et lieux de formation

caca

                                                    array(2) {
  [0]=>
  array(5) {
    ["code"]=>
    string(0) ""
    ["date"]=>
    string(10) "30/09/2025"
    ["guarantee"]=>
    bool(false)
    ["place"]=>
    string(5) "PARIS"
    ["city"]=>
    string(5) "PARIS"
  }
  [1]=>
  array(5) {
    ["code"]=>
    string(0) ""
    ["date"]=>
    string(10) "18/11/2025"
    ["guarantee"]=>
    bool(false)
    ["place"]=>
    string(5) "PARIS"
    ["city"]=>
    string(5) "PARIS"
  }
}

À DISTANCE

30/09/2025

18/11/2025

PARIS

30/09/2025

18/11/2025

Je m'inscris

Je demande un devis

Formulaire d'inscription

« * » indique les champs nécessaires

Formation sélectionnée

Merci de choisir la date de la session qui vous intéresse*

Afin de vous adresser le bon pour accord ou devis correspondant, merci de bien vouloir nous indiquer qui vous êtes :*

Salarié / Commanditaire / Agent public

Particulier / Indépendant

Vos informations

Civilité*

Nom*

Prénom*

E-mail*

Téléphone*

Fonction

Adresse*

Code postal*

Ville*

Notre référent handicap se tient à votre disposition au 01.71.19.70.30 ou par mail à referent.handicap@edugroupe.com pour recueillir vos éventuels besoins d’aménagements, afin de vous offrir la meilleure expérience possible.

Informations société

Société*

Téléphone*

Adresse*

Code postal*

Ville*

Ce champ est masqué lorsque l‘on voit le formulaire.

SIRET

Ce champ est masqué lorsque l‘on voit le formulaire.

N° TVA intracommunautaire

Pour cette inscription, vous êtes :*

Participant

Le responsable de l'inscription

Participant

Civilité*

Nom*

Prénom*

E-mail*

Téléphone*

Fonction*

Responsable

Civilité*

Nom*

Prénom*

E-mail*

Téléphone*

Fonction*

Une prise en charge OPCO est-elle prévu pour cette formation ?

Oui

Non

Le(s) participant(s)

Liste des participants

Civilité	Nom	Prénom	E-mail	Téléphone	Fonction	Suivi de la formation	Actions

Il n'y a pas de participants.

Validation et envoi

Apportez des précisions à votre demande, si besoin :

Comment avez-vous connu EduGroupe ?*

Comments

14H 1 670,00 € HT

07/07/2025 (prochaine session)DÉCOUVRIR

Formation Big Data : architectures et infrastructures

CONNAISSANCES PREALABLES

PROFIL DES STAGIAIRES

OBJECTIFS

METHODES PEDAGOGIQUES

METHODES D'EVALUATION DES ACQUIS

FORMATEUR

CONTENU DU COURS Bigdata

- Introduction

- Stockage

- Indexation et recherche

- Calcul et restitution, intégration

Dates et lieux de formation

À DISTANCE

PARIS

Formulaire d'inscription

Vos informations

Informations société

Participant

Responsable

Le(s) participant(s)

Validation et envoi

Autres formations qui pourraient vous intéresser

Bases de données

BigdataPython : Jupyter Notebook

BigdataPython : Jupyter Notebook

Bases de données

BigdataDask : mise en oeuvre, programmation

BigdataDask : mise en oeuvre, programmation

Bases de données

BigdataLes fondamentaux de l'analyse statistique avec R

BigdataLes fondamentaux de l'analyse statistique avec R

Bases de données

BigdataMachine Learning avec scikit-learn

BigdataMachine Learning avec scikit-learn

Bases de données

BigdataAnalyse d'images avec TensorFlow et Keras

BigdataAnalyse d'images avec TensorFlow et Keras

Bases de données

BigdataSpark ML

BigdataSpark ML

Bigdata
Python : Jupyter Notebook

Bigdata
Python : Jupyter Notebook

Bigdata
Dask : mise en oeuvre, programmation

Bigdata
Dask : mise en oeuvre, programmation

Bigdata
Les fondamentaux de l'analyse statistique avec R

Bigdata
Les fondamentaux de l'analyse statistique avec R

Bigdata
Machine Learning avec scikit-learn

Bigdata
Machine Learning avec scikit-learn

Bigdata
Analyse d'images avec TensorFlow et Keras

Bigdata
Analyse d'images avec TensorFlow et Keras

Bigdata
Spark ML

Bigdata
Spark ML