Formation Big Data : intégration SQL, hive, SparkDataframes

Référence : PYCB045
Durée : 14 heures
Certification : Non
Eligible CPF : Non

CONNAISSANCES PREALABLES

Connaissance générale des systèmes d'informations et des bases de données

PROFIL DES STAGIAIRES

Experts en bases de données, chefs de projet
Toute personne souhaitant comprendre le fonctionnement et les apports des bases NoSQL

OBJECTIFS

Connaître les caractéristiques techniques des bases de données NoSQL, les différentes solutions disponibles
Identifier les critères de choix

METHODES PEDAGOGIQUES

6 à 12 personnes maximum par cours, 1 poste de travail par stagiaire
Remise d’une documentation pédagogique papier ou numérique pendant le stage
La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions

METHODES D'EVALUATION DES ACQUIS

Auto-évaluation des acquis par le stagiaire via un questionnaire
Attestation des compétences acquises envoyée au stagiaire
Attestation de fin de stage adressée avec la facture

FORMATEUR

Consultant-Formateur expert Bigdata

CONTENU DU COURS Bigdata

- Présentation

Besoin
Comment concilier le quoi et le comment ?
Faciliter la manipulation de gros volumes de données en conservant une approche utilisateurs
Rappels sur le stockage : HDFS, Cassandra, HBase et les formats de données : parquet, orc, raw, clés/valeurs
Les outils : Hive, Impala, Tez, Presto, Drill, Pig, Spark/QL

- Hive et Pig

Présentation
Mode de fonctionnement
Rappel sur map/reduce
Hive : le langage HiveQL. Exemples
Pig : le langage pig/latin. Exemples

- Impala

Présentation
Cadre d'utilisation
Contraintes
Liaison avec le métastore Hive
Travail Pratique : Mise en évidence des performances

- Presto

Cadre d'utilisation
Sources de données utilisables
Travail Pratique : Mise en oeuvre d'une requête s'appuyant sur Cassandra, HDFS et PostgreSQL

- Spark DataFrame

Les différentes approches
Syntaxe Spark/SQl
APIs QL
Compilation catalyst
Syntaxe, opérateurs
Comparaison avec Presto
Travail Pratique : Mise en oeuvre d'une requête s'appusant sur HBase et HDFS

- Drill/sqoop

Utilisation d'APIs JDBC, ODBC
Indépendance Hadoop
Contraintes d'utilisation
Performances

- Comparatifs

Compatibilité ANSI/SQL
Approches des différents produits
Critères de choix

INTER
INTRA

Coût :

1 570,00 € HT

Filière :

Big Data

Dates et lieux de formation

caca

                                                    array(2) {
  [0]=>
  array(5) {
    ["code"]=>
    string(0) ""
    ["date"]=>
    string(10) "11/09/2025"
    ["guarantee"]=>
    bool(false)
    ["place"]=>
    string(5) "PARIS"
    ["city"]=>
    string(5) "PARIS"
  }
  [1]=>
  array(5) {
    ["code"]=>
    string(0) ""
    ["date"]=>
    string(10) "27/11/2025"
    ["guarantee"]=>
    bool(false)
    ["place"]=>
    string(5) "PARIS"
    ["city"]=>
    string(5) "PARIS"
  }
}

À DISTANCE

11/09/2025

27/11/2025

PARIS

11/09/2025

27/11/2025

Je m'inscris

Je demande un devis

Formulaire d'inscription

« * » indique les champs nécessaires

Formation sélectionnée

Merci de choisir la date de la session qui vous intéresse*

Afin de vous adresser le bon pour accord ou devis correspondant, merci de bien vouloir nous indiquer qui vous êtes :*

Salarié / Commanditaire / Agent public

Particulier / Indépendant

Vos informations

Civilité*

Nom*

Prénom*

E-mail*

Téléphone*

Fonction

Adresse*

Code postal*

Ville*

Notre référent handicap se tient à votre disposition au 01.71.19.70.30 ou par mail à referent.handicap@edugroupe.com pour recueillir vos éventuels besoins d’aménagements, afin de vous offrir la meilleure expérience possible.

Informations société

Société*

Téléphone*

Adresse*

Code postal*

Ville*

Ce champ est masqué lorsque l‘on voit le formulaire.

SIRET

Ce champ est masqué lorsque l‘on voit le formulaire.

N° TVA intracommunautaire

Pour cette inscription, vous êtes :*

Participant

Le responsable de l'inscription

Participant

Civilité*

Nom*

Prénom*

E-mail*

Téléphone*

Fonction*

Responsable

Civilité*

Nom*

Prénom*

E-mail*

Téléphone*

Fonction*

Une prise en charge OPCO est-elle prévu pour cette formation ?

Oui

Non

Le(s) participant(s)

Liste des participants

Civilité	Nom	Prénom	E-mail	Téléphone	Fonction	Suivi de la formation	Actions

Il n'y a pas de participants.

Validation et envoi

Apportez des précisions à votre demande, si besoin :

Comment avez-vous connu EduGroupe ?*

14H 1 670,00 € HT

06/10/2025 (prochaine session)DÉCOUVRIR

Formation Big Data : intégration SQL, hive, SparkDataframes

CONNAISSANCES PREALABLES

PROFIL DES STAGIAIRES

OBJECTIFS

METHODES PEDAGOGIQUES

METHODES D'EVALUATION DES ACQUIS

FORMATEUR

CONTENU DU COURS Bigdata

- Présentation

- Hive et Pig

- Impala

- Presto

- Spark DataFrame

- Drill/sqoop

- Comparatifs

Dates et lieux de formation

À DISTANCE

PARIS

Formulaire d'inscription

Vos informations

Informations société

Participant

Responsable

Le(s) participant(s)

Validation et envoi

Autres formations qui pourraient vous intéresser

Bases de données

BigdataPython : Jupyter Notebook

BigdataPython : Jupyter Notebook

Bases de données

BigdataDask : mise en oeuvre, programmation

BigdataDask : mise en oeuvre, programmation

Bases de données

BigdataLes fondamentaux de l'analyse statistique avec R

BigdataLes fondamentaux de l'analyse statistique avec R

Bases de données

BigdataMachine Learning avec scikit-learn

BigdataMachine Learning avec scikit-learn

Bases de données

BigdataAnalyse d'images avec TensorFlow et Keras

BigdataAnalyse d'images avec TensorFlow et Keras

Bases de données

BigdataSpark ML

BigdataSpark ML

Bigdata
Python : Jupyter Notebook

Bigdata
Python : Jupyter Notebook

Bigdata
Dask : mise en oeuvre, programmation

Bigdata
Dask : mise en oeuvre, programmation

Bigdata
Les fondamentaux de l'analyse statistique avec R

Bigdata
Les fondamentaux de l'analyse statistique avec R

Bigdata
Machine Learning avec scikit-learn

Bigdata
Machine Learning avec scikit-learn

Bigdata
Analyse d'images avec TensorFlow et Keras

Bigdata
Analyse d'images avec TensorFlow et Keras

Bigdata
Spark ML

Bigdata
Spark ML