Formation Hadoop Hbase : mise en œuvre et administration

Référence : PYCB034
Durée : 14 heures
Certification : Non
Eligible CPF : Non

CONNAISSANCES PREALABLES

Connaissance des principes de base Hadoop et des bases de données

PROFIL DES STAGIAIRES

Chefs de projet, administrateurs et toute personne souhaitant stocker des données avec Hbase

OBJECTIFS

Comprendre le fonctionnement de HBase, savoir mettre en place une configuration distribuée

METHODES PEDAGOGIQUES

Mise à disposition d’un poste de travail par participant
Remise d’une documentation pédagogique papier ou numérique pendant le stage
La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions

METHODES D'EVALUATION DES ACQUIS

Auto-évaluation des acquis par le stagiaire via un questionnaire
Attestation des compétences acquises envoyée au stagiaire
Attestation de fin de stage adressée avec la facture

FORMATEUR

Consultant-Formateur expert Bigdata

CONTENU DU COURS Bigdata

- Introduction

Rappels rapides sur l'écosystème Hadoop
Les fonctionnalités du framework Hadoop
Le projet et les modules : Hadoop Common, HDFS, YARN, Spark, MapReduce
Présentation HBase. Historique. Lien avec HDFS
Format des données dans HBase
Définitions : table, région, ligne, famille de colonnes,cellules, espace de nommage, …
Fonctionnalités : failover automatique, sharding, interface avec des jobs MapReduce

- Architecture

HBase master node, Region Master, liens avec les clients HBase
Présentation du rôle de Zookeeper

- Installation

Choix des packages
Installation et configuration dans le fichier conf/hbase-site.xml
Démarrage en mode standalone start-hbase
Test de connexion avec hbase shell
Installation en mode distribué
Travaux pratiques : Interrogations depuis le serveur http intégré

- HBase utilisation : shell

Présentation des différentes interfaces disponibles
Travaux pratiques avec hbase shell
Commandes de base, syntaxe, variables, manipulation des données : create, list, put, scan, get, désactiver une table ou l'effacer : disable (enable), drop, …
Programmation de scripts
Gestion des tables : principe des filtres
Mise en oeuvre de filtres de recherche, paramètres des tables
Présentation des espaces de nommage

- Cluster HBase

Fonctionnement en mode distribué
Première étape : fonctionnement indépendant des démons (HMaster, HRegionServer, Zookeeper)
Passage au mode distribué : mise en œuvre avec HDFS dans un environnement distribué
Travaux pratiques : sur un exemple de tables réparties : mise en œuvre des splits

- Programmation

Introduction, les APIs (REST, Avro, Thrift, Java, Ruby, …)
Utilisation d'un client Java
Gestion des tables.Lien avec MapReduce
Principe des accès JMX
Travaux pratiques : création d'un client JMX

INTER
INTRA

Coût :

1 570,00 € HT

Dates et lieux de formation

caca

                                                    array(2) {
  [0]=>
  array(5) {
    ["code"]=>
    string(0) ""
    ["date"]=>
    string(10) "22/10/2025"
    ["guarantee"]=>
    bool(true)
    ["place"]=>
    string(5) "PARIS"
    ["city"]=>
    string(5) "PARIS"
  }
  [1]=>
  array(5) {
    ["code"]=>
    string(0) ""
    ["date"]=>
    string(10) "05/12/2025"
    ["guarantee"]=>
    bool(false)
    ["place"]=>
    string(5) "PARIS"
    ["city"]=>
    string(5) "PARIS"
  }
}

À DISTANCE

22/10/2025 (Session garantie)

05/12/2025

PARIS

22/10/2025 (Session garantie)

05/12/2025

Je m'inscris

Je demande un devis

Formulaire d'inscription

« * » indique les champs nécessaires

Formation sélectionnée

Merci de choisir la date de la session qui vous intéresse*

Afin de vous adresser le bon pour accord ou devis correspondant, merci de bien vouloir nous indiquer qui vous êtes :*

Salarié / Commanditaire / Agent public

Particulier / Indépendant

Vos informations

Civilité*

Nom*

Prénom*

E-mail*

Téléphone*

Fonction

Adresse*

Code postal*

Ville*

Notre référent handicap se tient à votre disposition au 01.71.19.70.30 ou par mail à [email protected] pour recueillir vos éventuels besoins d’aménagements, afin de vous offrir la meilleure expérience possible.

Informations société

Société*

Téléphone*

Adresse*

Code postal*

Ville*

Ce champ est masqué lorsque l‘on voit le formulaire.

SIRET

Ce champ est masqué lorsque l‘on voit le formulaire.

N° TVA intracommunautaire

Pour cette inscription, vous êtes :*

Participant

Le responsable de l'inscription

Participant

Civilité*

Nom*

Prénom*

E-mail*

Téléphone*

Fonction*

Responsable

Civilité*

Nom*

Prénom*

E-mail*

Téléphone*

Fonction*

Une prise en charge OPCO est-elle prévu pour cette formation ?

Oui

Non

Le(s) participant(s)

Liste des participants

Civilité	Nom	Prénom	E-mail	Téléphone	Fonction	Suivi de la formation	Actions

Il n'y a pas de participants.

Validation et envoi

Apportez des précisions à votre demande, si besoin :

Comment avez-vous connu EduGroupe ?*

Comments

14H 1 670,00 € HT

11/12/2025 (prochaine session)DÉCOUVRIR

Formation Hadoop Hbase : mise en œuvre et administration

CONNAISSANCES PREALABLES

PROFIL DES STAGIAIRES

OBJECTIFS

METHODES PEDAGOGIQUES

METHODES D'EVALUATION DES ACQUIS

FORMATEUR

CONTENU DU COURS Bigdata

- Introduction

- Architecture

- Installation

- HBase utilisation : shell

- Cluster HBase

- Programmation

Dates et lieux de formation

À DISTANCE

PARIS

Formulaire d'inscription

Vos informations

Informations société

Participant

Responsable

Le(s) participant(s)

Validation et envoi

Autres formations qui pourraient vous intéresser

Bases de données

BigdataPython : Jupyter Notebook

BigdataPython : Jupyter Notebook

Bases de données

BigdataDask : mise en oeuvre, programmation

BigdataDask : mise en oeuvre, programmation

Bases de données

BigdataLes fondamentaux de l'analyse statistique avec R

BigdataLes fondamentaux de l'analyse statistique avec R

Bases de données

BigdataMachine Learning avec scikit-learn

BigdataMachine Learning avec scikit-learn

Bases de données

BigdataAnalyse d'images avec TensorFlow et Keras

BigdataAnalyse d'images avec TensorFlow et Keras

Bases de données

BigdataSpark ML

BigdataSpark ML

Bigdata
Python : Jupyter Notebook

Bigdata
Python : Jupyter Notebook

Bigdata
Dask : mise en oeuvre, programmation

Bigdata
Dask : mise en oeuvre, programmation

Bigdata
Les fondamentaux de l'analyse statistique avec R

Bigdata
Les fondamentaux de l'analyse statistique avec R

Bigdata
Machine Learning avec scikit-learn

Bigdata
Machine Learning avec scikit-learn

Bigdata
Analyse d'images avec TensorFlow et Keras

Bigdata
Analyse d'images avec TensorFlow et Keras

Bigdata
Spark ML

Bigdata
Spark ML