Formation Hadoop Hbase : mise en œuvre et administration

Référence : PYCB034
Durée : 14 heures
Certification : Non
Eligible CPF : Non

CONNAISSANCES PREALABLES

Connaissance des principes de base Hadoop et des bases de données

PROFIL DES STAGIAIRES

Chefs de projet, administrateurs et toute personne souhaitant stocker des données avec Hbase

OBJECTIFS

Comprendre le fonctionnement de HBase, savoir mettre en place une configuration distribuée

METHODES PEDAGOGIQUES

Mise à disposition d’un poste de travail par participant
Remise d’une documentation pédagogique papier ou numérique pendant le stage
La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions

METHODES D'EVALUATION DES ACQUIS

Auto-évaluation des acquis par le stagiaire via un questionnaire
Attestation de fin de stage adressée avec la facture

FORMATEUR

Consultant-Formateur expert Bigdata

CONTENU DU COURS Bigdata

1 - Introduction

Rappels rapides sur l’écosystème Hadoop
Les fonctionnalités du framework Hadoop
Le projet et les modules : Hadoop Common, HDFS, YARN, Spark, MapReduce
Présentation HBase. Historique. Lien avec HDFS
Format des données dans HBase
Définitions : table, région, ligne, famille de colonnes,cellules, espace de nommage, …
Fonctionnalités : failover automatique, sharding, interface avec des jobs MapReduce

2 - Architecture

HBase master node, Region Master, liens avec les clients HBase
Présentation du rôle de Zookeeper

3 - Installation

Choix des packages
Installation et configuration dans le fichier conf/hbase-site.xml
Démarrage en mode standalone start-hbase
Test de connexion avec hbase shell
Installation en mode distribué
Travaux pratiques : Interrogations depuis le serveur http intégré

4 - HBase utilisation : shell

Présentation des différentes interfaces disponibles
Travaux pratiques avec hbase shell
Commandes de base, syntaxe, variables, manipulation des données : create, list, put, scan, get, désactiver une table ou l’effacer : disable (enable), drop, …
Programmation de scripts
Gestion des tables : principe des filtres
Mise en oeuvre de filtres de recherche, paramètres des tables
Présentation des espaces de nommage

5 - Cluster HBase

Fonctionnement en mode distribué
Première étape : fonctionnement indépendant des démons (HMaster, HRegionServer, Zookeeper)
Passage au mode distribué : mise en œuvre avec HDFS dans un environnement distribué
Travaux pratiques : sur un exemple de tables réparties : mise en œuvre des splits

6 - Programmation

Introduction, les APIs (REST, Avro, Thrift, Java, Ruby, …)
Utilisation d’un client Java
Gestion des tables.Lien avec MapReduce
Principe des accès JMX
Travaux pratiques : création d’un client JMX

Coût :

1 510,00 € HT

Dates et lieux de formation

06/05/2024
EduGroupe
19/09/2024
EduGroupe
05/12/2024
EduGroupe

Je m'inscris

Je demande un devis

Coût :

1 510,00 € HT

Dates des formations

06/05/2024
19/09/2024
05/12/2024

Je m'inscris

Autres formations qui pourraient vous intéresser

Bases de données

Bigdata
Python : Jupyter Notebook

7H 770,00 € HT

Bigdata
Python : Jupyter Notebook

7H 770,00 € HT

17/06/2024 (prochaine session)DÉCOUVRIR

Bases de données

Bigdata
Dask : mise en oeuvre, programmation

21H 2 420,00 € HT

Bigdata
Dask : mise en oeuvre, programmation

21H 2 420,00 € HT

13/05/2024 (prochaine session)DÉCOUVRIR

Bases de données

Bigdata
Les fondamentaux de l'analyse statistique avec R

14H 1 610,00 € HT

Bigdata
Les fondamentaux de l'analyse statistique avec R

14H 1 610,00 € HT

24/06/2024 (prochaine session)DÉCOUVRIR

Bases de données

Bigdata
Machine Learning avec scikit-learn

14H 1 610,00 € HT

Bigdata
Machine Learning avec scikit-learn

14H 1 610,00 € HT

17/06/2024 (prochaine session)DÉCOUVRIR

Bases de données

Bigdata
Analyse d'images avec TensorFlow et Keras

21H 2 190,00 € HT

Bigdata
Analyse d'images avec TensorFlow et Keras

21H 2 190,00 € HT

Aucune session prévueDÉCOUVRIR

Bases de données

Bigdata
TensorFlow avancé

14H 1 610,00 € HT

Bigdata
TensorFlow avancé

14H 1 610,00 € HT

06/06/2024 (prochaine session)DÉCOUVRIR

Cookies