Formation Hadoop Hbase : mise en œuvre et administration
- Référence : PYCB034
- Durée : 14 heures
- Certification : Non
- Eligible CPF : Non
CONNAISSANCES PREALABLES
- Connaissance des principes de base Hadoop et des bases de données
PROFIL DES STAGIAIRES
- Chefs de projet, administrateurs et toute personne souhaitant stocker des données avec Hbase
OBJECTIFS
- Comprendre le fonctionnement de HBase, savoir mettre en place une configuration distribuée
METHODES PEDAGOGIQUES
- Mise à disposition d’un poste de travail par participant
- Remise d’une documentation pédagogique papier ou numérique pendant le stage
- La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions
METHODES D'EVALUATION DES ACQUIS
- Auto-évaluation des acquis par le stagiaire via un questionnaire
- Attestation de fin de stage adressée avec la facture
FORMATEUR
Consultant-Formateur expert Bigdata
CONTENU DU COURS Bigdata
1 - Introduction
- Les fonctionnalités du framework Hadoop
- Le projet et les modules : Hadoop Common, HDFS, YARN, Spark, MapReduce
- Présentation HBase. Historique. Lien avec HDFS
- Format des données dans HBase
- Définitions : table, région, ligne, famille de colonnes,cellules, espace de nommage, …
- Fonctionnalités : failover automatique, sharding, interface avec des jobs MapReduce
- Rappels rapides sur l’écosystème Hadoop
2 - Architecture
- HBase master node, Region Master, liens avec les clients HBase
- Présentation du rôle de Zookeeper
3 - Installation
- Choix des packages
- Travaux pratiques : Interrogations depuis le serveur http intégré
- Installation en mode distribué
- Test de connexion avec hbase shell
- Démarrage en mode standalone start-hbase
- Installation et configuration dans le fichier conf/hbase-site.xml
4 - HBase utilisation : shell
- Présentation des différentes interfaces disponibles
- Présentation des espaces de nommage
- Mise en oeuvre de filtres de recherche, paramètres des tables
- Gestion des tables : principe des filtres
- Programmation de scripts
- Commandes de base, syntaxe, variables, manipulation des données : create, list, put, scan, get, désactiver une table ou l’effacer : disable (enable), drop, …
- Travaux pratiques avec hbase shell
5 - Cluster HBase
- Fonctionnement en mode distribué
- Première étape : fonctionnement indépendant des démons (HMaster, HRegionServer, Zookeeper)
- Passage au mode distribué : mise en œuvre avec HDFS dans un environnement distribué
- Travaux pratiques : sur un exemple de tables réparties : mise en œuvre des splits
6 - Programmation
- Introduction, les APIs (REST, Avro, Thrift, Java, Ruby, …)
- Utilisation d’un client Java
- Gestion des tables.Lien avec MapReduce
- Principe des accès JMX
- Travaux pratiques : création d’un client JMX