Formation Hadoop : Infrastructure sécurisée
- Référence : PYCB035
- Durée : 7 heures
- Certification : Non
- Eligible CPF : Non
CONNAISSANCES PREALABLES
- Connaissance des principes de base Hadoop et des bases de données
PROFIL DES STAGIAIRES
- Chefs de projet, administrateurs et toute personne souhaitant sécuriser une infrastructure Hadoop
OBJECTIFS
- Comprendre les mécanismes de sécurité Hadoop, et savoir les mettre en œuvre
METHODES PEDAGOGIQUES
- Mise à disposition d’un poste de travail par participant
- Remise d’une documentation pédagogique papier ou numérique pendant le stage
- La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions
METHODES D'EVALUATION DES ACQUIS
- Auto-évaluation des acquis par le stagiaire via un questionnaire
- Attestation de fin de stage adressée avec la facture
FORMATEUR
Consultant-Formateur expert Bigdata
CONTENU DU COURS Bigdata
1 - Introduction
- Rappels rapides sur l’écosystème Hadoop
- Le projet et les modules : Hadoop Common, HDFS, YARN, Spark, MapReduce
- Les risques et points à sécuriser dans un système distribué
2 - Architecture sécurité Hadoop
- Sécurisation réseau, système d’exploitation, les rôles Hadoop et stratégies
3 - Kerberos
- Principe de fonctionnement. Travaux pratiques: kerberisation d’une grappe Hadoop
4 - Sécurité des accès
- Authentification, autorisations, accounting.Travaux pratiques: gestion des autorisations dans HDFS, YARN, HBase
- Mise en œuvre des ACLs dans Zookeeper
5 - Apache Sentry
- Présentation du projet, architecture : sentry server, sentry plugin. Gestion de l’authentification et des droits d’accès aux données
- Travaux pratiques: intégration avec Hadoop
6 - Sécurité des données
- Cryptage des données stockées, et en transit
- Mécanisme de sécurité des données en entrée et en consultation par des accès clients : interface Hadoop en ligne de commande, sqoop, oozie, HBase, webHDFS, httpFS