Hadoop : Infrastructure sécurisée

  • Référence : PYCB035
  • Durée : 1 jour (7 heures)
  • Certification : Non
  • Eligible CPF : Non

CONNAISSANCES PREALABLES

  • Connaissance des principes de base Hadoop et des bases de données

PROFIL DES STAGIAIRES

  • Chefs de projet, administrateurs et toute personne souhaitant sécuriser une infrastructure Hadoop

OBJECTIFS

  • Comprendre les mécanismes de sécurité Hadoop, et savoir les mettre en œuvre

METHODES PEDAGOGIQUES

  • Mise à disposition d’un poste de travail par participant
  • Remise d’une documentation pédagogique papier ou numérique pendant le stage
  • La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions

METHODES D'EVALUATION DES ACQUIS

  • Auto-évaluation des acquis par le stagiaire via un questionnaire
  • Attestation de fin de stage adressée avec la facture

FORMATEUR

Consultant-Formateur expert Bigdata

CONTENU DU COURS

1 - Introduction

  • Rappels rapides sur l’écosystème Hadoop
  • Le projet et les modules : Hadoop Common, HDFS, YARN, Spark, MapReduce
  • Les risques et points à sécuriser dans un système distribué

2 - Architecture sécurité Hadoop

  • Sécurisation réseau, système d’exploitation, les rôles Hadoop et stratégies

3 - Kerberos

  • Principe de fonctionnement. Travaux pratiques: kerberisation d’une grappe Hadoop

4 - Sécurité des accès

  • Authentification, autorisations, accounting.Travaux pratiques: gestion des autorisations dans HDFS, YARN, HBase
  • Mise en œuvre des ACLs dans Zookeeper

5 - Apache Sentry

  • Présentation du projet, architecture : sentry server, sentry plugin. Gestion de l’authentification et des droits d’accès aux données
  • Travaux pratiques: intégration avec Hadoop

6 - Sécurité des données

  • Cryptage des données stockées, et en transit
  • Mécanisme de sécurité des données en entrée et en consultation par des accès clients : interface Hadoop en ligne de commande, sqoop, oozie, HBase, webHDFS, httpFS
cookie