Big Data on Amazon Web Services (AWS)

LiveOnLine Certifiant
  • Référence : AWS-BIGD
  • Durée : 3 jours (21 heures)
  • Certification : AWS Big Data
  • Eligible CPF : Non

CONNAISSANCES PREALABLES

  • 1-Avoir des connaissances de base sur les technologies Big Data, notamment Apache Hadoop et HDFS Pig, Hive et MapReduce
  • 2-La compréhension des concepts d'entrepôt de données, de système de base de données relationnelle et de conception de base données est recommandée.
  • 3-Les participants doivent avoir suivi le cours Notions de base AWS ou posséder un niveau d'expérience équivalent
  • 4-Savoir utiliser les principaux services AWS et l'implémentation de cloud public
  • 5-Avoir des connaissances de base en langue anglaise car le support de cours et l'examen sont en langue anglaise

PROFIL DES STAGIAIRES

  • Personnes en charge de la conception et de l'implémentation de solutions de Big Data, c'est-à-dire les architectes de solutions ainsi que les analystes de données souhaitant découvrir les solutions de Big Data sur AWS.

OBJECTIFS

  • Solutions Fit AWS au sein d’un écosystème Big Data
  • Comprendre les applications Apache Hadoop dans le contexte d’Amazon EMR
  • Identifier les composants d’un cluster Amazon EMR
  • Lancer et configurer un cluster Amazon EMR
  • Utiliser les frameworks de programmation courants disponibles pour Amazon EMR notamment Hive, Pig and Streaming
  • Utiliser Hue pour améliorer la facilité d’utilisation de Amazon EMR
  • Utiliser les analyses en mémoire avec Spark sur Amazon EMR
  • Choisir les options de stockage de données appropriées
  • Identifier les avantages de l’utilisation de Amazon Kinesis pour le process Big Data proches du temps réel
  • Utiliser Amazon Redshift pour stocker et analyser efficacement les données
  • Comprendre et gérer les coûts et la sécurité d’une solution Big Data
  • Sécuriser une solution Big Data
  • Identifier les options pour récupérer, transférer et compresser des données
  • Comprendre Amazon Athena pour les analyses de requêtes ad-hoc
  • Utiliser le logiciel de visualisation pour représenter les données et les requêtes via Amazon QuickSight
  • Orchestrer le flux de la Big Data via AWS Data Pipeline

METHODES PEDAGOGIQUES

  • 6 à 12 personnes maximum par cours, 1 poste de travail par stagiaire
  • Remise d’une documentation pédagogique papier ou numérique pendant le stage
  • La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions

METHODES D'EVALUATION DES ACQUIS

  • Auto-évaluation des acquis par le stagiaire via un questionnaire
  • Attestation de fin de stage adressée avec la facture

FORMATEUR

Consultant-Formateur expert Amazon Web Services

CONTENU DU COURS

1 - Jour 1

  • Vue d’ensemble de la Big data
  • Récupérer et transférer la Big Data
  • Streaming Big Data et Amazon Kinesis
  • Solutions de stockage Big Data
  • Process Big Data et Analyse

2 - Jour 2

  • Apache Hadoop et Amazon EMR
  • Utiliser Amazon EMR
  • Frameworks de programmation Hadoop
  • Inetrfaces Web sur Amazon EMR
  • Apache Spark sur Amazon EMR

3 - Jour 3

  • Amazon Redshift et Big Data
  • Visualiser et Orchestrer la Big Data
  • Gérer les coûts de la Big Data
  • Sécuriser les déploiements de votre Amazon
  • Modèles de conception Big Data

4 - Certification AWS Certified Big Data

  • Cette formation prépare au passage de la certification AWS Certified Big Data