Formation ElasticStack : indexation de contenu

  • Référence : PYCB021
  • Durée : 14 heures
  • Certification : Non
  • Eligible CPF : Non

CONNAISSANCES PREALABLES

  • 1- Connaissances générales des systèmes d'information, et des systèmes d'exploitation (Linux ou Windows)
  • 2- Les travaux pratiques sont réalisés sur Linux
  • 3- Connaissance d'un langage de programmation structuré

PROFIL DES STAGIAIRES

  • Architectes techniques, développeurs, analystes

OBJECTIFS

  • Comprendre le fonctionnement et les apports d'Elasticsearch dans le traitement de données, et savoir le mettre en oeuvre pour l'analyse de données

METHODES PEDAGOGIQUES

  • La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions
  • Remise d’une documentation pédagogique papier ou numérique pendant le stage
  • Mise à disposition d’un poste de travail par participant

METHODES D'EVALUATION DES ACQUIS

  • Auto-évaluation des acquis par le stagiaire via un questionnaire
  • Attestation de fin de stage adressée avec la facture

FORMATEUR

Consultant-Formateur expert Bigdata

CONTENU DU COURS Bigdata

1 - Introduction

  • Présentation de la pile elastic
  • Positionnement d’Elasticsearch et des produits complémentaires : Watcher, Marvel, Kibana, Logstash, Beats, X-Pack
  • Les apports de la version 7.x
  • Principe : base technique Lucene et apports d’ElasticSearch. Fonctionnement distribué
  • Cas d’usage classiques : analyse de logs et securité, analyse de métriques, recherches web, etc.

2 - Installation et configuration

  • Prérequis techniques
  • Premiers pas dans la console DevTools de Kibana

3 - Concepts clés

  • Présentation des concepts clés d’ElasticSearch : index, types, documents, noeuds, clusters, shards et replica
  • Notions de datatypes et mappings
  • Opérations CRUD : exemples d’opérations basiques, création d’index et mappings

4 - Format et stockage des données

  • Format des données. Conversion au format JSON des données à traiter.
  • Structure des données. Stockage, indexation. Terminologie Elasticsearch : notions de document, type, index
  • Métadonnées : _index, _ID
  • Choix de l’identifiant par l’application avec l’API index, ou genération automatique d’un identifiant
  • Indexation inversée

5 - Outils d'interrogation

  • API RESTful en HTTP
  • Exemples de requêtes simples et plus complexes : recherche de «phrases», extraction de plusieurs documents, etc.
  • Notion de pertinence du résultat : «score»
  • Requêtes avec Search Lite et avec Query DSL (domain-specific language)
  • Utilisation de ‘filtre’ pour affiner des requêtes
  • Aggrégation de résultats

6 - Gestion des accès concurrents

  • Utilisation du numéro de version
  • Gestion par l’application : différentes méthodes selon les contraintes fonctionnelles
  • Utilisation d’un numéro de version externe

7 - Analyse et visualisation de données

  • Principes de base de l’analyse de texte
  • Recherche dans des données structurées, recherche full text
  • Ecriture de requêtes complexes
  • Notions d’aggrégations
  • Mise en oeuvre : préparation des données, aggregation de mesures, bucket aggregation

8 - Flux logstash et présentation Kibana

  • Traitement de logs avec logstash
  • Introduction à beats, installation et configuration
  • Présentation Kibana et démonstrations
  • Fonctionnalités : recherche, visualisation, création de tableaux de bord et graphiques à partir des données fournies par Elacticsearch
Cookies