Formation ElasticStack : indexation de contenu
- Référence : PYCB021
- Durée : 14 heures
- Certification : Non
- Eligible CPF : Non
CONNAISSANCES PREALABLES
- 1- Connaissances générales des systèmes d'information, et des systèmes d'exploitation (Linux ou Windows)
- 2- Les travaux pratiques sont réalisés sur Linux
- 3- Connaissance d'un langage de programmation structuré
PROFIL DES STAGIAIRES
- Architectes techniques, développeurs, analystes
OBJECTIFS
- Comprendre le fonctionnement et les apports d'Elasticsearch dans le traitement de données, et savoir le mettre en oeuvre pour l'analyse de données
METHODES PEDAGOGIQUES
- La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions
- Remise d’une documentation pédagogique papier ou numérique pendant le stage
- Mise à disposition d’un poste de travail par participant
METHODES D'EVALUATION DES ACQUIS
- Auto-évaluation des acquis par le stagiaire via un questionnaire
- Attestation de fin de stage adressée avec la facture
FORMATEUR
Consultant-Formateur expert Bigdata
CONTENU DU COURS Bigdata
1 - Introduction
- Positionnement d’Elasticsearch et des produits complémentaires : Watcher, Marvel, Kibana, Logstash, Beats, X-Pack
- Les apports de la version 7.x
- Principe : base technique Lucene et apports d’ElasticSearch. Fonctionnement distribué
- Cas d’usage classiques : analyse de logs et securité, analyse de métriques, recherches web, etc.
- Présentation de la pile elastic
2 - Installation et configuration
- Prérequis techniques
- Premiers pas dans la console DevTools de Kibana
3 - Concepts clés
- Opérations CRUD : exemples d’opérations basiques, création d’index et mappings
- Notions de datatypes et mappings
- Présentation des concepts clés d’ElasticSearch : index, types, documents, noeuds, clusters, shards et replica
4 - Format et stockage des données
- Format des données. Conversion au format JSON des données à traiter.
- Structure des données. Stockage, indexation. Terminologie Elasticsearch : notions de document, type, index
- Métadonnées : _index, _ID
- Choix de l’identifiant par l’application avec l’API index, ou genération automatique d’un identifiant
- Indexation inversée
5 - Outils d'interrogation
- Exemples de requêtes simples et plus complexes : recherche de «phrases», extraction de plusieurs documents, etc.
- Aggrégation de résultats
- Utilisation de ‘filtre’ pour affiner des requêtes
- Requêtes avec Search Lite et avec Query DSL (domain-specific language)
- Notion de pertinence du résultat : «score»
- API RESTful en HTTP
6 - Gestion des accès concurrents
- Utilisation du numéro de version
- Gestion par l’application : différentes méthodes selon les contraintes fonctionnelles
- Utilisation d’un numéro de version externe
7 - Analyse et visualisation de données
- Principes de base de l’analyse de texte
- Recherche dans des données structurées, recherche full text
- Ecriture de requêtes complexes
- Notions d’aggrégations
- Mise en oeuvre : préparation des données, aggregation de mesures, bucket aggregation
8 - Flux logstash et présentation Kibana
- Traitement de logs avec logstash
- Introduction à beats, installation et configuration
- Présentation Kibana et démonstrations
- Fonctionnalités : recherche, visualisation, création de tableaux de bord et graphiques à partir des données fournies par Elacticsearch