Formation Talend OpenStudio intégration de données
- Référence : PYCB060
- Durée : 3 jours (21 heures)
- Certification : Non
- Eligible CPF : Non
CONNAISSANCES PREALABLES
- Maîtrise des SGBDR et de SQL. La connaissance de la programmation en Java serait utile.
PROFIL DES STAGIAIRES
- Développeurs, chefs de projet et toute personne souhaitant utiliser Talend OpenStudio pour le traitement de données
OBJECTIFS
- Savoir créer des jobs dans l'application ETL Talend, et les optimiser par l'utilisation des contextes.
- Savoir exécuter les jobs et en suivre l'exécution par l'utilisation de statistiques.
METHODES PEDAGOGIQUES
- Mise à disposition d’un poste de travail par participant
- Remise d’une documentation pédagogique papier ou numérique pendant le stage
- La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions
METHODES D'EVALUATION DES ACQUIS
- Auto-évaluation des acquis par le stagiaire via un questionnaire
- Attestation de fin de stage adressée avec la facture
FORMATEUR
Consultant-Formateur expert Bigdata
CONTENU DU COURS
1 - Introduction
- Rappels sur les solutions ETL.
- Présentation Talend OpenStudio : installation, configuration des préférences utilisateurs. Documentation.
- Concevoir des jobs simples avec Talend OpenStudio.
2 - Modélisation
- Présentation des outils : Business Modeler, JobDesigner Mise en oeuvre des principales connexions.
- Intégration de fichiers XML et CSV
- Etude des composants de transformation.
- Analyse du code et exécution des jobs
3 - Optimisation des jobs
- Utilisation des métadonnées, import/export, propagation sur les jobs, configuration de connexions réutilisables
- Stockage des variables de contexte dans les fichiers .properties et .ini
4 - Liens avec les bases de données
- Présentation des bases de données supportées Opérations sur les tables,
- Connexion à un schéma de bases de données
- Gestion des transactions
- Utilisation de SQLBuilder pour créer des requêtes
5 - Traitements de données multi-sources
- Le composant tMap
- Mise en oeuvre : Création de jointures, transformations à l’aide des variables, expressions et jointures, qualification des données à l’aide de filtres.
- Génération de sorties multiples
- Extensions : décomposition de jobs, mise en oeuvre du tRunJob, debugging, analyse des statistiques d’exécution, reporting avec jJasperOutput