Formation Dataiku DSS

Référence : PYDS034
Durée : 21 heures
Certification : Non
Eligible CPF : Non

CONNAISSANCES PREALABLES

Connaissance des principes de la manipulation de données et du machine learning

PROFIL DES STAGIAIRES

Chefs de projet, développeurs, data-scientists, utilisateurs de Dataiku DSS

OBJECTIFS

Savoir installer Dataiku DSS
Être capable de configurer Dataiku DSS
Apprendre à l'utiliser depuis l'interface web ou des API

METHODES PEDAGOGIQUES

6 à 12 personnes maximum par cours, 1 poste de travail par stagiaire
Remise d’une documentation pédagogique papier ou numérique pendant le stage
La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions

METHODES D'EVALUATION DES ACQUIS

Auto-évaluation des acquis par le stagiaire via un questionnaire
Attestation de fin de stage adressée avec la facture

FORMATEUR

Consultant-Formateur expert Bigdata

CONTENU DU COURS Bigdata

1 - Présentation, concepts DSS

Cluster DSS : Design, Deployer, Api, Automation et Govern Nodes
Notions de projet, data, dataset, recipes
Outils collaboratif : Wiki, tags, discussions…
Premiers pas avec Dataiku DSS : exemples
Fonctionnalités : Mise à disposition des méthodes et outils de data-sciences à partir d’une interface graphique ou de langages de requêtage ou de programmation (Python, SQL, R), principe de "Self Service Analytics"

2 - Connexion aux données

Connecteurs disponibles, formats de fichiers, formats spécifiques Hadoop/Spark
Chargement des fichiers, emplacement des fichiers
Système de fichiers, HDFS, Amazon S3, stockage Google Cloud, etc.
FTP, connexion ssh, connexion aux bases de données SQL
Autres stockages : Cassandra, MongoDB, Elasticsearch, …

3 - Préparation des données

Scripts de préparation, échantillonnage, exécution, les différents moteurs d’exécution: DSS, Spark, base de données SQL

4 - Graphiques et statistiques

Echantillonnage et exécution, graphiques de base, tables, nuages de points, visualisation cartographique, etc.
Fonctionnalités statistiques disponibles, démonstrations
Réalisation d’exercices pratiques
Présentation des types de graphiques disponibles et configuration

5 - Machine learning

Le laboratoire
Fonctionnalités disponibles : apprentissage supervisé et non supervisé, algorithmes utilisés, scoring, deep learning…
Evaluation, optimisation, compréhension du modèle
Déploiement et cycle de vie du modèle

6 - Flow/Recipes

Interface graphique de gestion des cycles de traitement, des datasets, des traitements, paramètrage de l’exécution en parallèle, des données géographiques, export en format pdf ou images, etc.
Travaux pratiques

7 - Interfaces de programmation

Présentation des différentes interfaces : SQL, Python, R
Exemples d’interrogations SQL et Python
Interfaçage avec Spark

INTER
INTRA

Coût :

2 420,00 € HT

Filière :

Big Data

Dates et lieux de formation

À DISTANCE

12/05/2025

08/09/2025

08/12/2025

PARIS

12/05/2025

08/09/2025

08/12/2025

Je m'inscris

Je demande un devis

Autres formations qui pourraient vous intéresser

Bases de données

Bigdata
Python : Jupyter Notebook

7H 900,00 € HT

Bigdata
Python : Jupyter Notebook

7H 900,00 € HT

18/04/2025 (prochaine session)DÉCOUVRIR

Bases de données

Bigdata
Spark ML

14H 1 670,00 € HT

Bigdata
Spark ML

14H 1 670,00 € HT

28/04/2025 (prochaine session)DÉCOUVRIR

Bases de données

Bigdata
Analyse d'images avec TensorFlow et Keras

21H 2 190,00 € HT

Bigdata
Analyse d'images avec TensorFlow et Keras

21H 2 190,00 € HT

Aucune session prévueDÉCOUVRIR

Bases de données

Bigdata
Machine Learning avec scikit-learn

14H 1 670,00 € HT

Bigdata
Machine Learning avec scikit-learn

14H 1 670,00 € HT

07/04/2025 (prochaine session)DÉCOUVRIR

Bases de données

Bigdata
Les fondamentaux de l'analyse statistique avec R

14H 1 670,00 € HT

Bigdata
Les fondamentaux de l'analyse statistique avec R

14H 1 670,00 € HT

05/05/2025 (prochaine session)DÉCOUVRIR

Bases de données

Bigdata
Dask : mise en oeuvre, programmation

21H 2 510,00 € HT

Bigdata
Dask : mise en oeuvre, programmation

21H 2 510,00 € HT

14/04/2025 (prochaine session)DÉCOUVRIR

Cookies