Accueil > Base de Données > Pentaho Data Integration - Développeur
Formation #BSI417

Formation Pentaho Data Integration - Développeur

Durée : 4 jours

Code : BSI417


Prochaines dates programmées :

Du 04 au 07 Juin 2024

Du 17 au 20 Sept. 2024

Du 17 au 20 Déc. 2024

Fin d'Inscription :
Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.
Si vous avez un besoin URGENT et que vous souhaitez une date de formation plus proche que les sessions programmées (minimum 15 à 20 jours ouvrés à date de votre demande)

Objectifs

  • Comprendre les concepts et les cas d'utilisation d'un ETL
  • Appréhender la modélisation de traitements de données avec Pentaho
  • Déployer vos traitements dans un environnement de production
Programme
1/ Introduction
  • Problématique
  • EAI / ETL
  • Architecture
  • Installation
2/ Découverte de l'environnement
  • Les possibilités offertes par PDI
  • Les des composants
  • Lancer et configurer PDI
3/ Découverte des flux
  • Les transformations
  • Les jobs
  • Generate Rows
  • Generate Random value
  • Text file Output
  • CSV Input
  • Write to log
  • Mail
  • Types de liaisons entre composants dans un Job
  • Types de liaisons entre composants dans une transformation
  • Exécuter un job
  • Exécuter une transformation
4/ Traitement des données
  • Sort rows
  • Unique rows
  • Filter rows
  • String cut
  • Replace in string
  • Calculator
  • Join rows
  • Merge join
  • Merge rows
  • Group by
5/ Les métadonnées
  • Vue d'ensemble
  • Créer une métadonnée BDD
6/ Travailler avec les bases de données
  • Base de données supportées
  • Récupérer une table d'une métadonnée
  • Interaction avec la base de données
  • Mise en pratique
  • Jointure entre 2 tables
  • Insert / Update
  • Database
7/ Développement de transformations avancées
  • Write to log
  • Set / Get Variables
  • Copy / Get rows to result
  • Web Services Lookup
  • Propriétés d'un job et transformation
  • Les itérations
  • Cas général : Job, Transformation
8/ Gestion des logs et des erreurs
  • Différents types d'erreurs
  • Gestion d'erreurs :
  • Dans un job
  • Dans une transformation
  • Paramètres de gestion d'erreurs
  • Composant "Data Validation"
  • Gestion des logs :
  • Les niveaux de logs
  • Logs via la console
  • Logs sauvegardés en BDD
9/ Fonctionnalités avancées
  • Déboguer notre application
  • Prévisualiser nos données
  • Ajout de points d'arrêts
  • Parallélisation des traitements
10/ Automatisation et documentation
  • Exporter ses travaux
  • Kitchen : l'exécuteur de jobs
  • Fichier
  • Repository
  • Tâches planifiées
  • Documenter ses jobs
Approche Pédagogique

Approche Pédagogique

  • Pédagogie très opérationnelle fondée sur l'alternance entre théorie et pratique
  • Cas pratiques
  • Remise d’outils
  • Echanges d’expériences
Public cible

Public cible

  • Tout informaticien amené à gérer des flux de données inter-application ou à alimenter un entrepôt de données
Dates

Dates

  • Du 04 au 07 Juin 2024
  • Du 17 au 20 Sept. 2024
  • Du 17 au 20 Déc. 2024
  • Fin d'Inscription :
    Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.