Accueil > Big Data, IA > SQL distribué
Formation #BSI66

Formation SQL distribué

Durée : 3 jours

Code : BSI66


Prochaines dates programmées :

Du 15 au 17 Mai 2024

Du 03 au 05 Juil. 2024

Du 04 au 06 Sept. 2024

Du 20 au 22 Nov. 2024

Fin d'Inscription :
Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.
Si vous avez un besoin URGENT et que vous souhaitez une date de formation plus proche que les sessions programmées (minimum 15 à 20 jours ouvrés à date de votre demande)

Objectifs

  • Appréhender la différence entre SGBD SQL et SGBD NoSQL
  • Connaitre les avantages et les limites inconvénients aux technologies NoSQL
  • Connaître les différentes solutions disponibles
  • Être en mesure de choisir la solution la plus adaptée à son contexte
  • Comprendre le fonctionnement de Spark
  • Manipuler des données structurées avec Spark sql
Programme
1/ Introduction
  • Besoin
  • Comment concilier le quoi et le comment ?
  • Manipulation de gros volumes de données en conservant une approche utilisateurs
  • Stockage et traitements : HDFS, Cassandra, HBase et les formats de données (parquet, orc, raw, clés/valeurs)
2/ PIG
  • Introduction: principes et cas d'utilisation
  • Pig versus MapReduce
  • Pig : développement et intégration avec Java
  • Extension de Pig avec des fonctionnalités développées : UDF (User-Defined Functions)
3/ HIVE
  • Introduction: principes et cas d'utilisation
  • Environnement et configuration
  • Hive et métadonnées
  • Keywords pour Hive
  • Extension du HiveQL avec des fonctionnalités développées : UDF (User-Defined Functions)
4/ explorer le moteur de requêtes Impala
  • Impala : définition, caractéristiques et rayon d’action
  • Impala : Contraintes
  • Impala dans le monde des bases de données relationnelles
  • Exemples d’utilisations du Shell Impala
5/ Presto
  • Cadre d'utilisation
  • Sources de données utilisables
6/ Spark DataFrame
  • Présentation de Spark
  • Spark et SQL
  • L'API Dataset et DataFrames
  • Compilation catalyst
  • Syntaxe, opérateurs
  • Comparaison avec Presto
7/ Drill/sqoop
  • Utilisation d'APIs JDBC, ODBC
  • Indépendance Hadoop
  • Contraintes d'utilisation
  • Performances
8/ Comparatifs
  • Compatibilité ANSI/SQL
  • Approches des différents produits
  • Critères de choix
Approche Pédagogique

Approche Pédagogique

  • Pédagogie très opérationnelle fondée sur l'alternance entre théorie et pratique
  • Cas pratiques
  • Remise d’outils
  • Echanges d’expériences
Public cible

Public cible

  • Experts en bases de données
  • Chefs de projets
  • Toute personne souhaitant comprendre le fonctionnement et les apports des bases NoSQL
Dates

Dates

  • Du 15 au 17 Mai 2024
  • Du 03 au 05 Juil. 2024
  • Du 04 au 06 Sept. 2024
  • Du 20 au 22 Nov. 2024
  • Fin d'Inscription :
    Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.