Formation #BSI66

Formation SQL distribué

Durée : 3 jours

Code : BSI66

Prochaines dates programmées :

Du 15 au 17 Mai 2024

Du 03 au 05 Juil. 2024

Du 04 au 06 Sept. 2024

Du 20 au 22 Nov. 2024

Objectifs

Appréhender la différence entre SGBD SQL et SGBD NoSQL

Connaitre les avantages et les limites inconvénients aux technologies NoSQL

Connaître les différentes solutions disponibles

Être en mesure de choisir la solution la plus adaptée à son contexte

Comprendre le fonctionnement de Spark

Manipuler des données structurées avec Spark sql

Programme

1/ Introduction

Besoin

Comment concilier le quoi et le comment ?

Manipulation de gros volumes de données en conservant une approche utilisateurs

Stockage et traitements : HDFS, Cassandra, HBase et les formats de données (parquet, orc, raw, clés/valeurs)

2/ PIG

Introduction: principes et cas d'utilisation

Pig versus MapReduce

Pig : développement et intégration avec Java

Extension de Pig avec des fonctionnalités développées : UDF (User-Defined Functions)

3/ HIVE

Introduction: principes et cas d'utilisation

Environnement et configuration

Hive et métadonnées

Keywords pour Hive

Extension du HiveQL avec des fonctionnalités développées : UDF (User-Defined Functions)

4/ explorer le moteur de requêtes Impala

Impala : définition, caractéristiques et rayon d’action

Impala : Contraintes

Impala dans le monde des bases de données relationnelles

Exemples d’utilisations du Shell Impala

5/ Presto

Cadre d'utilisation

Sources de données utilisables

6/ Spark DataFrame

Présentation de Spark

Spark et SQL

L'API Dataset et DataFrames

Compilation catalyst

Syntaxe, opérateurs

Comparaison avec Presto

7/ Drill/sqoop

Utilisation d'APIs JDBC, ODBC

Indépendance Hadoop

Contraintes d'utilisation

Performances

8/ Comparatifs

Compatibilité ANSI/SQL

Approches des différents produits

Critères de choix

Approche Pédagogique

Approche Pédagogique

Pédagogie très opérationnelle fondée sur l'alternance entre théorie et pratique

Cas pratiques

Remise d’outils

Echanges d’expériences

Public cible

Public cible

Experts en bases de données

Chefs de projets

Toute personne souhaitant comprendre le fonctionnement et les apports des bases NoSQL

Dates

Dates

Du 15 au 17 Mai 2024
Du 03 au 05 Juil. 2024
Du 04 au 06 Sept. 2024
Du 20 au 22 Nov. 2024

Accueil Achats Anglais Professionnel Assistanat Assurance Audit Interne Banque Carrière Professionnelle Centre d'Appels Commercial - Vente Communication Comptabilité - Fiscalité Contrôle de Gestion Développement Durable Développement Personnel Direction d'entreprise Droit des affaires et social Efficacité professionnelle Finance et Trésorerie Formation International - Export Logistique - Supply Chain Management Management des risques Marketing Paie/Gestion admin. du personnel Projet Qualité/Sécurité/Env. Relation client Ressources humaines Secteur public Webmarketing Agilité Bases de données Big Data Cloud computing CRM Gestion de projets et méthodes IBM Applications IBM Systèmes Informatique décisionnelle Ingénierie logicielle Java, JEE, C, C++ Linux, Unix, Mac Management des SI Management ITIL Messagerie et communication Microsoft .NET Microsoft Applications Microsoft Système Mobilité Réseaux et Cisco Réseaux et Voix sur IP SAP Sécurité, Sauvegarde et Supervision Serveurs applicatifs Virtualisation et stockage Web - Digital Air - Gaz - Vapeur Analyse Industrielle Automatismes et Robotique Chimie Electricité & Electrotechnique Energie Industrielle Froid & Climatisation Hydraulique Informatique Industrielle Instrumentation & Régulation Maintenance Mécanique Médical / Santé / Pharmacie Méthodes Métrologie & Mesure Pneumatique Pompes & Vannes Production Risques & Sécurité Soudage Usinage & Matériaux Variation de vitesse