Accueil > Big Data, IA > Apache Cassandra, administration et exploitation
Formation #BSI73

Formation Apache Cassandra, administration et exploitation

Durée : 4 jours

Code : BSI73

Si vous avez un besoin URGENT et que vous souhaitez une date de formation plus proche que les sessions programmées (minimum 15 à 20 jours ouvrés à date de votre demande)

Objectifs

  • Connaître les apports de Cassandra par rapport à d’autres solutions existantes
  • Découvrir l'architecture du SGBD NoSQL Apache Cassandra
  • Installer et configurer le SGBD NoSQL Apache Cassandra
  • Créer une base de données et manipuler ses objets
  • Maîtriser le langage CQL
  • Découvrir les principes de l'optimisation et du développement
  • Mettre en œuvre et administrer Apache Cassandra au quotidien
  • Etre capable d'effectuer des calculs distribués avec Spark
Programme
1/ Présentation de Cassandra
  • Comprendre le Big Data
  • Cassandra : historique, fonctionnalités, licence, cas d'utilisation
  • Cassandra : choix technique et architecture
  • Format des données et "key-value"
  • Traitement de volumes importants
  • Haute disponibilité
  • Système réparti de base de données
2/ Installation et configuration
  • Pré-requis (sources, plateformes, etc.)
  • Choisir et installer la différente version de Cassandra
  • Configuration d'Apache Cassandra pour un seul nœud
  • Étude du fichier de configuration : conf/cassandra.yaml
  • Démarrer/arrêter une instance de Cassandra
  • Introduction au modèle de données
  • Test de l'interface cliente cqlsh
  • Langage de définition de données de CQL
  • DevCenter de Cassandra
  • Langage de manipulation de données de CQL
  • Comprendre les bases de la modélisation de données pour Cassandra
3/ Les bases de données sous Apache Cassandra
  • Différents modèles de stockage du NoSQL
  • Mise en place du modèle de données orienté colonne
  • Les objets sous Apache Cassandra (Keyspace, familles de colonnes, supercolonnes, colonnes composites)
  • Exemple concret de mise en œuvre
4/ Utilisation du langage déclaratif CQL (Cassandra Query Language)
  • Commandes de base : connexion au système de base de données
  • Création de colonnes, insertion, modification recherche
  • Insertion
  • Modification
  • Recherche
  • Exécution de scripts
  • Ecrire des requêtes
  • Approches
  • Limitations du CQL
5/ Architecture interne de Cassandra
  • Coordination des requêtes
  • Comprendre la réplication des données
  • Maintenir la cohérence des données
  • Comprendre la communication entre les nœuds
  • Comprendre le système des keyspaces
6/ Le Write Path de Cassandra
  • Ecriture des données dans le moteur de stockage
  • Comprendre le fonctionnement des annuaires de données
7/ Le Read Path de Cassandra
  • Lecture des données situées dans le moteur de stockage
  • Choisir et implémenter les stratégies de compilation de données
8/ Administration et exploitation d'Apache Cassandra
  • OpsCenter : installation, lancement
  • Supervision avec nodetool cfstats
  • Surveillance du Cluster
  • L'import et l'export des données
  • Principe des accès JMX
  • Exports JMX vers des outils de supervision comme Nagios
  • Démonstration avec Prométheus et Kibana
  • Gestion des noeuds Cassandra
  • Sauvegardes, snapshots et export au format JSON
  • Principe de cohérence, digest request et read repair
9/ Support Hadoop
  • Principe de MapReduce
  • Implémentation Hadoop
  • Mise en oeuvre depuis Cassandra
10/ Support Spark
  • Description rapide de l'architecture Spark
  • Mise en oeuvre depuis Cassandra
  • Exécution de travaux Spark
11/ Performance
  • Outil de test de performance Cassandra-stress
  • Mise en place d'un plan de stress et paramétrage
Approche Pédagogique

Approche Pédagogique

  • Pédagogie très opérationnelle fondée sur l'alternance entre théorie et pratique
  • Cas pratiques
  • Remise d’outils
  • Echanges d’expériences
Public cible

Public cible

  • Administrateurs
  • Développeurs