Fin d'Inscription : Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.
Si vous avez un besoin URGENT et que vous souhaitez une date de formation plus proche que les sessions programmées (minimum 15 à 20 jours ouvrés à date de votre demande)
Données structurées, semi-structurées, non structurées
Comment disposer de données de « qualité » ?
Les limites des architectures actuelles
Définition d’un système Big Data
Les technologies concernées
Les outils
Les langages : Hortonworks, MapR, Cloudera, IBM Watson
Démystification du Big Data
Les acteurs principaux
Les différents métiers du Big Data
Différences entre BI, Big Data et Data Science
Exemples pratiques
2/ Enjeux et évolutions du Big Data
Les différentes sources de données
La diminution des coûts de stockage
L’augmentation des capacités de traitement des solutions éprouvées exploitées par des géants de l’Internet
L’avènement du Cloud Big Data (Data as a Service)
La qualité des données
Le traitement des données
La protection des données
L'image de la donnée
L'humanité des données
3/ Zoom sur le marché Big Data
Marché data au niveau mondial
Évolutions et les acteurs de la chaine de l’offre Big Data
Enjeux stratégiques et organisationnels
4/ Principaux cas d’usages d’analytiques
Description des 4 types d’analytiques fondamentales du Big Data
5 usages populaires du Big Data en entreprise
5/ Sécurité éthique et enjeux juridiques du Big Data
Assurer la protection des données
Qualification complexe des données
La CNIL régule les données numériques
Sécurité des données et enjeux juridiques
Les informations sensibles, interdites de collecte
Les accords intra-pays
6/ Big Data et la performance de l’entreprise
En quoi Big Data est un enjeu de performance pour les entreprises?
Comment identifier les nouveaux leviers de performance ?
Chaîne des valeurs, développement des nouvelles activités…
Productivité et optimisation des dépenses
Comment accompagner les DSI dans le Big Data
Impacts sur les équipes en place
Apparition des nouveaux rôles/métiers (data scientists et CDO)
Compétences nouvelles à acquérir
7/ Les projets Big Data en entreprise
Spécificités d’un projet Big Data
Méthodologie/démarche de gestion d’un projet Big Data
Calcul du retour sur investissement d’un projet Big Data
Les étapes pour lancer un projet Big Data et les précautions à prendre
Facteurs clés de succès
Causes d'échec
L’innovation constante accélère le phénomène
Nouvelles technologies de transmission (vitesse de connexion accrue, mobiles en constante amélioration)
Objets connectés et domotique
Zoom sur le marché des biens et services proposés aux consommateurs
Fusionner les données exogènes et endogènes pour mieux comprendre les usagers
Méthodes de traitement de l’information : du traitement batch, au traitement temps réel
Architectures décisionnelles d’aujourd’hui
Les lacs de données (Datalake) en pleine émergence
8/ Architecture et infrastructure Big Data
Cohabitation des solutions SGBDR et NoSQL
Les outils permettant d’extraire les données (ETL)
La nécessité de “nettoyer” les données (dataquality)
Exemple de traitement avec un ETL dédié Big Data
L’apport d’un MDM (Master Data Manager)
Le stockage avec Hadoop (base de données Hbase, système de fichiers distribué HDFS)
Solutions Big Data alternatives (Sybase IQ, SAP Hana, Vectorwise, HP Vertica, etc.)
9/ L’analyse des données et la visualisation
Définition de l’analyse statistique
Requêter avec Hive
Analyser les données (Pig, Mahout, etc.)
Intégrer les données grâce à Sqoop
10/ Le développement d’applications Big Data
La philosophie de MapReduce (clef, valeur)
L’apport d’Apache Spark
Machine learning et prédiction des données (Scala, Spark MLibs, etc.)
Interconnexion avec les outils SPSS, R, SAS
11/ La visualisation des données (DATAVIZ)
Ce que les statistiques ne disent pas
Data visualisation et cas d'usage concrets
Quels graphes pour quels usages ?
Représentation de données complexes (encodage visuel, visualisation interactive)
Savoir communiquer sur les analyses de données (Data Storytelling)
Synthèse des principaux outils utilisés dans les projets
12/ Démonstration d’un environnement distribué HADOOP
Les moteurs de recherche de grande envergure
Présentation Lucene, Solr
Mécanisme de traitement
Gestion des journaux applicatifs
Mécanismes et architecture Apache Flume
La relation entre Cloud et Big Data
Motivation entre clouds publics et privés
Les clouds de stockage
Se reconcentrer sur les problématiques métiers, grâce aux services managés
Approche Pédagogique
Approche Pédagogique
Pédagogie très opérationnelle fondée sur l'alternance entre théorie et pratique
Cas pratiques
Remise d’outils
Echanges d’expériences
Public cible
Public cible
DSI
Directeurs techniques
Chefs de projets
Architectes
DBA
Ingénieurs systèmes et réseaux
Développeurs
Data scientists
Toute personne désirant disposer d’une vue globale et détaillée sur le Big Data
Dates
Dates
Du 03 au 05 Avril 2024
Du 12 au 14 Juin 2024
Du 07 au 09 Août 2024
Du 09 au 11 Oct. 2024
Du 04 au 06 Déc. 2024
Fin d'Inscription : Le Bulletin d'Inscription doit être rempli, cacheté, signé et envoyé par email : Au minimum 15 JOURS OUVRÉS avant la date de formation.