Big Data - Mise en œuvre pratique d’une solution complète d’analyse des données BEST Collecte et analyse de données massives BLENDED 4 jours Objectifs professionnels Prérequis 28h présentiel • Disposer des compétences techniques • Avoir suivi la formation BD540 nécessaires à la mise en œuvre d’analyses Big • La connaissance d’un langage Data de programmation et du langage SQL est • Comprendre le cadre juridique du stockage un plus pour suivre cette formation 2 585 €HT et de l’analyse de données • Savoir utiliser des outils de collecte Open Source Forfait repas • Pouvoir choisir la bonne solution de stockage de données au regard des spécificités d’un projet 92 € ParisHT Pour qui Niveau: Perfectionnement • Chefs de projet, Data Scientists, Data Analysts, Développeurs, Analystes et statisticien Réf. BD550 • Toute personne en charge de la mise en œuvre opérationnelle d’un projet Big Data en environnement Hadoop Programme Le+digital • La mise à disposition de ressources complémentaires sur le Learning Hub ib favorise l’individualisation de l’apprentissage. • Une formation très opérationnel le durant laquel le s’alternent les phases d’apports théoriques, d’échanges, de partage d’expériences. • Les participants réalisent sur un cas concret une chaîne de traitement Big Data. PARTIE 1 : AVANT LE PRÉSENTIEL 5 - Stockage de données distribuées Pour aborder la formation dans les meilleures conditions, • Principes des bases de donnes distribuées retrouvez sur le Learning Hub ib : • Solutions (NoSQL, NewSQL) • Un quiz de consolidation des pré-requis • Création d’une base de données distribuée PARTIE 2 : EN PRÉSENTIEL 6 - Automatisation de chaîne de traitement Batch 1 - Introduction • L’orchestrateur Oozie • Objectifs • Ordonnancement de scripts HIVE • Schématisation du projet • Combinaison avec des scripts SPARK • Écosystème et stack technologique • Création d’un worklow Oozie complet 2 - Ingestion de données massives 7 - Traitement de données massives en flux (streaming) • Caractéristiques clés des outils d’ingestion • Principe de fonctionnement • Solutions (packagées, cloud computing et Hadoop) • Solutions logiciel les • Focus Apache NIFI et KAFKA • Le prétraitement de données en streaming 3 - Traitement de données Big Data en batch 8 - Mise en œuvre dans une architecture Big Data • Diagramme de fonctionnement • Les approches standards • Solutions logiciel les associées (MapReduce, Hive, • Réalisation d’une solution complète de traitement Spark, ...) de données type Lamda et type Kapp • Big Data Batch scripting PARTIE 3 : APRÈS LE PRÉSENTIEL • Data Warehousing Big Data Retrouvez sur le Learning Hub ib : 4 - Traitement avancé Big Data : l’apprentissage machine • Un quiz pédagogique pour évaluer vos acquis • L’écosystème Spark et approfondir les sujets de votre choix • Schéma général de création d’un modèle de ML • Des vidéocasts pour revenir sur les points clés de la formation • Enrichissement d’un DWH avec Spark • Des vidéos-tutos pour vous accompagner • Sauvegarde d’un modèle d’apprentissage machine dans l’utilisation des outils du Big Data • Application d’un modèle ML Dates et villes Sur ib-formation.fr, retrouvez en temps réel les dates en tapant la Réf. BD550 Formation proposée à Paris © Cegos 2020Conseils et inscriptions au 0 825 07 6000 - espace.clients@ib.cegos.fr - www.ib-formation.fr 1007 IB te ataD giB ,seénnod ed sesaB ,tnemeppolevéD ataD giB