DÉVELOPPEMENT, BASES DE DONNÉES, BIG DATA ET BI Ingénierie logicielle Cursus Data Scientist Cursus Métier CYCLE Pour qui Objectifs 20jours • Analystes, statisticiens, spécialistes BI et toute • Disposer d’une vision claire du Big Data, de ses 140h présentiel personne souhaitant évoluer vers une fonction enjeux, de son écosystème et des principales de Data Scientist technologies et solutions qui y sont associées • Maitriser le cycle de vie de la donnée et savoir Enjeu : Évoluer garantir la qualité des données • Être en mesure d’aligner les usages métiers avec le 8 990 €HT cycle de vie de la donnée Réf. CM060 Prérequis • Savoir utiliser R pour analyser des données et restituer des résultats à l’aide de graphiques 460 € ParisHT • I l est conseillé d’avoir suivi la formation LA300 ou • Disposer des compétences techniques nécessaires de disposer des connaissances équivalentes. à réalisation d’analyses Big Data • Disposer de connaissances en statistiques ou avoir suivi la formation BI090 (voir sur www.ib-formation.fr) Points forts / Moyens pédagogiques • Chaque participant établit son propre planning de formation. En fonction de la date de début choisie parmi celles proposées ci-dessous, nos Conseillers Formation proposent différentes dates pour chacun des modules du cursus. Pour des raisons d’efficacité pédagogique, il est fortement recommandé de suivre les modules dans l’ordre présenté sur ce programme. • L’alternance de formations et de périodes de mise en pratique en entreprise favorise l’acquisition rapide et durable de nouveaux savoirs. • Animé par un expert spécialiste du sujet traité, chacun des 7 modules aborde un aspect spécifique de la thématique de formation. • A travers de nombreuses mises en situation, les participants mettront en pratique les aspects théoriques abordés au cours des différentes étapes du cursus. Programme • Utilisation - Manipulation de packages 1 - Big Data – Enjeux et perspectives (2j) • Types de données - Import et export de données Objectif : découvrir les concepts, technologies et perspectives • Manipulation et analyse de données du Big Data et disposer d’une première expérience pratique des outils spécifiques au Big Data 4 - Analysestatistique avancée avec R (3j) • Définition du Big Data et Cas d’usage Objectif : pouvoir exploiter les fonctionnalités avancées de R et ainsi • Présentation des principales solutions logicielles analyser tous types de données dans un projet Big Data • Les éléments d’architecture d’un système Big Data • Travailler avec des échantillons - Réaliser des tests d’ajustement • Les freins et les challenges - Les impacts organisationnels • Analyses statistiques avancées, de la variance et covariance • Le projet Big Data 5 - Data Mining et Machine Learning (2j) 2 - Big Data - Gouvernance, qualité et traitement Objectif : maîtriser le Data Mining et le Machine Learning des données (3j) pour explorer de très importants volumes de données Objectif : disposer des connaissances et compétences nécessaires • I ngénierie de la décision - Sélection d’instances pour identifier et collecter des données et s’assurer de leur qualité • Data Mining - Machine Learning et Text Mining - Big Data et de leur alignement sur les besoins et usages métiers de l’entreprise 6 - Big Data : mise en œuvre d’une solution complète • Enjeux, définition et problématiques liés à la qualité de la donnée d’analyse des données (4j) • Cycle de vie et qualité de la donnée Objectif : savoir mettre en œuvre une solution complète de Big Data • Alignement des usages métiers et gouvernance de la donnée en environnement Hadoop • Urbanisation, mise sous contrôle des référentiels et qualité de la • Collecter les données - Stocker les données donnée • Analyser les données - Transformer les données en décisions • Assurer la qualité de la donnée - Le traitement de données • Conclusion et plan d’actions 7 - Big Data - Analyse, Data Visualization et Data 3 - Fondamentaux de l’analyse statistique avec R (3j) StoryTelling pour la restitution de données (3j) Objecti Objectif : être en mesure de concevoir des modèles de documents f : disposer des connaissances nécessaires pour utiliser adaptés aux besoins métiers de l’entreprise le logiciel libre de traitement des données "R" • Data Visualisation ou la découverte de la grammaire graphique • I nstallation de R ou Microsoft R Open sur MS Windows ou Scientific • Data Storytelling - Comment construire son histoire Linux • Les bonnes pratiques de la mise en récit de données Paris Cycle 4 Cycle 1 19 déc Formation organisée sur demande en interentreprises à 10 jan Lyon, Aix-en-Provence, Toulouse, Bordeaux, Nantes, Cycle 2 Rennes, Lille et Strasbourg 16 mai Cycle 3 19 sep © Cegos 2019 Conseils et inscriptions au0 825 07 6000 ❘ espace.clients@ib.cegos.fr ❘www.ib-formation.fr 1113