Une formation sur mesure ?

Devis immédiat

Nos clients

logos clients Nativo formation
Formations inter / intra entreprise
Revenir aux formations Big Data

Formation Big Data - Enjeux et perspectives du Big Data

Ref. BD06

durée

2 jours

Tarif

1450€ ht

Toutes les dates

Objectifs

  • Identifier les enjeux, opportunités et évolutions du Big Data
  • Définir les enjeux stratégiques et organisationnels des projets Big Data en entreprise
  • Comprendre les technologies principalement utilisées selon les processus de mise en place des projets Big Data
  • Déterminer les éléments de sécurité, d'éthique et les enjeux juridiques
  • Consolider ses connaissances à travers un cas d'usage

Public

  • Managers, Chefs et Directeurs de projet Directeurs d'études, Data Stewards.

Prérequis

  • Nécessite une bonne culture générale sur les systèmes d'information et/ou les organisations.

Programme

BIG DATA : ENJEUX ET OPPORTUNITÉS / EVOLUTION DES DONNÉES

  • Le Big Data et ses 4 grands défis : volume, variété, vélocité, véracité.
  • Données massives : Web, réseaux sociaux, Open Data, capteurs, données industrielles.
  • Ouverture des données publiques : le mouvement Open Data.
  • Variété, distribution, mobilité des données sur Internet.
  • Vélocité et flux continus de données.
  • Le Edge Computing, vers une informatique de flux

LES ENJEUX POUR LES ENTREPRISES

  • Le processus de création de valeur grâce au Big Data
  • Véracité des données provenant de sources variées pour la prise de décision.
  • Analyses complexes sur Big Data, Big Analytics.
  • Production d'informations en temps réel à partir de Big Data.
  • Réactivité : traitement de flux de données en temps réel, Complex Event Processing (CEP).
  • Définir sa stratégie de déploiement : Cloud, "on-premise" ou hybride

OPPORTUNITÉS OFFERTES PAR LES PROGRÈS MATÉRIELS

  • Le stockage : Disques durs HDD vs SSD "on premise" et stockage objet ou bloc dans le Cloud.
  • L'impact de la baisse du coût de la mémoire : l'avènement du traitement de données in-memory
  • Couplage CPU/GPU pour une meilleure optimisation du calcul parallèle.
  • Les stratégies de stockage disque en réseau NAS/SAN/Isilon (stockage élastique) : Quels impacts sur les architectures de gestion de données ?
  • Les architectures massivement parallèles (MPP) vs Hadoop
  • Les appliances.

COMPRÉHENSION DES TECHNOLOGIES UTILISÉES / MOTIVATIONS

  • Le théorème CAP (Consistency, Availability, Partition tolerance) : analyse et impact.

LA PILE LOGICIELLE BIG DATA (LA "STACK HADOOP")

  • Les fondamentaux des Big Data
  • L'organisation fonctionnelle et les principaux composants : stockage, organisation, traitement, intégration, outils d'analyse.
  • La gestion de clusters.
  • Les "design pattern" d'Hadoop (architectures Lambda, Kappa, Omega, etc.), pour répondre à quels usages
  • Comparaison avec les SGBD relationnels.

LES DIFFÉRENTES MÉTHODOLOGIES ADAPTÉES AU BIG DATA

  • La gouvernance des projets Big Data

Qu'est-ce que la gouvernance Gouvernance des données

  • Gouvernance des projets
  • Organisation et rôles
  • Les grands principes des méthodes agiles
  • Le design thinking pourquoi est-il adapté aux enjeux du Big data ?

Les principes de base du design thinking

  • Les méthodes de développement
  • Les impacts sur l'organisation d'une DSI (privilégier la conception collaborative)
  • Intégrer les métiers dès la phase de conception
  • Définir les différents ateliers (modeling, intercation design, prototypage)

LA SÉCURITÉ DU BIG DATA

  • Les 5 cercles de défense du Big Data

Protection de la donnée

  • Sécurité périmétrique
  • Gestion des authentifications
  • Gestion des autorisations
  • Sécurité du système d'exploitation

UTILISATION DE LA CRYPTOGRAPHIE

  • Comprendre les fondamentaux (cryptographie, cryptanalyse, kleptographie, etc.).
  • Les trois approches de gestion des clés de chiffrement dans une architecture Big Data.
  • Les enjeux du chiffrement homomorphe.
  • Les outils de data management de la donnée

Le chiffrement à la volée avec préservation de format.

  • Les bonnes pratiques en matière de chiffrement et les recommandations de l'ANSSI et de l'ENISA.

AUTRES TECHNIQUES DE PROTECTION DES DONNÉES

  • Comprendre le cycle de vie des données dans une architecture Big Data.
  • Les outils en charge de la gouvernance et du cycle de vie des données
  • La classification des données. L'importance de la classification dans les projets Big Data.
  • L'anonymisation et la pseudonymisation des données.

ÉTHIQUE ET ENJEUX JURIDIQUES / PRINCIPES GÉNÉRAUX DE CONFORMITÉ ET DE RESPONSABILITÉS

  • Responsabilités sur le plan Informatique et Libertés
  • Responsabilités sur le plan identités
  • Responsabilités sur le plan régulation
  • Responsabilités sur le plan économique
  • Responsabilités sur le plan sécurité
  • Responsabilités sur le plan patrimoine
  • Responsabilités sur le plan de l'archivage
  • Responsabilités sur le plan ressources humaines

Moyens et Méthodes Pédagogiques

  • La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions
  • Un poste par stagiaire
  • Formateur Expert
  • Remise d’une documentation pédagogique papier ou numérique pendant le stage

Validation des acquis

  • Auto évaluation des acquis par le stagiaire via un questionnaire en fin de formation
  • Attestation de fin de stage remise avec la facture