Une formation sur mesure ?

Devis immédiat

Nos clients

logos clients Nativo formation
Formations inter / intra entreprise
Revenir aux formations Google Cloud

Formation Google Cloud Platform - Les fondamentaux du Big Data et Machine Learning

Ref. CPB100

durée

1 jour

Tarif

790€ ht

Toutes les dates

Objectifs

  • Découvrir les objectifs et la valeur des principaux produits Big Data et Machine Learning disponibles dans la plate-forme GoogleCloud
  • Utiliser Cloud SQL et Cloud Dataproc pour migrer les workloads MySQL et Hadoop / Pig / Spark / Hive existants vers Google Cloud Platform
  • Utiliser BigQuery et Cloud Datalab pour effectuer une analyse interactive des données
  • Former et utiliser un réseau de neurones en utilisant TensorFlow
  • Employer des API ML
  • Choisir parmi différents produits de traitement de données sur Google Cloud Platform

Public

Cette formation s'adresse à de nombreux publics : Les analystes de données qui souhaitent se familiariser avec Google Cloud Platform; les personnes responsables de la conception de pipelines et d'architectures pour le traitement de données, la création et la maintenance de modèles d'apprentissage automatique et de statistiques, l'interrogation de jeux de données, la visualisation des résultats de requêtes et la création de rapports; les cadres et décideurs informatiques évaluant Google Cloud Platform à l'usage des data scientists.

Prérequis

  • Posséder des compétence de base en langage de requête commun tel que SQL
  • Avoir une expérience de la modélisation, de l'extraction, de la transformation et du chargement de données
  • Savoir développer des applications en utilisant un langage de programmation commun tel que Python
  • Etre familier avec l'apprentissage automatique et / ou les statistiques

Programme

Présentation de Google Cloud Platform

  • Présentation des principes fondamentaux de la plate-forme Google
  • Produits et technologies de données Google Cloud Platform
  • Scénarios d'utilisation

Calcul et bases de stockage

  • CPU à la demande (Compute Engine)
  • Un système de fichiers global (Cloud Storage)
  • CloudShell

L'analyse de données sur le cloud

  • Stepping-stones vers le cloud
  • CloudSQL: votre base de données SQL sur le cloud
  • Atelier: Importation de données dans CloudSQL et exécution de requêtes
  • Spark sur Dataproc

Mise à l'échelle de l'analyse des données

  • Accès aléatoire rapide
  • Datalab
  • BigQuery
  • Apprentissage automatique avec TensorFlow
  • Des modèles entièrement construits pour des besoins commun

Architectures de traitement de données

  • Architectures orientées message avec Pub / Sub
  • Créer des pipelines avec Dataflow
  • Architecture de référence pour le traitement de données en temps réel et par lots

Résumé

  • Pourquoi Google Cloud Platform?
  • Où aller en partant d'ici

Ressources additionnelles

  • Lab 1: S'inscrire à Google Cloud Platform
  • Atelier 2: Configurer un pipeline de traitement de données Ingest-Transform-Publish
  • Lab 3: Recommandations d'apprentissage automatique avec SparkML
  • Lab 4: Construire un ensemble de données d'apprentissage automatique
  • Lab 5: Former et utiliser le réseau de neurones
  • Lab 6: Employer des API ML

Moyens et Méthodes Pédagogiques

  • La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions
  • Un poste par stagiaire
  • Formateur Expert
  • Remise d’une documentation pédagogique papier ou numérique pendant le stage

Validation des acquis

  • Auto évaluation des acquis par le stagiaire via un questionnaire en fin de formation
  • Attestation de fin de stage remise avec la facture