Formation Google Cloud Platform - Les fondamentaux du Big Data et Machine Learning
dates des sessions
lieu
Toutes les dates
Objectifs
- Découvrir les objectifs et la valeur des principaux produits Big Data et Machine Learning disponibles dans la plate-forme GoogleCloud
- Utiliser Cloud SQL et Cloud Dataproc pour migrer les workloads MySQL et Hadoop / Pig / Spark / Hive existants vers Google Cloud Platform
- Utiliser BigQuery et Cloud Datalab pour effectuer une analyse interactive des données
- Former et utiliser un réseau de neurones en utilisant TensorFlow
- Employer des API ML
- Choisir parmi différents produits de traitement de données sur Google Cloud Platform
Public
Cette formation s'adresse à de nombreux publics : Les analystes de données qui souhaitent se familiariser avec Google Cloud Platform; les personnes responsables de la conception de pipelines et d'architectures pour le traitement de données, la création et la maintenance de modèles d'apprentissage automatique et de statistiques, l'interrogation de jeux de données, la visualisation des résultats de requêtes et la création de rapports; les cadres et décideurs informatiques évaluant Google Cloud Platform à l'usage des data scientists.
Prérequis
- Posséder des compétence de base en langage de requête commun tel que SQL
- Avoir une expérience de la modélisation, de l'extraction, de la transformation et du chargement de données
- Savoir développer des applications en utilisant un langage de programmation commun tel que Python
- Etre familier avec l'apprentissage automatique et / ou les statistiques
Programme
Présentation de Google Cloud Platform
- Présentation des principes fondamentaux de la plate-forme Google
- Produits et technologies de données Google Cloud Platform
- Scénarios d'utilisation
Calcul et bases de stockage
- CPU à la demande (Compute Engine)
- Un système de fichiers global (Cloud Storage)
- CloudShell
L'analyse de données sur le cloud
- Stepping-stones vers le cloud
- CloudSQL: votre base de données SQL sur le cloud
- Atelier: Importation de données dans CloudSQL et exécution de requêtes
- Spark sur Dataproc
Mise à l'échelle de l'analyse des données
- Accès aléatoire rapide
- Datalab
- BigQuery
- Apprentissage automatique avec TensorFlow
- Des modèles entièrement construits pour des besoins commun
Architectures de traitement de données
- Architectures orientées message avec Pub / Sub
- Créer des pipelines avec Dataflow
- Architecture de référence pour le traitement de données en temps réel et par lots
Résumé
- Pourquoi Google Cloud Platform?
- Où aller en partant d'ici
Ressources additionnelles
- Lab 1: S'inscrire à Google Cloud Platform
- Atelier 2: Configurer un pipeline de traitement de données Ingest-Transform-Publish
- Lab 3: Recommandations d'apprentissage automatique avec SparkML
- Lab 4: Construire un ensemble de données d'apprentissage automatique
- Lab 5: Former et utiliser le réseau de neurones
- Lab 6: Employer des API ML
Certification
Cette formation prépare au test suivant : Professional Data Engineer et entre en jeu dans le cursus de certification : Google Cloud Certified Professional Data Engineer
Moyens et Méthodes Pédagogiques
- La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions
- Un poste par stagiaire
- Formateur Expert
- Remise d’une documentation pédagogique papier ou numérique pendant le stage
Validation des acquis
- Auto évaluation des acquis par le stagiaire via un questionnaire en fin de formation
- Attestation de fin de stage remise avec la facture