Formation Google Cloud Platform - Analyse et visualisation de données
dates des sessions
lieu
Toutes les dates
Objectifs
- Être en mesure d'obtenir des informations pertinentes à partir de données à l'aide des outils d'analyse et de visualisation de Google Cloud Platform
- Comprendre comment charger, nettoyer et transformer des données à grande échelle
- Être capable d'explorer et de visualiser les données à l'aide de Google Data Studio
- Apprendre à optimiser et écrire des requêtes hautes performances et résoudre les problèmes associés
- S'exercer avec des API de ML prédéfinies pour analyser les images et le texte
- Savoir "entraîner" des modèles de ML de classification et de prévision à l'aide de SQL avec BQML
Public
- Analystes de données, analystes d'affaires et professionnels de la veille stratégique
- Ingénieurs des données Cloud qui collaborent avec des analystes de données pour créer des solutions de données évolutives sur Google Cloud Platform
Prérequis
- Maîtriser les principes de base du langage ANSI SQL
- Pour suivre cette formation dans des conditions optimales, nous vous recommandons de venir en formation avec un ordinateur portable
Programme
Présentation des données dans Google Cloud Platform
- D'hier à aujourd'hui : analyse de données évolutive dans le Cloud
- Mettre en avant les difficultés auxquelles font face les analystes de données
- Comparer le Big Data sur site et dans le Cloud
- Étudier des cas d'utilisation concrets d'entreprises qui se sont transformées grâce à l'analyse dans le Cloud
- Découvrir les principes de base des projets Google Cloud Platform
- Atelier : Premiers pas avec Google Cloud Platform
Présentation des outils de Big Data
- Optimiser les outils de votre kit d'analyste de données
- Découvrir les tâches des analystes de données et les défis auxquels ils font face, ainsi que les outils de données Google Cloud Platform
- Démonstration : Analyser 10 milliards d'enregistrements avec Google BigQuery
- Découvrir 9 fonctionnalités essentielles de Google BigQuery
- Comparer les outils GCP pour les analystes, les data scientists et les ingénieurs de données
- Atelier : Explorer les ensembles de données avec Google BigQuery
Exploration de vos données avec SQL
- En savoir plus sur Google BigQuery et les bonnes pratiques SQL
- Comparer les techniques courantes d'exploration des données
- Apprendre à coder le langage SQL standard de haute qualité
- Explorer les ensembles de données publics Google BigQuery
- Aperçu de visualisation : Google Data Studio
- Atelier : Résoudre les erreurs SQL courantes
Tarifs de Google BigQuery
- Calculer les coûts du stockage et des requêtes Google BigQuery
- Présentation complète d'une tâche BigQuery
- Calculer les tarifs de BigQuery : coûts du stockage, des requêtes et des flux
- Optimiser les coûts des requêtes
- Atelier : Calculer les tarifs de Google BigQuery
Nettoyage et transformation de vos données
- Superposer vos données brutes dans un ensemble de données plus simple et plus riche
- Étudier les 5 principes de l'intégrité d'un ensemble de données
- Caractériser la forme et l'asymétrie des ensembles de données
- Nettoyer et transformer les données à l'aide de SQL
- Nettoyer et transformer les données à l'aide d'une nouvelle interface utilisateur : présentation de Cloud Dataprep
- Atelier : Explorer et mettre en forme les données avec Cloud Dataprep
Stockage et exportation des données
- Créer des tables et exporter les résultats
- Comparer les tables permanentes aux tables temporaires
- Enregistrer et exporter les résultats de requêtes
- Aperçu des performances : cache des requêtes
- Atelier : Créer des tables permanentes
Ingestion de nouveaux ensembles de données dans Google BigQuery
- Transférer vos données dans le cloud
- Interroger à partir de sources de données externes
- Éviter les pièges liés à l'ingestion de données
- Ingérer de nouvelles données dans des tables permanentes
- Discuter des insertions en flux continu
- Atelier : Ingérer et interroger de nouveaux ensembles de données
Visualisation des données
- Explorer et expliquer vos données de manière efficace grâce à la visualisation
- Présentation des principes de visualisation des données
- Comparer l'analyse exploratoire à l'analyse explicative
- Démonstration : Interface utilisateur de Google Data Studio
- Connecter Google Data Studio à Google BigQuery
- Atelier : Explorer un ensemble de données dans Google Data Studio
Regroupement et fusion des ensembles de données
- Plus de données pour combiner et enrichir vos ensembles de données
- Fusionner les tables de données historiques avec UNION
- Intégrer des caractères génériques de table pour faciliter la fusion
- Étudier les schémas de données : associer les données dans plusieurs tables
- Présentation complète d'exemples JOIN et des pièges associés
- Atelier : Associer des données provenant de plusieurs tables
Fonctions avancées et clauses
- En savoir plus sur l'écriture des requêtes avancées avec Google BigQuery
- Étudier les instructions CASE SQL
- Présentation des fonctions de fenêtre d'analyse
- Sauvegarder les données avec le chiffrement de champ unidirectionnel
- Discuter de la conception efficace de sous-requête et de CTE
- Comparer les fonctions définies par l'utilisateur dans SQL et JavaScript
- Atelier : Obtenir des informations grâce aux fonctions SQL avancées
Conception de schémas et structures de données imbriquées
- Modéliser vos ensembles de données à grande échelle avec Google BigQuery
- Comparer Google BigQuery à l'architecture de données SGBDR traditionnelle
- Normalisation et dénormalisation : compromis de performance
- Étude du schéma : Le Bon, la Brute et le Truand
- Tableaux et données imbriquées dans Google BigQuery
- Atelier : Interroger les données imbriquées et répétées
Visualisation améliorée avec Google Data Studio
- Créer des tableaux de bord Pixel-Perfect
- Créer des instructions CASE et des champs calculés
- Éviter les problèmes de performance grâce au cache
- Partager les tableaux de bord et discuter de l'accès aux données
Optimisation des performances
- Résoudre les problèmes de performances de requêtes
- Éviter les problèmes de performance de Google BigQuery
- Empêcher le hotspotting dans vos données
- Effectuer un diagnostic des problèmes de performances grâce au mappage Query Explanation
- Atelier : Optimisation et résolution des problèmes de performances
Accès aux données
- La sécurité des données dans le Cloud au coeur des préoccupations
- Comparer les rôles des ensembles de données IAM et BigQuery
- Éviter les pièges liés à l'accès
- Vérifier les membres, les rôles, les organisations, l'administration des comptes et les comptes de service
Notebooks dans le Cloud
- Collaborer sur des insights et les partager à l'aide de notebooks
- Cloud Datalab
- Compute Engine et Cloud Storage
- Atelier : Louer une VM pour traiter des données sur des séismes
- Analyse de données avec BigQuery
Google et le Machine Learning
- Exploiter des API de ML prédéfinies pour vos projets
- Présentation du Machine Learning pour les analystes
- S'exercer avec des API de ML prédéfinies pour analyser les images et le texte
- Atelier : API de ML pré-entraînées
Application du Machine Learning à vos ensembles de données (BQML)
- Créer et faire des prévisions avec des modèles de Machine Learning à l'aide de SQL dans BigQuery
- Créer des ensembles de données de Machine Learning et analyser les fonctionnalités
- Créer des modèles de ML de classification et de prévision à l'aide de BQML
- Atelier : Prédire les achats des visiteurs avec un modèle de classification dans BQML
- Atelier : Prédire le prix d'une course en taxi à l'aide d'un modèle de prévision ML BigQuery
Moyens et Méthodes Pédagogiques
- La formation est constituée d’apports théoriques, d’exercices pratiques et de réflexions
- Un poste par stagiaire
- Formateur Expert
- Remise d’une documentation pédagogique papier ou numérique pendant le stage
Validation des acquis
- Auto évaluation des acquis par le stagiaire via un questionnaire en fin de formation
- Attestation de fin de stage remise avec la facture