Mercredi 23 octobre à 18h30
Découvrez les métiers de la data et comment vous y former

Depuis plus de trois ans, notre objectif est de permettre au plus grand nombre de se former aux métiers de la data, quelque soit votre profil. Cet évènement vous permettra de découvrir nos programmes de formation conçus pour vous permettre de vous reconvertir vers la data ou de monter en compétences !

Je m'inscris
Découvrez les métiers de la data et comment vous y former - Le mercredi 23 octobre à 18h30
Découvrez les métiers de la data et comment vous y former - Le mercredi 23 octobre à 18h30
Découvrez les métiers de la data et comment vous y former - Le mercredi 23 octobre à 18h30
Je m'inscris

Transformation de données dans Power BI avec Power Query : Guide Complet pour 2024

Découvrez comment transformer vos données comme un pro sur Power BI ! Apprenez à rendre vos données claires, précises et prêtes à être analysées.

Antoine Grignola
Co-fondateur de DataBird
Mis à jour le
10/9/2024

Découvrez notre formation outil dédiée à Power BI.

Découvrir

Transformer les données dans Power BI, c'est un peu comme passer du brouillon à une œuvre d'art.

Avec les bons outils et quelques astuces, tu peux rendre tes données claires, précises et super faciles à analyser.

Dans cet article, on va plonger dans les étapes essentielles de la transformation de données avec Power BI.

Que ce soit pour nettoyer des datasets, créer des relations ou personnaliser des visualisations, tu vas découvrir comment rendre tes données parlantes et prêtes à l'emploi en un rien de temps.

Allez, c'est parti pour un tour d'horizon des meilleures pratiques pour maîtriser la transformation de données dans Power BI !

Introduction à Power Query

Power Query est l'outil de transformation de données intégré à Power BI.

Il permet d'importer, de nettoyer, de transformer et d'enrichir les données avant de les charger dans le modèle de données de Power BI.

Avec une interface intuitive et des fonctionnalités robustes, Power Query est indispensable pour tout analyste de données.

Pour accéder à cette interface après avoir choisi les données à transformer, cliquez sur ‘Transformer les données’ dans l’en-tête de l’accueil.

Vous arriverez sur cette interface Power Query :

 

Pourquoi transformer des données ?

Transformer les données permet de les préparer pour une analyse efficace.

Cela inclut l'élimination des doublons, la correction des erreurs, le formatage des colonnes et l'ajout de nouvelles informations dérivées.

En transformant les données directement dans Power BI, on évite les allers-retours fastidieux avec Excel, ce qui économise du temps et réduit le risque d'erreurs.

 

{{nl-inline="/brouillon"}}

Les étapes de la transformation de données

Importation des données

La première étape consiste à importer les données dans Power BI.

Power Query prend en charge une variété de sources de données, y compris des fichiers Excel, des bases de données SQL, des services en ligne comme Google Analytics et bien d'autres

Une fois les données importées, elles apparaissent dans l'éditeur Power Query vous pouvez commencer à les transformer.

 

Exemple concret

Utilisons cet exemple de tableau Excel avec des données fictives que nous allons importer sur Power BI et utiliser pour la suite des exemples :

Données de ventes

ID Région Date de vente Produit Quantité Prix unitaire Revenus Coûts
1 Nord 2023-01-15 A 10 15 150 90
2 Sud 2023-02-20 B 5 20 100 70
3 Est 2023-03-10 A 8 15 120 80
4 Ouest 2023-04-05 C 12 10 120 50
5 Nord 2023-05-25 B 7 20 140 90
6 Sud 2023-06-30 A 15 15 225 150
7 Est 2023-07-18 C 9 10 90 40
8 Ouest 2023-08-22 A 11 15 165 110
9 Nord 2023-09-30 B 6 20 120 80
10 Sud 2023-10-14 C 13 10 130 60

Cliquez sur "Obtenir les données" dans Power BI et choisissez votre source de données, comme un fichier Excel pour notre exemple.

Sélectionnez le fichier souhaité et cliquez sur "Transformer les données" pour être redirigé directement sur Power Query. 

Il ne faut jamais cliquer sur le bouton ‘Charger’ après l’import des données afin de vérifier que vos données aient été bien importées. Souvent, on observe que la première ligne des en-têtes de colonne ont été décalées d’une ligne. 

Les données s'affichent dans l'éditeur Power Query, prêtes à être transformées.

{{cours-gratuit-power-bi="/brouillon"}}

Nettoyage des données

Le nettoyage des données est essentiel pour garantir la qualité des analyses

Cela inclut la suppression des lignes ou des colonnes inutiles, la correction des valeurs incorrectes et la gestion des valeurs manquantes.

 

Exemple concret

Supposons que votre colonne "Prix unitaire" présente sur la table ait des valeurs manquantes. 

Sélectionnez la colonne "Prix" > Cliquez sur "Remplacer les valeurs" et remplacez les valeurs nulles par une moyenne calculée ou une valeur par défaut.

 

Transformation et enrichissement des données

Cette étape consiste à modifier la structure des données pour les rendre plus utiles

Vous pouvez créer de nouvelles colonnes, changer les types de données, pivoter ou dé-pivoter des tables, et combiner des ensembles de données.

 

Exemple concret

Imaginons qu’avec la colonne "Date de vente", vous souhaitiez créer une nouvelle colonne "Mois de vente"

Utilisez la fonction "Colonne dérivée" pour extraire le mois de la date de vente : Cliquez sur "Ajouter une colonne" > "Colonne personnalisée" et utilisez la formule ‘= Date.Month([Date de vente])’.

Techniques avancées de transformation 

Fusion et Append

La fusion (Merge) et l’ajout (Append) de requêtes sont deux techniques avancées pour combiner des ensembles de données.

La fusion permet de joindre deux tables sur une ou plusieurs colonnes communes, tandis que l’ajout de requêtes permet de combiner deux tables avec des colonnes similaires.

 

Exemple concret

Vous avez deux tables, "Ventes 2023" et "Ventes 2024", contenant les mêmes noms d’en-tête de colonne.

Pour les fusionner, utilisez "Combiner des requêtes" : Cliquez sur "Accueil" > "Fusionner des requêtes" > Sélectionnez les tables "Ventes 2023" et "Ventes 2024".

Pour ajouter une nouvelle requête, utilisez ‘Ajouter des requêtes’ > sélectionner l’autre table qui vous concerne, ici ‘Ventes 2024’.

Ainsi, les lignes présentes sur la table ‘Ventes 2024’ qui ne sont pas présentes sur la table ‘Ventes 2023’ ont été ajoutées sur la première table. Pour nous, cela correspond aux ventes réalisées en 2024 

L’astuce ici est ainsi de renommer la table ‘Ventes 2023’ en ‘Ventes 2023 / 2024’, en faisant un clic-droit sur la requête, puis de ‘désactiver le chargement’ de la requête (de la table) ‘Ventes 2024’, afin que, par la suite, nous n’ayons plus à utiliser la tables avec les dates de 2024.

Groupement et agrégation

Le groupement permet de regrouper les données sur une ou plusieurs colonnes et d'effectuer des calculs d'agrégation comme les sommes, moyennes ou comptes

Exemple concret 

Si vous voulez connaître les ventes totales par région, utilisez la fonction "Regrouper par" sur la colonne "Région".

Cliquez sur "Transformer" > "Regrouper par", sélectionnez la colonne "Région" et ajoutez une nouvelle agrégation en sélectionnant "Somme" pour la colonne "Revenus".

Ainsi, nous aurons nos ventes totales regroupées par région.

Utilisation des colonnes calculées 

Les colonnes calculées permettent de créer de nouvelles colonnes basées sur des formules DAX (Data Analysis Expressions).

Ces colonnes peuvent inclure des calculs simples ou complexes et sont recalculées chaque fois que les données sous-jacentes changent.

 

Exemple concret

Pour calculer une colonne "Profit" à partir des colonnes "Revenus" et "Coûts", utilisez la formule DAX : ‘Profit = Revenus - Coûts’

Pour cela, il faudra retourner sur l’interface Power BI en cliquant sur ‘Fermer et appliquer’.

Ensuite, cliquez sur "Modélisation" > "Nouvelle colonne" et entrez la formule suivante :

Profits = 'Ventes 2023 / 2024'[Revenus] - 'Ventes 2023 / 2024'[Coûts]

Best practices pour la transformation de données 

Maintenir la traçabilité des transformations

Documenter chaque étape de la transformation est crucial pour comprendre et répliquer le processus.

Power Query permet de visualiser chaque étape dans le volet "Étapes appliquées" dans la partie droite de l’interface Power Query, ce qui facilite le suivi et la gestion des transformations.

 

De plus, vous pouvez revenir en arrière sur les étapes appliquées en cliquant sur la version qui vous intéresse, ou bien supprimer l’étape qui ne vous intéresse plus en cliquant sur la croix.

 

Optimiser la performance des requêtes

Pour optimiser les performances, limitez le nombre de lignes et de colonnes importées, appliquez des filtres précoces pour réduire la taille des données et utilisez des requêtes de fusion optimisées.

Le chargement partiel et les transformations anticipées peuvent également améliorer la réactivité de Power Query.

Exemple concret 

Appliquez des filtres dès l'importation des données pour n'inclure que les lignes nécessaires.

Dans l'éditeur Power Query, utilisez l'option "Filtrer les lignes" pour éliminer les données non pertinentes dès le départ.

Gestion des erreurs et des exceptions

La gestion des erreurs est essentielle pour garantir l'intégrité des données.

Utilisez les fonctionnalités intégrées de Power Query pour détecter et gérer les erreurs, comme les fonctions "Supprimer les erreurs" et "Remplacer les erreurs".

Il est également possible de créer des règles de validation personnalisées pour s'assurer que les données répondent à des critères spécifiques avant de les charger dans le modèle de données.

 

Exemples concrets

Pour supprimer les erreurs dans une colonne, sélectionnez la colonne concernée > cliquez sur "Réduire les lignes" > "Supprimer les erreurs".

Pour remplacer les erreurs par une valeur par défaut, utilisez "Remplacer les erreurs" et spécifiez la valeur de remplacement.

 

En bref : L'article résumé

- Transformer des données dans Power BI avec Power Query est une compétence essentielle pour tout analyste de données.

- En suivant les étapes décrites dans ce guide, vous pouvez importer, nettoyer, transformer et enrichir vos données efficacement.

- Les techniques avancées et les meilleures pratiques vous aideront à optimiser vos transformations et à garantir la qualité des données.

 

Pour aller plus loin et maîtriser Power BI, n'hésitez pas à consulter les formations offertes par DataBird. Elles vous permettront de développer des compétences Power Bi approfondies et de maximiser votre utilisation de Power BI.

Faites un premier pas dans la data avec nos cours gratuits
Démarrer
Difficulté :
Facile