IA et besoins entreprises : dans quelles compétences faut-il investir ? Le mercredi 18 septembre à 18h30
IA et besoins entreprises : dans quelles compétences faut-il investir ? Le mercredi 18 septembre à 18h30
IA et besoins entreprises : dans quelles compétences faut-il investir ? Le mercredi 18 septembre à 18h30
Je m'inscris

Les débuts en Python

Débutez sur Python, le langage de programmation accessible et puissant, idéal pour les débutants comme pour les experts. Découvrez comment automatiser des tâches, analyser des données, et développer des applications rapidement grâce à sa syntaxe claire et ses vastes bibliothèques. Pour cela, téléchargez ce Cheat Sheets !

17/9/2024
Antoine Grignola

Co-fondateur de DataBird

Me former sur Python

Pour rappel

Pour coder en Python, tu peux utiliser...

  • Anaconda (ou simplement "conda")
  • Visual studio Code et installer l'extension Jupyter Notebook
1 + 1  # Tout ce qu'il y a après le hashtag est ignoré par Python
help(max)  # Affiche la documentation de la fonction max
type('a')  # Retourne le type d’objet en chaine de caractère
  • Les variables sont les éléments de base de Python, qui contiennent nos données.
  • Une variable peut donc contenir du texte, des chiffres, des listes...
  • En fonction de son "type", il y a des méthodes pour manipuler et analyser ces variables.

Importer des packages

Les packages Python sont des collections d'outils open source, développés par la communauté. Ils étendent les capacités de python.

Pour installer un nouveau package (par exemple, pandas), vous pouvez accéder à votre invite de commande et saisir pip install pandas. 
Une fois un package installé, vous pouvez l'importer comme cela :

import pandas # Importer un package sans alias
import pandas as pd # Importer un package avec un alias
from pandas import DataFrame # Importer un objet depuis un package

Répertoire de travail

Le répertoire de travail est le chemin de fichier par défaut dans lequel Python lit ou enregistre les fichiers. Un exemple de répertoire de travail est ”C://file/path". La bibliothèque os est nécessaire pour définir et obtenir le répertoire de travail.

import os #  Importe le package du système d'exploitation
os.getcwd() # Récupère le répertoire actuel
os.setcwd("new/working/directory") # Définis le nouveau dossier du répertoire de travail

Les types de données

Les boucles


Deux types de boucles sont particulièrement essentiels : la boucle "for" et la boucle "while".

for i in range(3):
    print(i) # La boucle for applique une action à tous les éléments d'un itérateur
i = 0
while i < 3:
    print(i)
    i += 1 # La boucle while applique des actions tant qu'une condition est vérifiée.

Les listes

  • La liste est un type de variable défini par des [ ].
  • Une liste peut elle-même contenir plusieurs types (int, float, string, etc.).
  • On peut l'utiliser comme itérateur dans une boucle.
nom_de_la_liste.action()
my_list.append(3) # Pour ajouter l’élément 3 à la fin de la liste my_list.

Les dictionnaires

Le dictionnaire possède une structure {clé : valeur} où la clé serait le mot et la valeur sa définition.

Exemple de définition d’un dictionnaire : dico = { "nom" : "DataBird", "Localisation" : "Paris"}

Création d’un dictionnaire

# Create a dictionary with {}
{'a': 1, 'b': 4, 'c': 9}
# Get the keys

x.keys() # dict_keys(['a', 'b', 'c'])


# Get  the values

x.values() # dict_values([1, 2, 3])



# Get a value from a dictionary by specifying the key

x['a'] # 1

NumPy

NumPy est le package permettant de manipuler et d'analyser des arrays, c'est-à-dire des listes avec quelques avantages supplémentaires.Un array est une matrice, mais qui peut avoir plusieurs dimensions.

a = np.array([1, 2, 3, 4]) # Tableau à 1 dimension
b = np.array([[1, 2, 3], [4, 5, 6]]) # Tableau à 2 dimensions

D’autre part, plus d'opérations sont autorisées sur les arrays que sur les listes : multiplication, division, moyenne etc.

Le slicing d'un array utilise également la syntaxe avec les [ ].

b = array([[1, 2, 3], [4, 5, 6]]),

Pour accéder à 2, on fait a[0,1].

Pandas

Pandas est le package le plus utilisé de l'analyse de données avec Python. Il permet de lire des données tabulaires et les afficher sous la forme de tableaux, appelés dataframes.

import pandas as pd
pd.read_csv("chemin/du/fichier") # Pour lire un fichier CSV
pd.read_excel("chemin/du/fichier") # Pour lire un fichier Excel

Le package Pandas nous fournit de nombreuses fonctions pour les manipuler.La sélection de données avec Pandas utilise la méthode généraliste du slicing, vue précédemment pour les listes et arrays.
Le slicing peut être conditionnel, c'est-à-dire intégrer une condition pour filtrer le dataframe. Pandas fournit également des méthodes supplémentaires pour sélectionner les données plus précisément (loc et iloc).

import pandas as pd
# Création d'un DataFrame exemple
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],
    'age': [24, 30, 18, 25, 28]}
df = pd.DataFrame(data) # Retourne un tableau
# Slicing conditionnel pour filtrer les lignes
df_filtré = df[df['age'] > 25] 
# Retourne le data frame en ne gardant que les âges strictement supérieurs à 25
ligne = df.iloc[2] # Retourne la troisième ligne
Python
Cheat sheets dans la même catégorie
On dirait qu'il n'y a pas d'autres cheat sheets dans cette catégorie
Tous les cheat sheets

Tous les cheat sheets

Antoine Grignola
Co-fondateur de DataBird
Antoine Grignola
Co-fondateur de DataBird
Antoine Grignola
Co-fondateur de DataBird
Antoine Grignola
Co-fondateur de DataBird
Antoine Grignola
Co-fondateur de DataBird
Antoine Grignola
Co-fondateur de DataBird