Familiarisez-vous avec Pandas grâce à ces opérations pour débutants.

 

Comment créer une série à l’aide d’une liste

d = [1, 2, 3, 4, 5]
s = pd.Series(d)
s

Sortie :

0 1
1 2
2 3
3 4
4 5

dtype : int64

 

Comment créer une série avec un index

Pour créer une série avec un index, vous devez utiliser l’argument index. Le nombre d’index doit être égal au nombre d’éléments de la série.

d = [1, 2, 3, 4, 5]
s = pd.Series(d, index=[« un », « deux », « trois », « quatre », « cinq »])
s

Sortie :

un 1
deux 2
trois 3
quatre 4
cinq 5
dtype : int64

 

Comment créer une série à l’aide d’un dictionnaire

Les clés du dictionnaire deviennent les étiquettes de la série.

d = {« un » : 1,
« deux » : 2,
« three » : 3,
« quatre » : 4,
« cinq » : 5}
s = pd.Series(d)
s

Sortie :

un 1
deux 2
trois 3
quatre 4
cinq 5
dtype : int64

 

Comment créer une série à l’aide d’une valeur scalaire ?

Si vous souhaitez créer une série en utilisant une valeur scalaire, vous devez fournir l’argument index.

s = pd.Series(1, index = [« a », « b », « c », « d »])
s

Sortie :

a 1
b 1
c 1
d 1
dtype : int64

3. Comment créer un Dataframe dans Pandas

Un DataFrame est une structure de données bidimensionnelle dans laquelle les données sont alignées sous forme de lignes et de colonnes. Un DataFrame peut être créé en utilisant des dictionnaires, des listes, une liste de dictionnaires, des tableaux numpy, etc. Dans le monde réel, les DataFrames sont créés en utilisant un stockage existant comme des fichiers CSV, des fichiers excel, des bases de données SQL, etc.
L’objet DataFrame prend en charge un certain nombre d’attributs et de méthodes. Si vous voulez en savoir plus, vous pouvez consulter la documentation officielle de pandas dataframe.

 

Comment créer un DataFrame vide ?

df = pd.DataFrame()
print(df)

Sortie :

DataFrame vide
Colonnes : []
Index : []

Comment créer un DataFrame à l’aide d’une liste

listObj = [« MUO », « technology », « simplified »]
df = pd.DataFrame(listObj)
print(df)

Sortie :

0
0 MUO
1 technologie
2 simplifiée

Comment créer un DataFrame à l’aide d’un dictionnaire de ndarray/Lists

batmanData = {‘Nom du film’ : [‘Batman Begins’, ‘The Dark Knight’, ‘The Dark Knight Rises’],
‘Année de sortie’ : [2005, 2008, 2012]}
df = pd.DataFrame(batmanData)
print(df)

Sortie :

Nom du film Année de sortie
0 Batman Begins 2005
1 The Dark Knight 2008
2 The Dark Knight Rises 2012

Comment créer un DataFrame à l’aide d’une liste de listes

data = [[‘Alex’, 601], [‘Bob’, 602], [‘Cataline’, 603]]
df = pd.DataFrame(data, columns = [‘Name’, ‘Roll No.’]])
print(df)

Sortie :

Nom N° de rôle
0 Alex 601
1 Bob 602
2 Cataline 603

Comment créer un DataFrame à l’aide d’une liste de dictionnaires ?

data = [{‘Nom’ : ‘Alex’, ‘Numéro de rôle’ : 601},
{‘Nom’ : ‘Bob’, ‘Numéro de matricule’ : 602},
{Nom’ : ‘Cataline’, ‘Numéro de rôle’ : 603}]
df = pd.DataFrame(data)
print(df)

Sortie :

Nom Numéro de rôle
0 Alex 601
1 Bob 602
2 Cataline 603

Comment créer un DataFrame à l’aide de la fonction zip()

Utilisez la fonction zip() pour fusionner des listes en Python.

Nom = [‘Alex’, ‘Bob’, ‘Cataline’]
RollNo = [601, 602, 603]
listOfTuples = list(zip(Name, RollNo))
df = pd.DataFrame(listOfTuples, columns = [‘Name’, ‘RollNo’])
print(df)

Sortie :

Nom Numéro de matricule
0 Alex 601
1 Bob 602
2 Cataline 603

Comment lire des données CSV dans Pandas ?

Un fichier  » comma-separated values  » (CSV) est un fichier texte délimité qui utilise une virgule pour séparer les valeurs. Vous pouvez lire un fichier CSV à l’aide de la méthode read_csv() de Pandas. Si vous souhaitez imprimer l’intégralité du DataFrame, utilisez la méthode to_string().

Dans cet exemple et les suivants, ce fichier CSV sera utilisé pour effectuer les opérations.

df = pd.read_csv(‘https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv’)
print(df.to_string())

Sortie :

 

Comment analyser les cadres de données à l’aide des méthodes head(), tail() et info() ?

Comment visualiser les données à l’aide de la méthode head()

La méthode head() est l’un des meilleurs moyens d’obtenir un aperçu rapide du DataFrame. Cette méthode renvoie l’en-tête et le nombre de lignes spécifié, en commençant par le haut.

df = pd.read_csv(‘https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv’)
print(df.head(10))

Sortie :

Si vous ne spécifiez pas le nombre de lignes, les 5 premières lignes seront retournées.

df = pd.read_csv(‘https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv’)
print(df.head())

Sortie :
Comment afficher les données à l’aide de la méthode tail()

La méthode tail() renvoie l’en-tête et le nombre de lignes spécifié, en commençant par le bas.

df = pd.read_csv(‘https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv’)
print(df.tail(10))

Si vous ne spécifiez pas le nombre de lignes, les 5 dernières lignes seront retournées.

df = pd.read_csv(‘https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv’)
print(df.tail())

Comment obtenir des informations sur les données

Les méthodes info() renvoient un bref résumé d’un DataFrame, y compris le dtype d’index et les dtypes de colonnes, les valeurs non nulles et l’utilisation de la mémoire.

df = pd.read_csv(‘https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv’)
print(df.info())

6. Comment lire des données JSON dans Pandas ?

JSON (JavaScript Object Notation) est un format d’échange de données léger. Vous pouvez lire un fichier JSON à l’aide de la méthode read_json() de Pandas. Si vous souhaitez imprimer l’intégralité du DataFrame, utilisez la méthode to_string().

Dans l’exemple ci-dessous, ce fichier JSON est utilisé pour effectuer les opérations.

df = pd.read_json(‘https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json’)
print(df.to_string())

Rafraîchissez vos connaissances de Python grâce aux fonctions et méthodes intégrées

Les fonctions permettent de raccourcir votre code et d’en améliorer l’efficacité. Des fonctions et des méthodes comme reduce(), split(), enumerate(), eval(), round(), etc. peuvent rendre votre code robuste et facile à comprendre. Il est toujours bon de connaître les fonctions et méthodes intégrées, car elles peuvent simplifier vos tâches de programmation dans une large mesure.