Comment lire le fichier excel (xlsx) en python

How Read Excel File Python



Les .xlsx est l'extension du document Excel qui peut stocker une grande quantité de données sous forme de tableau, et de nombreux types de calculs arithmétiques et logiques peuvent être effectués facilement dans une feuille de calcul Excel. Parfois, il est nécessaire de lire les données du document Excel à l'aide du script Python à des fins de programmation. De nombreux modules existent en Python pour lire le document excel. Certains des modules utiles sont xlrd , openpyxl , et pandas . Les façons d'utiliser ces modules pour lire le fichier excel en Python ont été montrées dans ce tutoriel.

Prérequis:

Un fichier excel factice avec l'extension .xlsx sera nécessaire pour vérifier les exemples de ce tutoriel. Vous pouvez utiliser n'importe quel fichier Excel existant ou en créer un nouveau. Ici, un nouveau fichier excel nommé ventes.xlsx fichier a été créé avec les données suivantes. Ce fichier a été utilisé pour la lecture en utilisant différents modules python dans la partie suivante de ce tutoriel.







ventes.xlsx



Date de vente Vendeur Montant
05/12/18 Sila Ahmed 60000
12/06/19 Moi Hossain 50 000
08/09/20 Sarmin Jahan 45000
04/07/21 Mahmudul Hassan 30000

Exemple-1 : Lire un fichier Excel à l'aide de xlrd

Le module xlrd n'est pas installé avec Python par défaut. Vous devez donc installer le module avant de l'utiliser. La dernière version de ce module ne prend pas en charge le fichier excel avec l'extension .xlsx. Il faut donc installer la version 1.2.0 de ce module pour lire le fichier xlsx. Exécutez la commande suivante à partir du terminal pour installer la version requise de xlrd .



$pépininstaller xlrd== 1.2.0

Après avoir terminé le processus d'installation, créez un fichier python avec le script suivant pour lire le ventes.xlsx fichier utilisant le xlr module. open_workbook() La fonction est utilisée dans le script pour ouvrir le fichier xlsx en lecture. Ce fichier excel contient une seule feuille. Alors le classeur.sheet_by_index() fonction a été utilisée dans le script avec la valeur d'argument 0. Ensuite, la fonction imbriquée 'pour' boucle a utilisé pour lire les valeurs de cellule de la feuille de calcul à l'aide des valeurs de ligne et de colonne. Deux fonctions range() ont été utilisées dans le script pour définir la taille des lignes et des colonnes en fonction des données de la feuille. Les valeur_cellule() fonction a utilisé pour lire la valeur de cellule particulière de la feuille à chaque itération de la boucle. Chaque champ de la sortie sera séparé par un espace de tabulation.





# Importez le module xlrd
importer xlrd

# Ouvrir le classeur
classeur = xlrd.open_workbook('ventes.xlsx')

# Ouvrez la feuille de calcul
feuille de calcul = classeur.sheet_by_index(0)

# Itérer les lignes et les colonnes
pourjedansgamme(0,5):
pourjdansgamme(0,3):
# Imprimer les valeurs des cellules avec un espace de tabulation
imprimer(feuille de calcul.cell_value(je, j),finir=' ')
imprimer('')

Sortir:

La sortie suivante apparaîtra après l'exécution du script ci-dessus.



Exemple-2 : Lire un fichier Excel à l'aide d'openpyxl

Les openpyxl est un autre module python pour lire le fichier xlsx, et il n'est pas non plus installé avec Python par défaut. Exécutez la commande suivante depuis le terminal pour installer ce module avant de l'utiliser.

$pépininstalleropenpyxl

Après avoir terminé le processus d'installation, créez un fichier python avec le script suivant pour lire le ventes.xlsx déposer. Comme le module xlrd, l'openpyxl le module a le load_workbook() fonction pour ouvrir le fichier xlsx en lecture. Les ventes.xlsx fichier est utilisé comme valeur d'argument de cette fonction. L'objet de la livre.actif a été créé dans le script pour lire les valeurs du max_row et le max_colonne Propriétés. Ces propriétés ont été utilisées dans les boucles for imbriquées pour lire le contenu du ventes.xlsx déposer. La fonction range() a été utilisée pour lire les lignes de la feuille, et la fonction iter_cols() a été utilisée pour lire les colonnes de la feuille. Chaque champ de la sortie sera séparé par deux espaces de tabulation.

# Importer le module openyxl
importer openpyxl

# Définir la variable pour charger le wookbook
wookbook = openpyxl.load_workbook('ventes.xlsx')

# Définir la variable pour lire la feuille active :
feuille de calcul = wookbook.active

# Itérer la boucle pour lire les valeurs des cellules
pourjedansgamme(0, feuille de calcul.max_row):
pour avec le dansfeuille de calcul.iter_cols(1, feuille de calcul.max_column):
imprimer(avec le[je].valeur,finir=' ')
imprimer('')

Sortir:

La sortie suivante apparaîtra après l'exécution du script ci-dessus.

Exemple-3 : Lire un fichier Excel à l'aide de pandas

Le module pandas n'est pas installé avec python comme le module précédent. Donc, si vous ne l'avez pas installé auparavant, vous devez l'installer. Exécutez la commande suivante pour installer le pandas de la borne.

$pépininstallerpandas

Après avoir terminé le processus d'installation, créez un fichier python avec le script suivant pour lire le ventes.xlsx déposer. Les read_excel() La fonction de pandas est utilisée pour lire le fichier xlsx. Cette fonction a utilisé dans le script pour lire le ventes.xlsx déposer. Les Trame de données() fonction a utilisé ici pour lire le contenu du fichier xlsx dans le bloc de données et stocker les valeurs dans la variable nommée Les données . La valeur des données a été imprimée ultérieurement.

# Importer des pandas
importer des pandascommepd

# Charger le fichier xlsx
excel_data = pd.read_excel('ventes.xlsx')
# Lire les valeurs du fichier dans le dataframe
données = pd.DataFrame(excel_data,Colonnes=[« Date de vente »,« Vendeur »,'Montant'])
# Imprimer le contenu
imprimer('Le contenu du fichier est : ', Les données)

Sortir:

La sortie suivante apparaîtra après l'exécution du script ci-dessus. La sortie de ce script est différente des deux exemples précédents. Les numéros de ligne sont imprimés dans la première colonne, où la valeur de ligne a compté à partir de 0. Les valeurs de date sont alignées au centre. Les noms des vendeurs sont alignés à droite. Le montant est aligné à gauche.

Conclusion:

Les utilisateurs de python doivent travailler avec des fichiers xlsx à différentes fins de programmation. Trois façons différentes de lire le fichier xlsx ont été montrées dans ce tutoriel en utilisant trois modules python. Chaque module a différentes fonctions et propriétés pour lire le fichier xlsx. Ce didacticiel aidera les utilisateurs de python à lire facilement le fichier xlsx à l'aide du script python après avoir lu ce didacticiel.