Les pandas affichent toutes les colonnes

Les Pandas Affichent Toutes Les Colonnes



Lorsque nous tentons d'afficher le contenu d'un Pandas DataFrame dans l'outil Spyder, nous nous retrouvons fréquemment avec une sortie qui apparaît sur le terminal mais qui contient des colonnes masquées. Pendant que vous imprimez un long Pandas DataFrame qui dépasse le nombre prédéfini de colonnes et de lignes à imprimer, le DataFrame est tronqué. Parfois, l'utilisateur a besoin de voir le DataFrame complet avec toutes les lignes et colonnes sur l'écran de sortie. Pandas a une fonction très utile nommée 'get_option()' qui nous permet de personnaliser l'affichage de la sortie et de fonctionner sans utiliser de formats de sortie ingérables. La valeur est définie à l'aide de la méthode 'set_option()'. Ceci est utilisé pour spécifier la limite maximale de lignes et de colonnes à afficher simplement en configurant le paramètre max columns ou un nombre spécifique de colonnes sur 'Aucun'.

Méthode Pandas Set_Option

Aujourd'hui, nous allons voir comment utiliser la fonction 'pd.set_option()' pour afficher toutes les colonnes du Dataframe Pandas lors de sa présentation dans votre outil Spyder. Pour utiliser le 'pd.set_option()', nous suivons la syntaxe donnée :


Commençons à apprendre le concept avec l'aide de la mise en œuvre pratique du programme Python.







Exemple : Utilisation de la méthode Pandas Set_Option pour afficher toutes les colonnes

Cette démonstration est un guide pour afficher toutes les colonnes d'un DataFrame en utilisant les Pandas 'set_option()'. Nous allons clarifier les détails de chaque étape de la mise en œuvre de cette méthode Python.



La première exigence pour l'implémentation pratique du script Python est de trouver le meilleur outil où vous exécutez votre programme. L'outil que nous avons utilisé pour notre illustration est l'outil 'Spyder'. Nous avons lancé l'outil et commencé à travailler sur le script Python.



En commençant par le code, nous devons d'abord importer les bibliothèques prérequises dont nous avons besoin dans ce programme. La première bibliothèque que nous avons chargée dans notre fichier Python est la bibliothèque Pandas car les fonctions que nous utilisons ici sont fournies par Pandas. Nous avons appelé cette bibliothèque 'pd'. La deuxième bibliothèque que nous avons chargée est la bibliothèque NumPy. NumPy (Numerical Python) est un progiciel de calcul numérique développé sur la programmation Python. La section Importer NumPy du code demande à Python d'intégrer le module NumPy dans votre fichier Python actuel. La partie 'as np' du script demande ensuite à Python d'attribuer à NumPy l'abréviation 'np'. Il vous permet d'utiliser les méthodes NumPy en entrant 'np.function_name' au lieu de NumPy.





Maintenant, nous commençons par le code principal. Le besoin premier et fondamental de notre programme est le Pandas DataFrame. Donc, nous affichons toutes les colonnes qu'il contient. Maintenant, c'est à vous de décider si vous souhaitez créer un DataFrame avec des valeurs spécifiées ou si vous devez importer un fichier CSV. Ce que nous avons choisi pour cette instance est de créer un DataFrame avec des valeurs NaN. Nous avons invoqué la méthode 'pd.DataFrame()' pour construire un DataFrame. Ici, nous avons fourni deux paramètres - 'index' et 'columns'. L'argument 'index' fait référence aux lignes, ce qui signifie que nous définissons les lignes pour le DataFrame.

Nous avons attribué le paramètre 'index' et la fonction NumPy 'np.arange() avec un nombre de valeurs de '6'. Il génère six lignes pour le DataFrame. Il remplit toutes les entrées avec des valeurs NaN puisque nous ne lui avons fourni aucune valeur. L'argument 'columns', comme son nom l'indique, est utilisé pour définir les colonnes du DataFrame. On lui attribue également la fonction 'np.arange ()' avec un nombre de valeurs '25' pour les colonnes. Ainsi, il construit 25 colonnes pour le DataFrame.



Par conséquent, lorsque nous appelons la fonction 'pd.DataFrame()', nous avons un DataFrame avec 25 colonnes et 6 lignes remplies de valeurs nulles. Pour la nécessité de préserver ce DataFrame, nous sommes obligés de construire un objet DataFrame qui stocke son contenu. Par conséquent, nous avons créé un objet DataFrame 'aléatoire' et lui avons attribué le résultat que nous obtenons de la méthode 'pd.DataFrame ()'. Maintenant, vous voulez sûrement voir le DataFrame généré. Python nous fournit une méthode pour afficher la sortie à l'écran qui est la fonction 'print()'. Nous avons invoqué cette méthode en passant l'objet DataFrame 'aléatoire' comme paramètre.


Lorsque nous exécutons cet extrait de code, nous obtenons notre DataFrame avec des valeurs NaN affichées sur le terminal. Ici, nous pouvons observer que certaines des premières colonnes et seulement quelques-unes de la fin sont visibles. Toutes les colonnes intermédiaires sont tronquées. Par défaut, il masque certaines lignes et colonnes pour éviter de créer une frustration pour l'utilisateur en affichant d'énormes ensembles de données.


Vous pouvez même vérifier le nombre total de colonnes dans un DataFrame en utilisant la fonction « len() » de Pandas. Écrivez la fonction « len() » sur la console de votre outil « Spyder ». Écrivez le nom du DataFrame entre ses parenthèses avec la propriété « .columns ». Il nous renvoie la longueur totale des colonnes de votre DataFrame.


Il renvoie la longueur de notre DataFrame qui est de 25.

Maintenant, la tâche suivante et principale consiste à modifier l'option par défaut pour afficher la sortie. Il peut arriver que vous souhaitiez afficher l'intégralité du DataFrame sur le terminal. En raison des valeurs par défaut, de nombreuses entrées sont tronquées, ce qui déçoit l'utilisateur. Vous apprendrez ici comment surmonter ce problème. Pandas nous fournit une fonction 'pd.set_option()' pour modifier les paramètres d'affichage par défaut. Juste après avoir affiché le DataFrame sur la console, nous invoquons la méthode 'pd.set_option()'. Nous spécifions le paramètre entre les parenthèses de cette fonction que nous devons utiliser pour afficher toutes les colonnes du DataFrame.

Ici, nous avons utilisé le 'display.max_columns' pour afficher le maximum de colonnes dans notre DataFrame. Nous pouvons également définir la valeur de ce paramètre, c'est-à-dire le nombre maximum de colonnes que vous souhaitez afficher. Nous, d'autre part, définissons le 'display.max_columns' sur 'None' qui affiche toutes les colonnes du DataFrame avec une longueur maximale. Enfin, nous avons utilisé la fonction 'print()' pour afficher le DataFrame résultant avec toutes les colonnes visibles sur le terminal.


Lorsque nous appuyons sur l'option 'Exécuter le fichier' de l'outil 'Spyder', nous pouvons voir un DataFrame en cours d'exposition. Ce DataFrame a six lignes et le nombre de colonnes qu'il contient est de 25. Aucune colonne n'est tronquée puisque la fonction 'pd.set_option()' avec la longueur de colonne maximale est maintenant activée.


Nous pouvons même réinitialiser l'option d'affichage car une fois que nous avons défini la longueur d'affichage au maximum, il continue d'afficher les DataFrames avec toutes les colonnes de ce fichier Python particulier. Pour cela, nous utilisons les Pandas 'pd.reset_option()'. Nous invoquons cette fonction et fournissons 'display.max_columns' comme paramètre de cette fonction.


Cela nous donne les paramètres d'affichage initiaux pour le DataFrame fourni.

Conclusion

Afficher la sortie complète sur le terminal avec un énorme jeu de données nous pose parfois des problèmes lorsque les paramètres par défaut de l'outil contrastent avec les besoins de l'utilisateur. Pour résoudre ce revers, Pandas nous donne la méthode 'pd.set_option()'. Dans ce guide d'apprentissage, nous vous avons présenté cette méthode et la nécessité de l'employer. Nous avons démontré le sujet avec les exemples de codes Python pratiquement compilés et exécutés. Nous avons rendu les résultats de l'illustration réalisée sur 'Spyder'. Nous avons expliqué comment afficher toutes les colonnes du DataFrame sur la console en modifiant les paramètres par défaut ainsi qu'en réinitialisant tous les paramètres à initial. Accorder une attention toute particulière à la mise en œuvre pratique du module vous permet de l'utiliser chaque fois que vous rencontrez de tels problèmes.