Pandas Dataframe Unique

Pandas Dataframe Unique



La bibliothèque Python la plus populaire utilisée en science des données s'appelle Pandas. Il offre aux programmeurs Python des outils performants, conviviaux et d'analyse de données. Une fois que vous avez compris les fonctions fondamentales et comment les utiliser, Pandas est un outil puissant pour modifier les données. Dans les 'pandas', les méthodes standard de stockage des données sous forme de tableau sont les DataFrames. Nous pouvons utiliser certaines méthodes 'pandas' pour obtenir les valeurs uniques dans la colonne 'pandas' de DataFrame. Lorsque nous avons besoin d'obtenir des valeurs uniques dans les colonnes du DataFrame et que nous ne voulons pas dupliquer les valeurs dans la colonne 'pandas' du DataFrame, nous pouvons utiliser les méthodes fournies par 'pandas' pour ce faire. Examinons ces méthodes dans ce guide, ainsi que quelques exemples et résultats pour obtenir des valeurs uniques dans la colonne de 'pandas' du DataFrame.

Méthodes pour obtenir des valeurs uniques dans les colonnes de DataFrame 'pandas'

Nous pouvons utiliser deux méthodes pour obtenir les valeurs uniques dans les colonnes du DataFrame 'pandas'. Nous supprimons les valeurs en double et n'obtenons que les valeurs uniques dans les colonnes de DataFrames. Les méthodes fournies par les 'pandas' pour effectuer cette tâche sont :







  • En utilisant la méthode unique().
  • En utilisant la méthode drop_dupliactes().

Maintenant, nous allons utiliser les deux méthodes dans les codes 'pandas' pour obtenir les valeurs uniques dans les colonnes de DataFrame 'pandas'.



Exemple # 01

L'application 'Spyder' est utilisée ici pour générer ces codes 'pandas' afin d'utiliser les méthodes qui nous aident à obtenir les valeurs uniques dans les colonnes de DataFrame 'pandas'. Il faut importer les modules « pandas », qui sont nécessaires au code « pandas », avant de créer le DataFrame. En utilisant le terme 'import' et en plaçant 'pandas as pd', nous importons ces modules.



Maintenant, à l'aide de 'pd', nous pouvons obtenir rapidement les fonctions ou méthodes 'pandas'. Nous mettons ensuite le 'Subject_data' dans lequel nous ajoutons 'Name' et dans le 'Name', nous ajoutons les données du nom qui sont 'Roman, William, Peter, Smith, John, Milli, Thomas et James'. Ensuite, nous ajoutons les données de sujet dans le 'Subj' qui sont 'Maths, Economie, Sciences, Maths, Statistiques, Statistiques, Statistiques et Informatique'. Ensuite, nous convertissons ce 'Subject_data' en DataFrame 'Subject_df' en utilisant la méthode 'pd.DataFrame()'. Nous plaçons 'Subject_df' dans la méthode 'print()' pour qu'il s'affiche sur le terminal.





Maintenant, nous voulons obtenir les valeurs uniques dans la colonne 'Subj' du DataFrame 'pandas'. À cette fin, nous utilisons ici la méthode 'unique ()' et nous ajoutons le nom de la colonne ainsi que le nom du DataFrame, comme indiqué ci-dessous. Nous ajoutons cette méthode dans le 'print ()' afin que le résultat s'affiche également sur le terminal.



Maintenant, nous appuyons sur 'Maj + Entrée' pour obtenir le résultat de ce code et il s'affiche sur le terminal et est également affiché ici, qui contient le DataFrame avec toutes les valeurs. C'est le DataFrame original que nous avons ajouté dans le code et en dessous il affiche les valeurs uniques de la colonne 'Subj'. Il supprime les valeurs en double et affiche les valeurs uniques de la colonne 'Subj' du DataFrame.

Exemple # 02

Nous créons la 'Sample_list' qui contient des informations. Nous insérons 'Layla, 21, 28, 31, 14 et 39' qui apparaîtra comme première colonne lorsque nous convertirons cette liste en DataFrame. Ensuite, nous ajoutons 'Lusy, 31, 25, 34, 26 et 21' comme deuxième ligne du DataFrame. Après cela, nous avons 'Peter, 38, 20, 20, 35 et 24' et 'Layla 38, 23, 39 24, 23' qui seront les troisième et quatrième lignes du DataFrame. Nous insérons également trois autres données qui sont 'Stella, 21, 24, 24, 28, 31', 'Layla, 33, 32, 26, 30, 25' et aussi 'Peter, 21, 21, 31, 21, 29' .

Maintenant, nous convertissons le 'Sample_list' en 'DF_Sample' qui est le nom du DataFrame ici en mettant la fonction 'pd.DataFrame ()'. De plus, nous définissons le nom des colonnes de ce DataFrame et ces noms sont 'Name, Ass_1, Ass_2, Ass_3, Ass_4 et Ass_5'. Ensuite, nous utilisons le 'print ()' qui aide à afficher le DataFrame 'DF_Sample'. Maintenant, nous utilisons une autre méthode dans cet exemple pour obtenir les valeurs uniques dans la colonne du DataFrame. Cette méthode est la méthode « drop_duplicates() » de « pandas ».

Dans la méthode 'drop_duplicates()', nous définissons le nom de la colonne où nous voulons obtenir les valeurs uniques dans la colonne du DataFrame. Nous obtenons des valeurs uniques de la colonne 'Nom' en supprimant les valeurs en double dans cette colonne à l'aide de la méthode 'drop_duplicates()' et rendons également ces valeurs uniques à l'aide de la fonction 'print()' ici.

Les noms qui sont dupliqués sont supprimés et les valeurs uniques sont rendues après l'application de la méthode 'drop_duplicates()'. Vous pouvez noter que le nom 'Layla' apparaît dans trois cellules de la colonne 'Nom'. Mais lorsque la méthode 'drop_duplicates()' est appliquée à cette colonne, toutes les valeurs en double sont supprimées et un nom 'Layla' est apparu à l'écran. Après avoir supprimé les valeurs en double, le nouveau DataFrame est apparu qui contient les valeurs uniques dans cette colonne 'Nom'. De cette façon, nous pouvons supprimer les valeurs en double et obtenir la valeur unique dans la colonne du DataFrame à l'aide de la méthode 'drop_duplicates()'.

Exemple # 03

Le même DataFrame est à nouveau utilisé et nous appliquons maintenant la méthode 'unique()' ici. Avec la méthode « unique() » on place le nom de la colonne ainsi que le nom du DataFrame sur lequel on veut appliquer cette méthode « unique() » pour obtenir les valeurs uniques. Cela ne rendra que les valeurs uniques de cette colonne et n'affichera pas ces valeurs sous la forme de DataFrame.

Ici, le DataFrame contient sept valeurs dans la colonne 'Name' mais lorsque nous appliquons la méthode 'unique ()' à cette colonne, seules quatre valeurs sont apparues et ce sont les valeurs uniques de cette colonne. Il ne rend pas les valeurs en double.

Exemple # 04

Le DataFrame que nous créons dans cet exemple est le 'F_G_df'. Nous insérons 'My_fruits' et 'my_Vegs' dans ce DataFrame. La colonne 'Mes_fruits' contient 'Pomme, Orange, Pomme, Poire, Litchi, Pomme, Pomme, Poire et Pomme'. Ensuite, nous avons le 'My_Vegs' qui contient les noms des légumes qui sont 'Chili, Bringle, Carotte, Pomme de terre, Pomme de terre, Carotte, Oignon, Ail et Gingembre'. Ce DataFrame ne contient que deux colonnes.

Maintenant, nous obtenons les valeurs uniques dans les deux colonnes à l'aide de la méthode 'unique()'. Nous mentionnons le nom du DataFrame. Ensuite, mettez le premier nom de colonne de la colonne. Après cela, nous utilisons la méthode append(). Dans cet ajout, nous plaçons à nouveau le nom du DataFrame et le nom de la deuxième colonne et plaçons la méthode 'unique ()'. Cela obtiendra les valeurs uniques des deux colonnes, puis ajoutera les valeurs uniques des deux colonnes et les affichera à l'écran.

Le DataFrame est rendu en premier contenant toutes les valeurs. Après cela, la méthode 'unique()' est appliquée et les valeurs uniques des deux colonnes sont rendues ci-dessous. Dans ce code, nous obtenons les valeurs uniques dans les multiples colonnes du DataFrame en utilisant la méthode 'unique()'.

Conclusion

L'explication complète de l'obtention des valeurs uniques dans la colonne du DataFrame se trouve dans ce guide. Nous avons discuté des méthodes 'unique()' et 'drop_duplicates()' qui nous aident à obtenir les valeurs uniques de la colonne du DataFrame. Nous avons exploré comment utiliser ces méthodes dans le code 'pandas' en utilisant ces méthodes ici dans nos codes. Nous avons illustré différents exemples dans ce guide et vous avons montré comment obtenir les valeurs uniques d'une colonne en utilisant la méthode 'unique()' ainsi que la méthode 'drop_duplicates()'. Nous avons également exploré comment obtenir les valeurs uniques dans plusieurs colonnes en utilisant la méthode 'unique()' dans ce guide.