Trier le DataFrame dans R

Trier Le Dataframe Dans R



Le tri des DataFrames dans R est une opération cruciale dans l'analyse et la manipulation des données. De manière significative, R offre une grande flexibilité dans le tri des données en fonction de plusieurs colonnes et le tri par ordre croissant ou décroissant. Dans R, le tri des DataFrames peut être effectué à l'aide de diverses méthodes et fonctions. Dans cet article, nous allons passer en revue diverses fonctions qui nous aident à trier le DataFrame dans l'un des ordres spécifiés.

Exemple 1 : Trier le DataFrame à l'aide de la méthode Order() dans R

La fonction order() dans R est utilisée pour trier les DataFrames sur une ou plusieurs colonnes. La fonction de commande obtient les indices des lignes triées pour réorganiser les lignes du DataFrame.

emp = données. cadre ( des noms = c ( 'Andy' , 'Marquer' , 'Bonnie' , 'Caroline' , 'John' ) ,

âge = c ( vingt-et-un , 23 , 29 , 25 , 32 ) ,

salaire = c ( 2000 , 1000 , 1500 , 3000 , 2500 ) )

chat ( ' \n \n Dataframe trié par noms dans l'ordre croissant \n ' )

trié_asc = emp [ avec ( emp , commande ( des noms ) ) , ]

imprimer ( trié_asc )

Ici, nous définissons le DataFrame 'emp' avec trois colonnes contenant des valeurs différentes. La fonction cat() est déployée pour imprimer l'instruction indiquant que le DataFrame 'emp' par la colonne 'names' dans l'ordre croissant va être trié. Pour cela, nous utilisons la fonction order() dans R qui renvoie les positions d'index des valeurs dans un vecteur trié par ordre croissant. Dans ce cas, la fonction with() spécifie que la colonne 'names' doit être triée. Le DataFrame trié est stocké dans la variable 'sorted_asc' qui est passée en argument dans la fonction print() pour imprimer les résultats triés.







Par conséquent, les résultats triés de la colonne DataFrame par 'noms' dans l'ordre croissant sont affichés ci-dessous. Pour obtenir l'opération de tri dans l'ordre décroissant, nous pouvons simplement spécifier le signe négatif avec le nom de la colonne dans la fonction order() précédente :





Exemple 2 : Trier le DataFrame à l'aide des paramètres de la méthode Order() dans R

De plus, la fonction order() prend les arguments décroissants pour trier le DataFrame. Dans l'exemple suivant, nous spécifions la fonction order() avec l'argument pour trier par ordre croissant ou décroissant :





df = données. cadre (

identifiant = c ( 1 , 3 , 4 , 5 , 2 ) ,

cours = c ( 'Python' , 'Java' , 'C++' , 'MongoDB' , 'R' ) )

imprimer ( 'Trié en ordre décroissant par ID' )

imprimer ( df [ commande ( df$id , décroissant = VRAI ) , ] )

Ici, nous déclarons d'abord la variable 'df' où la fonction data.frame() est définie avec trois colonnes différentes. Ensuite, nous utilisons la fonction print() où nous imprimons un message pour indiquer que le DataFrame va être trié par ordre décroissant en fonction de la colonne 'id'. Après cela, nous déployons à nouveau la fonction print() pour effectuer l'opération de tri et imprimer ces résultats. Dans la fonction print(), nous appelons la fonction 'order' pour trier le DataFrame 'df' en fonction de la colonne 'course'. L'argument 'décroissant' est défini sur VRAI pour trier par ordre décroissant.

Dans l'illustration suivante, la colonne 'id' du DataFrame est organisée par ordre décroissant :



Cependant, pour obtenir les résultats du tri dans l'ordre croissant, nous devons définir l'argument décroissant de la fonction order() avec FALSE comme indiqué ci-dessous :

imprimer ( 'Trié en ordre croissant par ID' )

imprimer ( df [ commande ( df$id , décroissant = FAUX ) , ] )

Là, nous obtenons la sortie de l'opération de tri du DataFrame par la colonne 'id' dans l'ordre croissant.

Exemple 3 : Trier le DataFrame à l'aide de la méthode Arrange() dans R

De plus, nous pouvons également utiliser la méthode arrange () pour trier un DataFrame par colonnes. Nous pouvons également trier par ordre croissant ou décroissant. Le code R donné suivant utilise la fonction arrange() :

bibliothèque ( 'dplyr' )

étudiant = données. cadre (

Identifiant = c ( 3 , 5 , 2 , 4 , 1 ) ,

Des marques = c ( 70 , 90 , 75 , 88 , 92 ) )

imprimer ( 'Augmentation du tri des commandes par identifiant' )

imprimer ( organiser ( étudiant , Identifiant ) )

Ici, nous chargeons le package 'dplyr' de R pour accéder à la méthode arrange() pour le tri. Ensuite, nous avons la fonction data.frame() qui contient deux colonnes et définit le DataFrame dans la variable 'student'. Ensuite, nous déployons la fonction arrange() du package 'dplyr' dans la fonction print() pour trier le DataFrame donné. La fonction arrange () prend le DataFrame 'étudiant' comme premier argument, suivi de 'l'ID' des colonnes à trier. La fonction print() à la fin imprime le DataFrame trié sur la console.

Nous pouvons voir où la colonne 'Id' est triée dans une séquence dans la sortie suivante :

Exemple 4 : Trier le DataFrame par date dans R

Le DataFrame dans R peut également être trié par les valeurs de date. Pour cela, la fonction triée doit être spécifiée avec la fonction as.date() pour formater les dates.

date de l'événement = données. cadre ( événement = c ( '04/03/2023' , '2/2/2023' ,

'10/1/2023' , '29/03/2023' ) ,

des charges = c ( 3100 , 2200 , 1000 , 2900 ) )

date de l'événement [ commande ( comme . Date ( event_date$event , format = '%d/%m/%A' ) ) , ]

Ici, nous avons un DataFrame 'event_date' qui contient la colonne 'event' avec les chaînes de date au format 'mois/jour/année'. Nous devons trier ces chaînes de date par ordre croissant. Nous utilisons la fonction order () qui trie le DataFrame par la colonne 'événement' dans l'ordre croissant. Nous y parvenons en convertissant les chaînes de date dans la colonne 'événement' en dates réelles à l'aide de la fonction 'as.Date' et en spécifiant le format des chaînes de date à l'aide du paramètre 'format'.

Ainsi, nous représentons les données qui sont triées par la colonne de date 'événement' dans l'ordre croissant.

Exemple 5 : Trier le DataFrame à l'aide de la méthode Setorder() dans R

De même, le setorder() est également une autre méthode pour trier le DataFrame. Il trie le DataFrame en prenant l'argument comme la méthode arrange(). Le code R de la méthode setorder() est donné comme suit :

bibliothèque ( 'data.table' )

d1 = données. cadre ( numéro de commande = c ( 1 , 4 , 2 , 5 , 3 ) ,

article de commande = c ( 'pomme' , 'orange' , 'kiwi' , 'mangue' , 'banane' ) )

imprimer ( définir l'ordre ( d1 , article de commande ) )

Ici, nous définissons d'abord la bibliothèque data.table puisque setorder() est la fonction de ce package. Ensuite, nous utilisons la fonction data.frame() pour créer le DataFrame. Le DataFrame est spécifié avec seulement deux colonnes que nous utilisons pour trier. Après cela, nous définissons la fonction setorder() dans la fonction print(). La fonction setorder() prend le DataFrame 'd1' comme premier paramètre et la colonne 'orderId' comme deuxième paramètre par lequel le DataFrame est trié. La fonction 'setorder' réorganise les lignes de la table de données dans l'ordre croissant en fonction des valeurs de la colonne 'orderId'.

Le DataFrame trié est la sortie dans la console suivante de R :

Exemple 6 : Trier le DataFrame à l'aide de la méthode Row.Names() dans R

La méthode row.names() est également un moyen de trier le DataFrame dans R. Le row.names() trie les DataFrames par la ligne spécifiée.

df < - données. cadre ( équipe = c ( 'X' , 'X' , 'ET' , 'ET' , 'AVEC' ) ,

score = c ( 91 , 80 , 86 , 83 , 95 ) )

ligne. des noms ( df ) < -c ( 'UN' , 'D' , 'C' , 'ET' , 'B' )

df [ commande ( ligne. des noms ( df ) ) , ]

Ici, la fonction data.frame() est établie dans la variable 'df' où les colonnes sont spécifiées avec les valeurs. Ensuite, les noms de ligne du DataFrame sont spécifiés à l'aide de la fonction row.names(). Après cela, nous appelons la fonction order () pour trier le DataFrame par noms de lignes. La fonction order() renvoie les indices des lignes triées qui sont utilisées pour réorganiser les lignes du DataFrame.

La sortie affiche le DataFrame trié par lignes par ordre alphabétique :

Conclusion

Nous avons vu les différentes fonctions pour trier les DataFrames dans R. Chacune des méthodes a un avantage et nécessite l'opération de tri. Il peut y avoir plus de méthodes ou de façons de trier le DataFrame en langage R, mais les méthodes order(), arrange() et setorder() sont les plus importantes et les plus faciles à utiliser pour le tri.