Obtenir un nombre de colonnes dans R DataFrame

Obtenir Un Nombre De Colonnes Dans R Dataframe



Dans R, obtenir le nombre de colonnes est une opération de base requise dans de nombreuses situations lorsque vous travaillez avec des DataFrames. Lors du sous-ensemble, de l'analyse, de la manipulation, de la publication et de la visualisation des données, le nombre de colonnes est une information cruciale à connaître. Par conséquent, R propose différentes approches pour obtenir le total des colonnes du DataFrame spécifié. Dans cet article, nous discuterons de certaines des approches qui nous aident à obtenir le nombre de colonnes du DataFrame.

Exemple 1 : Utilisation de la fonction Ncol()

Le ncol() est la fonction la plus fréquente pour obtenir le total des colonnes des DataFrames.







df <- data.frame('y1' = c(10, 12, 14, 19),

'y2' = c(15, 22, 24, 29),
'y3' = c(25, 32, 34, 39))


n <- ncol(df)

cat('-----Nombre de colonnes dans le bloc de données :', n)

Dans cet exemple, nous créons d'abord un DataFrame 'df' avec trois colonnes qui sont étiquetées comme 'y1', 'y2' et 'y3' en utilisant la fonction data.frame() dans R. Les éléments de chaque colonne sont spécifiés en utilisant la fonction c() qui crée un vecteur d'éléments. Ensuite, en utilisant la variable 'n', la fonction ncol() est utilisée pour déterminer le total des colonnes dans le DataFrame 'df'. Enfin, avec le message descriptif et la variable 'n', la fonction cat() fournie imprime les résultats sur la console.



Comme prévu, la sortie récupérée indique que le DataFrame spécifié comporte trois colonnes :







Exemple 2 : compter le nombre total de colonnes pour le DataFrame vide

Ensuite, nous appliquons la fonction ncol () au DataFrame vide qui obtient également les valeurs des colonnes totales mais cette valeur est zéro.

empty_df <- data.frame()

n <- ncol(empty_df)

cat('---Colonnes dans le bloc de données :', n)

Dans cet exemple, nous générons le DataFrame vide, 'empty_df', en appelant data.frame() sans spécifier de colonnes ou de lignes. Ensuite, nous utilisons la fonction ncol () qui est utilisée pour trouver le nombre de colonnes dans le DataFrame. La fonction ncol() est définie avec le DataFrame 'empty_df' ici pour obtenir le nombre total de colonnes. Puisque le DataFrame 'empty_df' est vide, il n'a pas de colonnes. Ainsi, la sortie de ncol(empty_df) est 0. Les résultats sont affichés par la fonction cat() qui est déployée ici.



La sortie affiche la valeur '0' comme prévu car le DataFrame est vide.

Exemple 3 : Utilisation de la fonction Select_If() avec la fonction Length()

Si nous voulons récupérer le nombre de colonnes d'un type spécifique, nous devons utiliser la fonction select_if() en conjonction avec la fonction length() de R. Ces fonctions sont utilisées qui sont combinées pour obtenir le total des colonnes de chaque type . Le code pour utiliser ces fonctions est implémenté dans ce qui suit :

bibliothèque (dplyr)

x1<-LETTRES[1:10]

x2<-rpois(10,2)

x3<-rpois(10,5)

x4<-sample(c('Été','Hiver'),10,replace=TRUE)

df1<-data.frame(x1,x2,x3,x4)

df1

longueur(select_if(df1,is.numeric))

Dans cet exemple, nous chargeons d'abord le package dplyr afin de pouvoir accéder à la fonction select_if() et à la fonction length(). Ensuite, nous créons les quatre variables - 'x1', 'x2', 'x3' et 'x4', respectivement. Ici, 'x1' contient les 10 premières lettres majuscules de l'alphabet anglais. Les variables 'x2' et 'x3' sont générées à l'aide de la fonction rpois() pour créer deux vecteurs distincts de 10 nombres aléatoires avec les paramètres 2 et 5, respectivement. La variable 'x4' est un vecteur factoriel à 10 éléments échantillonnés aléatoirement à partir du vecteur c ('Été', 'Hiver').

Ensuite, nous essayons de créer le DataFrame 'df1' où toutes les variables sont passées dans la fonction data.frame(). Enfin, nous invoquons la fonction length() pour déterminer la longueur du DataFrame 'df1' créé à l'aide de la fonction select_if() du package dplyr. La fonction select_if() sélectionne les colonnes d'un DataFrame 'df1' comme argument et la fonction is.numeric() sélectionne uniquement les colonnes contenant des valeurs numériques. Ensuite, la fonction length() obtient le total des colonnes sélectionnées par select_if() qui est la sortie du code entier.

La longueur de la colonne est indiquée dans la sortie suivante qui indique le nombre total de colonnes du DataFrame :

Exemple 4 : Utilisation de la fonction Sapply()

A l'inverse, si on ne veut compter que les valeurs manquantes des colonnes, on a la fonction sapply(). La fonction sapply() itère sur chaque colonne du DataFrame pour fonctionner spécifiquement. La fonction sapply() est d'abord passée avec le DataFrame comme argument. Ensuite, il faut que l'opération soit effectuée sur ce DataFrame. L'implémentation de la fonction sapply() pour obtenir le nombre de valeurs NA dans les colonnes DataFrame est fournie comme suit :

new_df <- data.frame(c1 = c(10, 11, NA, 13, NA),

c2 = c('N', NA, 'A', 'M', 'E'),
c3 = c(NA, 92, NA, NA, 95))

sapply(new_df, function(x) sum(is.na(x)))

Dans cet exemple, nous générons le DataFrame 'new_df' avec trois colonnes - 'c1', 'c2' et 'c3'. Les premières colonnes, « c1 » et « c3 », contiennent les valeurs numériques, y compris certaines valeurs manquantes qui sont représentées par NA. La deuxième colonne, 'c2', contient les caractères incluant certaines valeurs manquantes qui sont également représentées par NA. Ensuite, nous appliquons la fonction sapply() au DataFrame 'new_df' et calculons le nombre de valeurs manquantes dans chaque colonne à l'aide de l'expression sum() dans la fonction sapply().

La fonction is.na() est l'expression spécifiée à la fonction sum() qui renvoie un vecteur logique indiquant si chaque élément de la colonne est manquant ou non. La fonction sum() additionne les valeurs TRUE pour compter le nombre de valeurs manquantes dans chaque colonne.

Par conséquent, la sortie affiche les valeurs NA totales dans chacune des colonnes :

Exemple 5 : Utilisation de la fonction Dim()

De plus, nous voulons obtenir le nombre total de colonnes avec les lignes du DataFrame. Ensuite, la fonction dim() fournit les dimensions du DataFrame. La fonction dim() prend l'objet comme argument dont nous voulons récupérer les dimensions. Voici le code pour utiliser la fonction dim() :

d1 <- data.frame(team=c('t1', 't2', 't3', 't4'),

point=c(8, 10, 7, 4))

faible(d1)

Dans cet exemple, nous définissons d'abord le DataFrame 'd1' qui est généré à l'aide de la fonction data.frame() où deux colonnes sont définies 'team' et 'points'. Après cela, nous invoquons la fonction dim () sur le DataFrame 'd1'. La fonction dim() renvoie le nombre de lignes et de colonnes du DataFrame. Par conséquent, lorsque nous exécutons le dim(d1), il renvoie un vecteur avec deux éléments - dont le premier reflète le nombre de lignes dans le DataFrame 'd1' et dont le second représente le nombre de colonnes.

La sortie représente les dimensions du DataFrame où la valeur '4' indique le nombre total de colonnes et la valeur '2' représente les lignes :

Conclusion

Nous avons maintenant appris que compter le nombre de colonnes dans R est une opération simple et importante qui peut être effectuée sur le DataFrame. Parmi toutes les fonctions, la fonction ncol() est la plus pratique. Maintenant, nous connaissons les différentes façons d'obtenir le nombre de colonnes à partir du DataFrame donné.