Pandas réindexés

Pandas Reindexes



'Dans' pandas ', nous pouvons stocker de nombreuses informations sous forme de tableau, également connu sous le nom de DataFrame. Les 'pandas' nous facilitent la méthode 'DataFrame()' pour construire le DataFrame. Le DataFrame contient des index, et nous pouvons également modifier les index du DataFrame en utilisant les fonctions 'pandas'. La méthode que nous utilisons pour réindexer le DataFrame est la méthode « reindex() ». Cette méthode aide à modifier les valeurs d'index de la ligne ainsi que les valeurs d'index des colonnes. En utilisant cette méthode, nous pouvons modifier l'index par défaut du DataFrame, ainsi que l'index que nous avons défini lors de la création du DataFrame. Nous utiliserons la méthode 'reindex ()' dans nos exemples 'pandas' de ce didacticiel et expliquerons ce concept en profondeur ici. '

Exemple # 01

L'outil 'Spyder' nous aide à développer le code 'pandas' ici dans ce tutoriel, et nous commençons notre code avec le mot-clé 'import', qui aidera à importer la fonction 'pandas'. Nous plaçons 'pandas as pd' après avoir tapé 'import'. Après cela, nous créons le DataFrame en tapant 'pd.DataFrame ()'. Nous écrivons ce 'pd' ici car le 'DataFrame()' est la méthode de 'pandas'. Le 'value_df' est le nom de la variable dans laquelle le DataFrame est enregistré. Nous ajoutons 'RandomName', qui est le nom de la colonne, et le 'RandomName' contient 'Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander et Samuel'.







Ensuite, nous avons 'Value_1', dans lequel nous avons inséré '16, 29, 24, 35, 44, 50, 69, 74 et 88'. Vient ensuite 'Value_2', et nous avons ajouté '25, 38, 42, 56, 54, 65, 78, 89 et 99'. Maintenant, la 'Value_3' vient ensuite, et nous y plaçons '36, 48, 52, 69, 74, 75, 87, 91 et 69'. La colonne 'Value_4' est présente après celle-ci, où nous avons inséré '52, 64, 72, 88, 82, 95, 97, 21 et 39'. La dernière colonne est la colonne 'Value_5' ici, et dans cette colonne, les valeurs que nous avons ajoutées sont '66, 78, 82, 99, 34, 45, 57, 61 et 89'. Après cela, nous utilisons la fonction 'print()' dans laquelle 'Values_df' est ajouté ainsi. Il s'imprimera sur le terminal.




Après avoir appuyé sur 'Shift + Enter', nous pouvons facilement obtenir le résultat de nos codes dans l'application 'Spyder'. Ici, ce code renvoie le DataFrame avec l'index par défaut. Maintenant, nous allons appliquer la méthode « reindex() » pour réindexer ce DataFrame en « pandas ».




La fonction 'reindex()' est utilisée ici pour réindexer la valeur d'index de la ligne. Dans le DataFrame ci-dessus, vous pouvez voir que les valeurs d'index par défaut de la ligne sont affichées, et maintenant, nous appliquons la méthode 'reindex ()' pour réindexer ces index de ligne. Nous plaçons le nom du DataFrame, puis la méthode 'reindex ()' dans laquelle nous plaçons les valeurs d'index que nous voulons ajouter au DataFrame ci-dessus. Nous mettons « ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H et ind_I » dans la fonction « reindex() ». Ainsi, les index de ces lignes seront mis à jour sur le DataFrame lorsque nous exécuterons ce code.






Les valeurs de l'index de la ligne sont affichées dans ce résultat, et vous pouvez noter que les valeurs DataFrame ne sont pas affichées ici, et les valeurs 'NaN' sont apparues. En effet, les nouvelles valeurs d'index ne correspondent pas aux valeurs d'index précédentes du DataFrame. Lorsque le nouvel index et l'ancien index ne correspondent pas, il affiche 'Nan'. Ces valeurs 'NaN' apparaissent par défaut lorsque nous modifions l'index, et cela ne correspond pas à l'index précédent.



Exemple # 02

Nous modifions maintenant les valeurs d'index de colonne de la 'Value_df', que nous avons précédemment créées dans l'exemple 1. Après avoir imprimé la 'Value_df', nous avons mis la variable 'column' et y avons ajouté des valeurs. Nous ajoutons 'a_1, b_1, c_1, d_1 et e_1'. Maintenant, nous voulons ajuster ces valeurs comme index des colonnes, donc, pour cela, nous utilisons la méthode 'reindex ()' et plaçons le nom de la variable 'column' dans laquelle les nouvelles valeurs d'index de colonne sont stockées et définissez également 'l'axe' sur 'colonnes' afin de mettre à jour l'index de l'axe de la colonne. Nous mettons la méthode 'reindex()' dans le 'print()', donc elle sera également rendue sur le terminal.


Comme nous avons utilisé la méthode 'reindex()', les valeurs d'index de colonne présentes dans le premier DataFrame sont mises à jour et de nouvelles valeurs sont ajoutées dans le DataFrame mis à jour. Vous pouvez également noter que toutes les valeurs du DataFrame sont converties en 'NaN' car les deux valeurs d'index des colonnes sont différentes.

Exemple # 03

Le 'Programming_data' dans ce code contient 'P_Languages', où nous avons ajouté 'JavaScript, CSS, Web Engineering, OOP, C#, AI, Java et JavaScript'. Ensuite, nous avons 'Heures' dans lequel nous plaçons '4_hrs, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs et 6_hrs'. Après cela, le 'P_Code' est entré et nous insérons '11523, 12423, 12321, 11456, 11454, 12267, 13106 et 14123'. Nous ajoutons la variable 'p_index' et mettons 'Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G et Pro_H'.

Ces valeurs seront utilisées comme valeurs d'index des lignes. Nous changeons le 'Programming_data' dans le DataFrame 'Programming_df'. Nous ajoutons également le 'p_index' à ce DataFrame en utilisant la méthode 'index'. Nous mettons 'Programming_df' puis la méthode 'index' et attribuons le 'p_index' à cela. Maintenant, les valeurs d'index ci-dessus sont ajoutées en tant que valeurs d'index de lignes au DataFrame. Nous imprimons également le 'Programming_df'.

Après cela, nous ajoutons de nouvelles valeurs d'index dans la variable 'new_index', et ce sont 'P_1, P_2, P_3, P_4, P_5, P_6, P_7 et P_8'. Comme nous voulons mettre à jour les valeurs d'index des lignes, nous utilisons la méthode 'reindex()' et mettons 'new_index' comme paramètre de cette fonction et stockons également le DataFrame mis à jour dans le 'newProgramming_df' et plaçons le 'newProgramming_df' dans ' print()' pour l'affichage.


Les valeurs d'index sont mises à jour, et nous pouvons également dire que nous avons réindexé le DataFrame que nous avons créé. Toutes les valeurs du DataFrame sont également converties en 'NaN' car les deux valeurs d'index sont différentes.

Exemple # 04

Nous modifions actuellement les valeurs d'index 'Programming_df' des colonnes, que nous avons précédemment développées dans l'exemple 3. Nous plaçons la variable 'column' et y insérons de nouvelles valeurs. Les « P_Code, P_Langues, Heures et Nouveau » sont ajoutés à la variable « colonne ». Ensuite, nous utilisons à nouveau la méthode 'reindex ()' dans laquelle nous définissons la variable 'column', qui mettra à jour les valeurs d'index de colonne précédentes et ajoutera ces nouvelles valeurs d'index de colonne au DataFrame.

Ici, vous pouvez noter que les nouvelles valeurs que nous avons ajoutées dans 'colonne' sont les mêmes que celles que nous avons ajoutées dans le DataFrame ci-dessus, mais la séquence est différente, donc cela changera la séquence des colonnes et ajustera toutes les colonnes comme nous mentionné dans la variable 'colonne'. De plus, nous ajoutons une autre valeur d'index qui n'est pas présente dans le DataFrame ci-dessus, qui est 'Nouveau' ici, de sorte que les valeurs 'NaN' apparaîtront dans cette colonne.


La séquence des colonnes est modifiée ici, et toutes les valeurs apparaissent telles qu'elles sont présentes dans les colonnes du DataFrame d'origine et la colonne 'Nouveau' dans le DataFrame mis à jour contient toutes les valeurs 'NaN' car cette colonne n'est pas présente dans le DataFrame d'origine.

Conclusion

Nous avons présenté ce tutoriel qui nous aide à comprendre en détail la notion de 'réindexation des pandas'. Nous avons discuté de la façon dont nous pouvons réindexer la colonne d'un DataFrame ainsi que les valeurs d'index de la ligne. Nous avons expliqué que la fonction 'reindex()' de 'pandas' est utilisée pour ce faire. Nous avons fait différents exemples dans lesquels nous avons modifié les valeurs d'index des lignes du DataFrame ainsi que les valeurs d'index de l'index de colonne du DataFrame. Nous avons rendu les résultats de tous les codes que nous avons créés ici dans ce didacticiel et les avons également expliqués en profondeur.