Comment obtenir les poids d'une couche de modèle dans PyTorch ?

Comment Obtenir Les Poids D Une Couche De Modele Dans Pytorch



Les modèles de réseau neuronal créés dans le framework PyTorch sont basés sur les paramètres apprenables des couches de modèle. Ces ' poids » sont essentiels dans la définition du traitement des données saisies pour produire des résultats en sortie. Chaque itération du modèle met à jour les poids existants afin d'améliorer la qualité des résultats et de fournir de meilleures inférences.

Dans ce blog, l'accent sera mis sur la façon d'obtenir les poids d'une couche de modèle dans PyTorch.

Quels sont les poids d’une couche de modèle dans PyTorch ?

' Poids ' et ' Les préjugés »sont deux caractéristiques essentielles des modèles de réseaux neuronaux. Ce sont deux paramètres apprenables qui sont régulièrement mis à jour pendant la boucle d'entraînement à chaque passage avant du modèle. Cette mise à jour régulière est due à un optimiseur intégré tel que l'optimiseur Adam. L'objectif des modèles de réseaux neuronaux est de faire des prédictions précises basées sur les données d'entrée et les poids et biais sont utilisés pour ajuster ces résultats afin de minimiser les pertes.







Comment obtenir les poids d'une couche de modèle dans PyTorch ?

Le ' poids ' d'une couche sont stockés dans le dictionnaire Python et utilisent la syntaxe ' état_dict() ». Le dictionnaire est utilisé pour appeler les poids en suivant les étapes ci-dessous :



Étape 1 : Ouvrez l'IDE Colab

Ce tutoriel commencera par le choix de l'IDE pour le projet. Aller au Colaboratoire site web et démarrez un ' Nouveau cahier » pour commencer à travailler :







Étape 2 : Installer et importer des bibliothèques

Après avoir configuré le notebook Colab, ' installer ' et ' importer » les bibliothèques qui couvrent toutes les fonctionnalités requises dans le projet :

! pip installer la torche

importer torche

importer vision de la torche. des modèles

Le code ci-dessus fonctionne comme suit :



  • Le ' pépin ' Le programme d'installation du package de Python est utilisé pour installer l'essentiel ' torche ' bibliothèque.
  • Ensuite, le « importer ' La commande est utilisée pour l'importer dans le projet.
  • Enfin, le « torchvision.modèles ' Le package est également importé pour les fonctionnalités supplémentaires des modèles d'apprentissage en profondeur :

Étape 3 : Importer le modèle ResNet

Dans ce tutoriel, le ' ResNet50 ' Un modèle de réseau neuronal avec 50 couches contenues dans la bibliothèque torchvision est utilisé pour la démonstration. Importez le modèle pré-entraîné comme indiqué :

exemple_modèle = vision de la torche. des modèles . sérieux50 ( pré-entraîné = Vrai )

Étape 4 : Définir le calque modèle

Définissez le nom du calque du modèle et utilisez le ' état_dict() ' méthode pour obtenir ses poids comme indiqué :

nom_couche_échantillon = 'couche2.0.conv1'

sample_layer_weights = exemple_modèle. état_dict ( ) [ nom_couche_échantillon + '.poids' ]

imprimer ( 'Poids des couches : \n ' , sample_layer_weights. forme )

Le code ci-dessus fonctionne comme suit :

  • La deuxième couche alambiquée du modèle ResNet50 est affectée au « nom_couche_échantillon » variables.
  • Puis le ' état_dict() ' La méthode est utilisée avec le ' exemple_modèle ' variable et ils sont affectés à la variable ' sample_layer_weights » variables.
  • Le ' nom_couche_échantillon ' et le ' .poids » sont ajoutés comme arguments du « état_dict() » afin d’obtenir des poids.
  • Enfin, utilisez le ' imprimer() ' pour afficher les poids des couches comme sortie :

Le résultat ci-dessous montre que nous avons obtenu les poids de la couche modèle dans Pytorch :

Note : Vous pouvez accéder à notre Colab Notebook à cette adresse lien .

Conseil de pro

Les poids d'une couche de modèle dans PyTorch présentent la progression de la boucle d'entraînement. Ces pondérations sont utilisées pour vérifier la croissance du modèle à mesure qu'il traite les données d'entrée en résultats et prévisions de sortie. L'obtention des poids d'une couche est importante pour évaluer la qualité des résultats et vérifier si des améliorations doivent être apportées ou non.

Succès! Nous avons démontré comment obtenir les poids d'une couche d'un modèle PyTorch.

Conclusion

Obtenez les poids d'une couche de modèle dans PyTorch en utilisant le 'état_dict() ' après avoir importé un modèle depuis torchvision ou utilisé un modèle personnalisé. Les poids d'une couche de modèle sont les paramètres apprenables qui sont constamment mis à jour pendant la formation et cataloguent sa progression. Dans cet article, nous avons montré comment importer le modèle ResNet50 depuis torchvision et obtenir les poids de sa deuxième couche alambiquée.