Comment effectuer une classification de texte à l'aide de transformateurs

Comment Effectuer Une Classification De Texte A L Aide De Transformateurs



À cette époque, les Transformers sont les modèles les plus puissants qui ont fourni les meilleurs résultats dans plusieurs opérations NLP (Natural Language Processing). Initialement, il était utilisé pour des tâches de modélisation linguistique, notamment la génération et la classification de texte, la traduction automatique et bien d'autres encore. Mais désormais, il est également utilisé pour la reconnaissance d’objets, la classification d’images et plusieurs autres tâches de vision par ordinateur.

Dans ce didacticiel, nous fournirons la procédure pour effectuer la classification de texte à l'aide de Transformers.







Comment effectuer une classification de texte à l'aide de transformateurs ?

Pour effectuer la classification de texte à l'aide de Transformers, installez tout d'abord le ' transformateurs ' bibliothèque en exécutant la commande fournie :



! pépin installer transformateurs


Comme vous pouvez le constater, la bibliothèque spécifiée a été installée avec succès :




Ensuite, importez le « pipeline ' du ' transformateurs ' bibliothèque:





à partir du pipeline d'importation de transformateurs


Ici le ' pipeline » inclura la tâche NLP que nous devons effectuer et le modèle de transformateur souhaité pour cette opération ainsi que le tokenizer.

Note: Le tokenizer est utilisé pour effectuer un traitement sur le texte destiné à fournir l’entrée du modèle en séparant le texte en jetons.



Après cela, utilisez le ' pipeline() ' fonction et passez-lui le ' classification zéro tir » comme argument. Ensuite, passez un autre paramètre qui est notre modèle. Nous utilisons le «  BART 'Modèle de transformateur. Ici, nous n'utilisons pas le tokenizer car il peut être automatiquement déduit par le modèle spécifié :

text_classifier = pipeline ( 'Classification zéro tir' , modèle = 'facebook/bart-large-mnli' )


Maintenant, déclarez le « séquence ' variable qui contient notre texte d'entrée qui doit être classé. Ensuite, nous fournissons les catégories dans lesquelles nous souhaitons classer le texte et l’enregistrons dans le dossier « laboratoire ' qui est connu sous le nom d'étiquettes :

séquence = 'La relecture et l'édition sont des éléments nécessaires pour garantir la clarté, la cohérence et l'absence d'erreurs du contenu'
laboratoire = [ 'mise à jour' , 'erreur' , 'important' , 'vérification' ]


Enfin, exécutez le pipeline avec l'entrée :

text_classifier ( séquence , laboratoire )


Après avoir exécuté le pipeline, comme vous pouvez le voir, le modèle a prédit que la séquence fournie serait classée :


Informations Complémentaires: Si vous souhaitez accélérer les performances du modèle, vous devez utiliser le GPU. Si oui, alors, à cette fin, vous pouvez spécifier un argument de périphérique au pipeline et le définir sur « 0 » pour utiliser le GPU.

Si vous souhaitez classer le texte sur plusieurs instructions de séquence/texte d'entrée, vous pouvez les ajouter à une liste et le transmettre en entrée aux pipelines. Pour cela, consultez l'extrait de code :

séquence = [ 'La relecture et l'édition sont des éléments nécessaires pour garantir la clarté, la cohérence et l'absence d'erreurs du contenu' ,
'Dans cette ère moderne, l'optimisation du référencement est essentielle pour que les articles soient bien classés et atteignent un public plus large' ]

text_classifier ( séquence , laboratoire )


Sortir


C'est ça! Nous avons compilé le moyen le plus simple d'effectuer la classification de texte à l'aide de Transformers.

Conclusion

Les transformateurs sont utilisés pour effectuer des tâches de modélisation du langage, telles que la génération de texte, la classification de texte et la traduction automatique, ainsi que des tâches de vision par ordinateur, notamment la reconnaissance d'objets et la classification d'images. Dans ce didacticiel, nous avons illustré le processus de classification de texte à l'aide de Transformers.