Comment installer Tesseract sur Windows

Comment Installer Tesseract Sur Windows



Tesseract est un outil de reconnaissance de texte open source disponible gratuitement, également connu sous le nom d'OCR (reconnaissance optique de caractères). Il est principalement utilisé pour identifier et extraire du texte à partir d'images. Il lira le texte des données d'image et écrira la sortie dans un nouveau fichier .txt. Tesseract fonctionne également sous Python, car il est principalement utilisé pour reconnaître l'écriture manuscrite à partir d'images. Il utilise le modèle LSTR (Long short-term memory). Tesseract travaille sous la licence Apache 2.0.

Nous détaillerons la méthode pour installer Tesseract sur Windows dans ce blog.







Alors, commençons!



Comment installer Tesseract sur Windows ?

Le Tesseract est un outil de ligne de commande utilisé pour l'extraction de texte à partir d'images. Pour installer Tesseract sur Windows, vous devez suivre les instructions ci-dessous.



Étape 1 : Télécharger le programme d'installation de Tesseract





Tout d'abord, accédez au lien fourni ci-dessous et téléchargez le programme d'installation de Tesseract en fonction des spécifications de votre système :

https: // github.com / UB-Mannheim / tesseract / la semaine



Étape 2 : Exécutez le programme d'installation de Tesseract

Visiter le ' Téléchargements ” répertoire où le programme d'installation de Tesseract est téléchargé. Pour installer Tesseract sous Windows, exécutez le programme d'installation de Tesseract en double-cliquant dessus :

Étape 3 : Sélectionnez la langue

De nombreuses langues sont prises en charge par le programme d'installation de Tesseract. Pour interagir avec l'interface utilisateur du programme d'installation, choisissez ' Anglais » comme langue et cliquez sur « D'ACCORD ” :

Étape 4 : Installer Tesseract

Ce faisant, l'assistant de configuration Tesseract OCR apparaîtra à l'écran. Pour commencer l'installation de Tesseract, cliquez sur ' Prochain ' bouton:

Accepter le ' Accord de licence ', clique le ' Je suis d'accord ' bouton:

Sélectionnez le ' Installer pour quiconque utilise cet ordinateur » et appuyez sur la touche « Prochain ' bouton:

Si vous souhaitez ajouter des données de script ou inclure une autre langue, cochez leurs cases respectives et cliquez sur ' Prochain ' bouton. Comme nous ne voulons donc aucun script de données ou langage supplémentaire, nous continuerons avec les options sélectionnées par défaut :

Choisissez l'emplacement d'installation et cliquez sur le ' Prochain ' bouton:

Si vous ne souhaitez pas créer de raccourci dans le menu Démarrer, cochez la case ' Ne créez pas de raccourcis ' et appuyez sur le ' Installer ' bouton:

Après cela, l'installation de Tesseract sera lancée. Attendez que l'installation soit terminée et cliquez sur ' Prochain ' bouton:

Enfin, cliquez sur le « Finir ' bouton:

Étape 5 : Définir la variable d'environnement

Après l'installation, vous devez définir la variable d'environnement du Tesseract. Pour ce faire, visitez d'abord le répertoire où vous avez installé le Tesseract et copiez le chemin depuis le ' Adresse ' bar:

Faites une recherche pour ' Variables d'environnement ' dans le ' Commencez « menu et ouvrir » Modifier les variables d'environnement système ” :

Dans les paramètres, accédez au ' Avancé ' menu de réglage et cliquez sur le ' Variables d'environnement ' bouton:

Choisir la ' Chemin « Variable de la » Variables système ' panneau, et appuyez sur le ' Éditer ' bouton:

Après ça ' Modifier la variable d'environnement » apparaîtra à l'écran. Appuyez sur la ' Nouveau ” et collez ici le chemin du répertoire d'installation de Tesseract copié. Enfin, cliquez sur le « D'ACCORD ' bouton:

Étape 6 : Vérifier l'installation de Tesseract

Pour vérifier l'installation de Tesseract, ouvrez l'invite de commande Windows en recherchant ' Invite de commandes ' dans le ' Commencez ' menu:

Découvrez la version de Tesseract à l'aide de la commande fournie :

> tesseract --version

La sortie ci-dessous indique que nous avons installé avec succès la version de Tesseract ' v5.2.0 ' sous Windows :

Allons de l'avant pour découvrir comment utiliser Tesseract sous Windows.

Comment utiliser Tesseract sous Windows ?

Le Tesseract est utilisé pour lire l'écriture manuscrite ou extraire du texte à partir d'images. Voyons voir comment ça fonctionne:

Étape 1 : Sélectionnez l'image

Sélectionnez l'image dont vous souhaitez extraire le texte. Comme nous l'avons choisi ' 1.png ” :

Étape 2 : Extraire le texte de l'image

Une fois le CMD ouvert. Utilisez le ' CD ” commande pour changer le répertoire où l'image est stockée. Exécutez ensuite le ' tesseract ' et définissez le nom du fichier image comme nous l'avons spécifié ' 1.png ”. La ' Texte ” indique le nom du fichier de sortie :

> CD C:\Users\anuma\OneDrive\Pictures\Images enregistrées
> tesseract 1 .png 'Texte'

Étape 3 : Vérifier l'extraction de texte

Pour vérifier l'extraction du texte, naviguez dans le répertoire où se trouve le fichier image. Vous pouvez voir que le fichier de sortie ' Texte ” est également enregistré ici. Double-cliquez sur le fichier de sortie pour vérifier si le tesseract a extrait le texte de l'image ou non :

Vous pouvez voir que nous avons réussi à extraire le texte à l'aide de l'outil de ligne de commande Tesseract :

Nous avons démontré la technique pour installer et utiliser Tesseract sous Windows.

Conclusion

Pour installer le Tesseract sur Windows, il est nécessaire de télécharger le programme d'installation de Tesseract. Pour cela, suivez la première session de cet article. Définissez ensuite la variable d'environnement Path à utiliser et accédez à Tesseract à partir de l'invite de commande Windows. Ensuite, sélectionnez le fichier image et utilisez le ' Tesseract ” commande pour reconnaître et extraire le texte de l'image. Ici, vous avez appris à installer ainsi qu'à utiliser le ' Tesseract ' sur les fenêtres.