La reconnaissance optique de caractères (OCR), ou océrisation, est plus simplement appelée reconnaissance de texte. Un programme OCR extrait et réutilise les données des documents numérisés, des images d’appareils photo et des fichiers PDF contenant uniquement des images. Le logiciel OCR distingue les lettres sur l’image, les met en mots, puis met les mots en phrases, permettant ainsi l’accès et l’édition du contenu original. Il élimine également le besoin de saisie manuelle des données.
gImageReader est un logiciel gratuit et libre, sous licence GNU GPL V3, disponible sur Windows et Linux, qui permet d’extraire du texte d’une image ou d’un fichier PDF. Vous pourrez ensuite copier le texte extrait de l’image pour le coller dans votre éditeur de texte préféré, comme Word, OnlyOffice ou LibreOffice.
Le fonctionnement est simple. Vous importez l’image ou le fichier PDF dans gImageReader, vous sélectionnez sur l’image et avec l’aide de votre souris le texte à extraire, puis vous cliquez sur « Reconnaître la sélection ». Le texte à copier s’affiche instantanément dans le panneau de droite.
Source : https://github.com/manisandro/gImageReader
Télécharger le logiciel : https://github.com/manisandro/gImageReader/releases
Sur Linux, il faudra aussi installer « tesseract-ocr » et le pack de langue souhaité « tesseract-ocr-fra » (pour le français).
Transformez votre visibilité avec notre agence de communication !
Boostez votre présence en ligne et atteignez vos objectifs marketing grâce à notre expertise en communication et création web, pour captiver et engager votre public cible.