Advertisement
  1. Computer Skills

Comment OCR texte dans les fichiers PDF et image dans Adobe Acrobat

Scroll to top
Read Time: 7 min
This post is part of a series called Going Paperless.
How to OCR Documents Online With ABBYY FineReader
5 Ways to OCR Documents on Your Mac

() translation by (you can also view the original English article)

Les documents numérisés sont grands. Ils vous permettent d'archiver des piles de papier dans des dossiers sur votre ordinateur, en prenant beaucoup moins de place et d'être infiniment plus facile à organiser, déplacer et copier.  Ce n'est pas si grande est la recherche de contenu stockés à l'abri à l'intérieur de l'un de vos centaines de documents numérisés.   Par défaut, ils sont un peu plus d'une image de votre document—et si vous voulez trouver des informations à l'intérieur d'eux, vous devrez l'ouvrir et de le lire pour vous-même.

 Ou, vous pouvez laisser votre ordinateur faire le travail pour vous, de transformer votre image en texte et vous permettant de rechercher vos documents numérisés aussi facilement que vous recherchez dans tout autre document.  C'est ce que l'OCR—Reconnaissance Optique de Caractères—ne. Il utilise votre ordinateur intelligence de reconnaître les formes de lettres dans une image ou d'un document scanné, et de les transformer en texte numérique, vous pouvez les copier et les modifier au besoin.

 Voici comment vous pouvez utiliser l'OCR outil intégré dans Adobe Acrobat pour transformer vos documents numérisés et des images de texte réel digital texte. 

OCR un Document ou une Image dans Acrobat 

 Adobe Acrobat est à l'origine du programme standard pour la création, l'édition et la visualisation de fichiers PDF. Il est couramment utilisé dans les affaires, et est livré avec Adobe Creative Suite et la version complète de Creative Cloud, donc il ya une bonne chance que votre ordinateur d'entreprise a déjà installé—ou vous pouvez installer gratuitement à partir de votre Creative Cloud abonnement. Si oui, c'est un excellent outil pour OCR vos documents rapidement sur un Mac ou un PC. 

Remarque: ce tutoriel nécessite le logiciel Adobe Acrobat, pas Adobe Reader. Ce dernier est une application gratuite que pour la visualisation des fichiers Pdf. Si c'est tout ce que vous avez, le saut à la fin de ce tutoriel, pour certains autres grands OCR outils que vous pouvez utiliser. 

PDF in Acrobat ready to OCRPDF in Acrobat ready to OCRPDF in Acrobat ready to OCR
Ouvrez votre image ou PDF et obtenir Acrobat commencé à reconnaître votre texte 

 Acrobat peut reconnaître du texte dans un fichier PDF ou image dans des dizaines de langues. Tout ce que vous avez à faire est d'ouvrir le document scanné ou l'image que vous souhaitez OCR, puis cliquez sur le bleu bouton Outils en haut à droite de la barre d'outils.  Dans cette barre latérale, sélectionnez la reconnaissance du Texte de l'onglet, puis cliquez sur le Dans Ce Fichier bouton.

 Vous pourrez maintenant obtenir quelques options pour adapter votre OCR. Si vous êtes à la reconnaissance d'un document dans votre ordinateur par défaut de langues (l'anglais (états-unis) dans mon cas), il suffit de cliquer sur OK pour que votre texte soit reconnu.  Sinon, cliquez sur le bouton Modifier... pour sélectionner votre langue OCR, choisissez votre style de sortie PDF, et la résolution que vous voulez Acrobat pour utiliser tout en reconnaissant votre texte.

Acrobat OCR settingsAcrobat OCR settingsAcrobat OCR settings
Modifiez vos paramètres de ROC 

 Après une courte pause, indiqué par une barre de progression au bas de la fenêtre, votre texte sera pleinement reconnue. Il a fallu seulement 15 secondes pour reconnaître le texte sur un numérisée 1 page formulaire sur mon 2012 MacBook Air, mais il y a quelques minutes sur 30 pages en couleur complète des manuels PDF.  Une fois que c'est fait, vous pouvez sélectionner n'importe quel texte dans le document et le copier comme d'habitude, ou rechercher du texte dans le document. Par défaut, Acrobat enregistrer le texte reconnu à l'intérieur du fichier d'origine lorsque vous OCR PDF, et si vous OCR une image, il va enregistrer l'image avec le texte dans un nouveau fichier PDF.  De toute façon, le texte reconnu sera afficher dans n'importe quel lecteur de PDF par la suite, comme si c'était un original des documents numériques.

OCRed text in AcrobatOCRed text in AcrobatOCRed text in Acrobat
Copier du texte à partir d'un document numérisé en texte brut ou avec mise en forme, ou tout simplement utiliser le PDF comme PDF normal 

 Avec le texte reconnu, vous pouvez maintenant le balisage le PDF à l'aide de tous les outils d'annotation—vous pouvez mettre en évidence, d'une croix de texte, et plus encore. Vous pouvez même copier le texte avec les détectée mise en forme, même si c'est souvent moins précise que la reconnaissance du texte lui-même.

Exporter Vos Documents Soumis À La Roc 

 Si vous êtes désireux de modifier les originaux de vos documents numérisés, ou peut-être réutiliser les infos dans le dans un nouveau document, vous aurez plus que juste sélectionnable texte sur un fichier PDF.  Vous aurez besoin de la version intégrale du document converti. Acrobat qui facile ainsi, l'utilisation de la roc du texte et de l'exporter en tant que nouveau document en une seule étape.

 Il suffit d'ouvrir le document que vous voulez de ROC et de les convertir, cliquez sur Fichier > Enregistrer sous... et choisir le format que vous souhaitez.  Vous pouvez exporter au format Word ou rtf, Excel ou CSV tableur, ou au format HTML. Ajouter le nom de fichier que vous voulez et l'emplacement où vous souhaitez enregistrer votre nouveau fichier, et cliquez sur Enregistrer.  Acrobat allons procéder à montrer la même barre de progression au bas de la fenêtre comme il reconnaît le texte et la mise en forme de votre document, puis enregistrez le document exporté.

Export PDF or image in Word format from AcrobatExport PDF or image in Word format from AcrobatExport PDF or image in Word format from Acrobat
Exportation de vos images et des fichiers Pdf à partir d'Acrobat avec des résultats variables. 

Acrobat les exportations à partir de documents numérisés sont tous deux de très bons et de très mauvais.   Il va reconnaître la plupart du texte et de mise en forme, et vous aurez probablement être surpris par la façon dont nice, le fini de document exporté regarde si il n'est pas trop complexe. Mais alors, il n'est toujours pas le document original.  Il y aura des erreurs, mise en forme, vous aurez besoin de les corriger, et plus encore. La meilleure façon est de toujours utiliser la version originale du document numérique, mais c'est un excellent moyen pour obtenir le retour à une copie numérique d'un document si vous ne disposez que d'une analyse.

 Alors que l'OCR n'est pas parfait, Acrobat OCR est assez bonne. Dans ce formulaire scanné, presque chaque mot a été détecté correctement, si une instance de la parole de Nom a été détectée comme N""e. C'est tout à fait assez bon si vous êtes juste de vouloir être en mesure à peu près une recherche dans vos documents à l'aide de votre lecteur de PDF est un outil de recherche, mais si vous êtes réellement à l'aide de la reconnaissance optique de faire une copie du texte original, vous aurez envie de relire d'abord et assurez-vous de corriger toutes les erreurs évidentes.

OCR Plusieurs Documents À la Fois 

 Vous avez une tonne de documents que vous voulez de ROC à la fois? Acrobat est idéal pour cela. Il suffit d'ouvrir n'importe quel document dans Acrobat, puis ouvrez le Reconnaître du Texte encadré volet comme avant.  Cette fois, sélectionnez Dans Plusieurs Fichiers bouton, et vous verrez une fenêtre dans laquelle vous pouvez faire glisser tous vos fichiers que vous souhaitez OCR. Encore une fois, vous pouvez ajouter des fichiers PDF ou image, et Acrobat reconnaître le texte et l'enregistrer en format PDF.  Il y a aussi quelques options supplémentaires, où vous pouvez choisir l'emplacement où enregistrer les fichiers finalisés et comment vous souhaitez que le nom.

Bulk OCR documentsBulk OCR documentsBulk OCR documents

D'autres Outils OCR 

 Acrobat n'est pas la seule façon de OCR texte à partir de documents numérisés, bien sûr. Si vous ne possédez pas déjà une copie de celui-ci, il y a une tonne d'autres outils que vous pouvez utiliser. Nous avons déjà couvert les meilleurs outils pour l'OCR sur votre Mac: Prizmo, FineReader, la Doxie application, PDFPen, et Evernote. Prizmo et PDFPen également travailler sur vos appareils iOS pour l'OCR sur l'aller, et le Doxie appli fonctionne aussi sur Pc.  Evernote ne vous permet pas de copier du texte, mais il fonctionne partout et sur le PC, OneNote OCR est grande et libre. 

Il y a aussi le libre Tesseract OCR bibliothèque, avec un état de base libre Mac app qui permet de reconnaître le texte pour vous. D'un autre budget-friendly OCR outil est pica texte, pour 3,99$.  De toute façon, si l'OCR est tout ce dont vous avez besoin, vous n'avez pas à obtenir une copie de Acrobat juste pour cela, mais si vous disposez d'Acrobat, ses OCR est un outil super extra. 

Conclusion 

 En prenant quelques minutes pour OCR vos documents PDF est tout, il va prendre pour obtenir de la base d'images de vos documents papier à part entière de documents numériques, vous pouvez rechercher, copier du texte à partir, de marquage et d'exporter dans les formats Office. Acrobat a été décrié pour son lecteur de PDF, mais il a encore une tonne de fonctionnalités, et de ROC est l'un d'entre eux.

Si vous avez une copie de Acrobat, ou Creative Cloud abonnement, essayez-le et obtenir vos documents numérisés sous roc. Ils vous instantanément être plus précieux pour vous que ce qu'ils avaient jamais être comme de simples scans. 

Advertisement
Did you find this post useful?
Want a weekly email summary?
Subscribe below and we’ll send you a weekly email summary of all new Computer Skills tutorials. Never miss out on learning about the next big thing.
Advertisement
Looking for something to help kick start your next project?
Envato Market has a range of items for sale to help get you started.