Advertisement
  1. Computer Skills
  2. Productivity

5 Möglichkeiten zum OCR-Dokumentieren auf Ihrem Mac

Scroll to top
Read Time: 11 min
This post is part of a series called Going Paperless.
How to OCR Text in PDF and Image Files in Adobe Acrobat
Quick Tip: Share Your Mac's Printer and Scanner

German (Deutsch) translation by Valentina (you can also view the original English article)

Wenn Sie angespornt wurden, in ein papierloses Büro zu ziehen, sind Sie nicht allein! 2013 ist das Jahr der Papierlosigkeit. Das bedeutet nicht nur, dass Sie diese alten Belege und Korrespondenz scannen, sondern auch vollständig digitalisieren. In diesem Handbuch zeigen wir Ihnen fünf verschiedene Apps, mit denen Sie gescannte Dokumente mithilfe einer Technologie namens OCR in vollständig durchsuchbare konvertieren können.

Aktualisierung: Mit der neuen DocScan-App auf Envato Market können Sie Dokumente auch problemlos mit der OCR-Technologie über Ihr iPhone scannen.

DocScan app on Envato MarketDocScan app on Envato MarketDocScan app on Envato Market
DocScan App auf dem Envato Market

Wenn Sie zum Scannen Ihrer Dokumente lieber einen herkömmlichen Scanner verwenden möchten, lesen Sie weiter, um alle Einzelheiten dazu zu erfahren.

Was ist OCR?

OCR steht für Optical Character Recognition. Wenn Sie ein Dokument scannen, kann der Scanner selbst nicht erkennen, was der Unterschied zwischen Text und Bild ist. Alles, was Sie scannen, ist also effektiv ein Bild. Dies gilt auch dann, wenn Sie es als PDF speichern möchten, da Sie (noch) keinen Text auswählen können.

Die OCR-Technologie gibt es schon seit einiger Zeit, aber sie ist eine oft untertriebene Funktion, die normalerweise nie übersehen wird. Wenn Sie in den letzten Jahren einen Scanner gekauft haben, haben Sie wahrscheinlich bereits eine ziemlich raffinierte OCR-Software auf der mitgelieferten Disc! Als Mac-Benutzer werden wir manchmal von der Tatsache verwöhnt, dass wir uns kaum um die Installation von Treibern kümmern müssen, sodass Software auf denselben Discs häufig ignoriert wird.

Tipp: Ein PDF ist nur ein Container für Text und Bilder, sodass Belege oder Korrespondenz, die Sie gescannt und als PDF gespeichert haben, noch nicht durchsucht werden können.


1. Prizmo

Prizmo ist eine spezielle OCR-App. Es soll Ihnen nicht dabei helfen, Ihre gescannten Dokumente zuzuschneiden oder zu begradigen. Es dient lediglich dazu, den Text von Scans zu analysieren und in durchsuchbaren Text umzuwandeln. Prizmo beschränkt sich nicht nur auf reine Textdokumente wie Quittungen und Korrespondenz, sondern analysiert sogar alte Zeitungen und Zeitschriften, Buchumschläge und so ziemlich alles, was Prizmo in Form, Größe und Farbe von Text konvertiert.

Prizmo bietet die Möglichkeit, Scans direkt von Image Capture, der in OS X integrierten Kamera- und Scanner-Import-App, zu erfassen, sodass Sie sie in Verbindung mit jedem vorhandenen Scanner verwenden können. Sie können auch vorhandene Dateien importieren, wenn Sie diese bereits gescannt haben.

Schritt 1

Wenn Sie Prizmo starten, werden Sie aufgefordert, entweder ein neues Dokument zu erstellen oder ein vorhandenes zu öffnen. Bevor Sie fortfahren, bezieht sich dies auf ein Prizmo-Dokument und nicht auf das, das Sie analysieren möchten. Es kann etwas verwirrend sein, aber Prizmo kann die von Ihnen durchgeführten Scans speichern, wenn Sie jemals zurückgehen und den Text ändern müssen, z. B. wenn Sie in einem 200-seitigen PDF gescannt haben und festgestellt haben, dass einige Seiten nicht ordnungsgemäß analysiert wurden Die Mitte und ein Teil des Textes fehlten. Wenn Sie Ihre Arbeit in Prizmo speichern, können Sie nach Bedarf Änderungen vornehmen.

Prizmo is an all-in-one OCR toolPrizmo is an all-in-one OCR toolPrizmo is an all-in-one OCR tool

Prizmo erstellt seine eigenen Dokumente, damit Sie später darauf zurückgreifen (und sie bearbeiten) können

Wählen Sie Neues Dokument... und Sie erhalten ein neues Prizmo-Dokument, das Sie verwenden können.

Prizmo creates its own documents so that you can refer back to them and edit them laterPrizmo creates its own documents so that you can refer back to them and edit them laterPrizmo creates its own documents so that you can refer back to them and edit them later

Prizmo erstellt seine eigenen Dokumente, damit Sie später darauf zurückgreifen (und sie bearbeiten) können

Wir können entweder eine Bilddatei (JPG, PDF, TIFF usw.) ziehen und ablegen, von unserem Scanner importieren oder sogar eine Fotobibliothek durchsuchen.

Schritt 2

Für die Zwecke dieses Tutorials verwende ich ein vorhandenes Dokument, das ich mit meinem Flachbettscanner eingescannt habe. Es wurde direkt als PDF gespeichert und wie Sie sehen, kann ich keinen Text hervorheben.

Wählen Sie Bilddatei öffnen… und wählen Sie ein Bild aus, das verwendet werden soll.

Schritt 3

Sobald Sie das Bild geladen sehen, wird Ihnen ein vertrautes Seitenlayout mit Seiten-Miniaturansichten auf der linken Seite angezeigt.

Prizmo has an appearance very similar to Apples Preview appPrizmo has an appearance very similar to Apples Preview appPrizmo has an appearance very similar to Apples Preview app

Prizmo sieht der Preview-App von Apple sehr ähnlich

Wir haben unten einige Anpassungssteuerelemente, mit denen wir die Drehung anpassen, das Bild zuschneiden und vieles mehr können. Prizmo erkennt automatisch die Anforderungen des Dokuments und nimmt die erforderlichen Einstellungen automatisch vor. Wir können sie jedoch jederzeit anpassen, wenn dies erforderlich ist.

Schritt 4

Ich bin mit den Standardeinstellungen zufrieden. Klicken Sie einfach auf Erkennen. Prizmo erkennt automatisch alle Textbereiche und analysiert sie fast sofort.

Prizmo can OCR documents quickly and accuratelyPrizmo can OCR documents quickly and accuratelyPrizmo can OCR documents quickly and accurately

Prizmo kann OCR-Dokumente schnell und genau erstellen

Genauso wie Sie beim Scannen eines Dokuments einen Bereich zum Scannen zeichnen würden, können Sie dies auch für Textbereiche tun. Prizmo wird dies automatisch versuchen, aber Sie haben wieder die vollständige Kontrolle.

Der analysierte Text wird dann auf der rechten Seite des Dokuments angezeigt. Zu diesem Zeitpunkt wird nichts gespeichert. Wenn die OCR nicht vollständig korrekt war, können Sie Änderungen vornehmen.

Schritt 5

Prizmo war mit meinem Dokument 100% genau, sodass ich keine Änderungen vornehmen muss. Sie können Ihr Dokument in eine Reihe von Cloud-Diensten wie Dropbox und Google Drive exportieren oder an eine neue E-Mail-Nachricht anhängen.

Prizmo includes support for a number of cloud servicesPrizmo includes support for a number of cloud servicesPrizmo includes support for a number of cloud services

Prizmo bietet Unterstützung für eine Reihe von Cloud-Diensten

Ich werde mein Dokument auf meinem Desktop speichern, also wähle ich Datei...

Prizmo ist äußerst nützlich für alle, die regelmäßig Dokumente mit einem beliebigen Scannertyp scannen. Mit den erweiterten Steuerelementen, auf die Sie zugreifen können, können Sie die Funktionsweise des OCR-Prozesses optimieren, anstatt sich auf vollautomatische Einstellungen zu verlassen.

Erfahren Sie mehr über Prizmo.


2. ABBYY FineReader Express

ABBYY FineReader Express ist ein weiteres spezielles OCR-Werkzeug, das speziell für diese Aufgabe entwickelt wurde und sehr gut funktioniert. Der OCR-Prozess ist automatisiert, sodass die einzige Benutzerinteraktion darin besteht, ABBYY FineReader Express mitzuteilen, welches Dokument geladen werden soll und wo die OCR-Version gespeichert werden soll.

Anstatt ein neues Dokument zu erstellen oder ein vorhandenes zu öffnen, verfügt ABBYY FineReader Express über ein Schnellaufgabenfenster, das beim Start geöffnet wird. Dies ist eine schnelle Möglichkeit, OCR-Dokumente mit möglichst wenigen Mausklicks zu erstellen.

Sie können gescannte Dokumente in eine Reihe verschiedener Formate konvertieren. Ein Ass im Ärmel ist die Möglichkeit, eine Tabelle zu OCRen und eine vollständig durchsuchbare und bearbeitbare auszugeben, was sie für Geschäftsanwender sehr verlockend macht.

Schritt 1

Da wir bereits eine PDF-Datei haben, müssen wir OCR ausführen, ABBYY FineReader Express starten, In durchsuchbare PDF-Datei konvertieren auswählen und das gewünschte Dokument auswählen.

ABBY FineReader Express includes a Quick Tasks panel to make OCR easyABBY FineReader Express includes a Quick Tasks panel to make OCR easyABBY FineReader Express includes a Quick Tasks panel to make OCR easy

ABBYY FineReader Express enthält ein Bedienfeld für Schnellaufgaben, um die OCR zu vereinfachen

Schritt 2

Das ist es eigentlich! ABBYY FineReader Express fordert Sie auf, das neue OCR-Dokument an einem Ort Ihrer Wahl zu speichern. Seltsamerweise werden Sie aufgefordert, das Dokument zu speichern, bevor die Vorschau geladen wird. Um festzustellen, ob ABBYY FineReader Express das Dokument ordnungsgemäß OCR-fähig war, müssen Sie das Speichern des Dokuments abbrechen und es stattdessen über das Menü speichern.

ABBYY is one of the simplest apps to use when it comes to OCRABBYY is one of the simplest apps to use when it comes to OCRABBYY is one of the simplest apps to use when it comes to OCR

ABBYY ist eine der am einfachsten zu verwendenden Apps, wenn es um OCR geht

Erfahren Sie mehr über ABBYY FineReader Express.


3. Doxie

Wir haben den Doxie-Scanner und die Doxie-Software in unserem vorherigen Handbuch "Mit Doxie papierlos arbeiten" behandelt, aber es lohnt sich, die integrierten OCR-Funktionen noch einmal zu erwähnen.

Doxie enthält eine integrierte OCR in seiner Import-App, sodass alle von Ihnen gescannten Dokumente analysiert werden können. Doxie enthält jedoch nicht viele Steuerelemente und automatisiert den größten Teil des Prozesses.

Doxie has fewer controls than an app such as PrizmoDoxie has fewer controls than an app such as PrizmoDoxie has fewer controls than an app such as Prizmo

Doxie hat weniger Steuerelemente als eine App wie Prizmo

Schritt 1

Scannen Sie jedes Dokument, das Sie OCR-fähig machen möchten, und starten Sie dann die Doxie-App. Stellen Sie dabei sicher, dass Ihr Doxie-Scanner angeschlossen ist.

Schritt 2

Nachdem Sie Ihr gescanntes Dokument importiert haben, können Sie auswählen, wo und wie Sie es exportieren möchten. In diesem Fall wähle ich PDF mit OCR (Schwarzweiß) aus. Es ist besser, den Dokumenttyp auszuwählen, da dadurch sichergestellt werden kann, dass ein Format verwendet wird, das weniger Speicherplatz beansprucht.

Doxie includes the option to export as a PDF or with OCR addedDoxie includes the option to export as a PDF or with OCR addedDoxie includes the option to export as a PDF or with OCR added

Doxie bietet die Möglichkeit, als PDF oder mit OCR zu exportieren

Tipp: Viele Unternehmen senden häufig Korrespondenzbriefe in einer bestimmten Farbe, um das Branding beizubehalten. Ich würde empfehlen, sie nur in Schwarzweiß zu speichern, um die Dateigröße so gering wie möglich zu halten.

Schritt 3

Sobald Sie ausgewählt haben, wo die PDF-Datei gespeichert werden soll, wird das Dokument von Doxie OCR-fähig gemacht und exportiert. Der Text ist vollständig durchsuchbar und ersetzt nicht den Text des Scans. Stattdessen wird eine clevere Funktion von PDFs verwendet, die als Textüberlagerung bezeichnet wird. Ihr Dokument sieht möglicherweise genauso aus wie zuvor, aber das ist gut so. Stattdessen wird der Text transparent über dem Text platziert, sodass er durchsucht und hervorgehoben werden kann.

Doxie still keeps the appearance of the PDF but overlays text that can be highlightedDoxie still keeps the appearance of the PDF but overlays text that can be highlightedDoxie still keeps the appearance of the PDF but overlays text that can be highlighted

Doxie behält weiterhin das Erscheinungsbild der PDF-Datei bei, überlagert jedoch Text, der hervorgehoben werden kann

Obwohl der Doxie-Prozess sehr einfach ist, gibt es nicht so viele Optionen wie bei einer dedizierten OCR-App wie Prizmo. Wenn Sie jedoch bereits Doxie-Benutzer sind oder nur leichte Scans durchführen, sind diese Funktionen für Sie möglicherweise nicht von großem Nutzen.

Doxie-Scanner kosten ab 119 US-Dollar und sind bei Getdoxie.com erhältlich.


4. PDFPen

PDFPen unterscheidet sich ein wenig von Prizmo, da es nicht nur ein OCR-Werkzeug ist. Es ist ein All-in-One-Werkzeug zum Ausfüllen, Bearbeiten und Ändern von PDFs. Eine seiner Funktionen ist, dass es gescannte Dokumente erkennen und in einem Schritt eine OCR durchführen kann.

Schritt 1

Starten Sie PDFPen und Sie werden automatisch aufgefordert, ein zu öffnendes PDF auszuwählen. Wählen Sie ein gescanntes Dokument aus und klicken Sie auf Öffnen.

Schritt 2

Sobald PDFPen das Dokument öffnet und feststellt, dass es gescannt wurde (anstatt heruntergeladen oder computergeneriert), werden Sie gefragt, ob Sie es analysieren und den Text digitalisieren möchten. Sie haben die Möglichkeit, das OCR-Werkzeug nur auf der aktuellen Seite oder im gesamten Dokument auszuführen.

PDFPen is another app designed to automate most of the OCR processPDFPen is another app designed to automate most of the OCR processPDFPen is another app designed to automate most of the OCR process

PDFPen ist eine weitere App, mit der der größte Teil des OCR-Prozesses automatisiert werden kann

Geben Sie die gewünschte Sprache an und klicken Sie auf die entsprechende Schaltfläche. In diesem Fall habe ich gerade OCR-Dokument ausgewählt.

Schritt 3

Speichern Sie das PDF, sobald es fertig ist. Im Gegensatz zu Doxie oder Prizmo erstellen Sie nicht sofort eine weitere Kopie. PDFPen ändert vorhandene PDF-Dateien, sodass Sie die Änderungen einfach speichern können, um die Unannehmlichkeiten beim Verwalten einer zusätzlichen Datei zu vermeiden.

Erfahren Sie mehr über PDFPen.


5. Evernote

Evernote ist ein äußerst beliebter Dienst zur Synchronisierung von Notizen, der eher als Hybrid zwischen einem Sammelalbum und einem Notizbuch fungiert. Stellen Sie sich einen Aktenschrank voller Informationen vor, der immer verfügbar und immer leicht zu suchen ist.

Wir haben Evernote bereits ausführlich auf Mactuts + behandelt und ich ermutige jeden, der Evernote verwendet (oder daran interessiert ist, es mehr zu verwenden), unseren Artikel "Den Elefanten zähmen: Tolle Tipps und Tricks für Evernote" zu lesen, um mehr darüber zu erfahren.

Eine Funktion von Evernote, die oft übersehen und dem Benutzer nie wirklich gezeigt wird, ist der automatische OCR-Dienst. Ja, jedes Bild, das Sie zu Evernote hinzufügen, wird nach Text durchsucht und Ihrer Notiz hinzugefügt. Es wird serverseitig ausgeführt, sodass das Hinzufügen eines Dokuments zu Evernote nicht sofort konvertiert wird. Aufgrund der Anzahl der Evernote-Benutzer ist dies auch nicht sofort möglich. Um Serverprobleme zu vermeiden, werden alle Dokumente, die OCR erfordern, in die Warteschlange gestellt. Es gibt keine Möglichkeit zu wissen, wann es gescannt wird, aber normalerweise innerhalb von 24 bis 48 Stunden. Wenn Sie ein Premium-Mitglied sind, geht es schneller.

Schritt 1

Um ein Dokument scannen zu lassen, ziehen Sie es einfach und fügen Sie es einer neuen oder vorhandenen Notiz hinzu. Stellen Sie sicher, dass Sie Evernote synchronisieren, sobald Sie es getan haben. Das ist alles dazu.

Evernote supports attachments for notes and any images will automatically be OCRd by their serversEvernote supports attachments for notes and any images will automatically be OCRd by their serversEvernote supports attachments for notes and any images will automatically be OCRd by their servers

Evernote unterstützt Anhänge für Notizen und alle Bilder werden automatisch von ihren Servern OCR-fähig

Schritt 2

Schließlich scannt Evernote das Dokument und führt eine OCR durch. In diesem Fall wird das Dokument aktualisiert und auf Ihrem Gerät wieder mit Evernote synchronisiert. Es dauerte ungefähr zehn Minuten, bis Evernote das von mir hinzugefügte Dokument OCR-fähig war (ich bin ein Evernote Premium-Abonnent, daher variieren die Zeiten).

Die OCR ist normalerweise sehr genau, es gibt jedoch keine Kontrolle darüber, wie die OCR funktioniert. Dies erfolgt automatisch ohne Benutzereingaben oder Einstellungen.

Schritt 3

Sie können dann nach Text suchen und, wie Sie sehen können, den Text bei der Suche hervorheben. Nach Durchsicht der Notiz scheint sie 100% genau gewesen zu sein.

Once the document has been OCRd by Evernotes servers it will be searchable within Evernote and youll have the ability to export the document as a searchable PDF as wellOnce the document has been OCRd by Evernotes servers it will be searchable within Evernote and youll have the ability to export the document as a searchable PDF as wellOnce the document has been OCRd by Evernotes servers it will be searchable within Evernote and youll have the ability to export the document as a searchable PDF as well

Sobald das Dokument von den Evernote-Servern OCR-fähig ist, kann es in Evernote durchsucht werden, und Sie können das Dokument auch als durchsuchbares PDF exportieren

Schritt 4 (Optional)

Wenn Sie eine durchsuchbare PDF-Version außerhalb von Evernote behalten möchten, können Sie mit der rechten Maustaste klicken und Suchbare PDF speichern unter...

Es ist nicht ideal, da Evernote jedes Wort mit einem grünen Kästchen umschließt, sodass das Drucken möglicherweise keine so gute Idee ist, aber es funktioniert.

Obwohl die Funktionen recht einfach sind, wird die Verwendung von Evernote als zentraler Hub für Ihr papierloses Büro immer beliebter. Wenn Sie dasselbe tun möchten, können Sie jeden OCR-Prozess ausschalten und Scans direkt in Evernote ablegen. Die OCR wird für Sie erledigt. Da es sich bei den meisten Artikeln um Belege und Korrespondenz handelt, haben Sie wahrscheinlich fast kein Problem mit dem OCR-Service von Evernote.

Evernote ist kostenlos, mit Premium-Konten für 5 USD pro Monat oder 35 USD pro Jahr.


Einpacken

Es gibt verschiedene Möglichkeiten, diese gescannten Dokumente zu digitalisieren, um sie durchsuchbar zu machen, und die Kosten für die Verwendung eines OCR-Werkzeugs sind drastisch gesunken. Vorbei sind die Zeiten, in denen Sie sich nicht mehr an die App halten, mit der Ihr Scanner geliefert wurde. Jetzt können Sie so ziemlich jede OCR-App verwenden, die Sie möchten.

Wenn Sie nicht nur OCR-Werkzeugs verwenden, sondern auch PDF-Dateien bearbeiten möchten, ist PDFPen die beste Wahl. Für alle, die nur einen Weg zu OCR suchen, würde ich Prizmo empfehlen. Selbst wenn Sie einen Doxie haben, gibt Ihnen Prizmo mehr Kontrolle darüber, wie der OCR-Prozess funktioniert.

Für alle, die gelegentlich etwas OCR machen möchten, ist es die wirtschaftlichste Option, ein kostenloses Evernote-Konto zu erhalten.

Haben Sie versucht, papierlos zu werden? Haben Sie Probleme mit OCR oder ist in Ihrem digitalen Büro alles durchsuchbar? Wir würden uns freuen, von Ihnen zu hören. Besprechen Sie das Theme daher wie immer in den Kommentaren.

Advertisement
Did you find this post useful?
Want a weekly email summary?
Subscribe below and we’ll send you a weekly email summary of all new Computer Skills tutorials. Never miss out on learning about the next big thing.
Advertisement
Looking for something to help kick start your next project?
Envato Market has a range of items for sale to help get you started.