5 Möglichkeiten zum OCR-Dokumentieren auf Ihrem Mac
German (Deutsch) translation by Valentina (you can also view the original English article)
Wenn Sie angespornt wurden, in ein papierloses Büro zu ziehen, sind Sie nicht allein! 2013 ist das Jahr der Papierlosigkeit. Das bedeutet nicht nur, dass Sie diese alten Belege und Korrespondenz scannen, sondern auch vollständig digitalisieren. In diesem Handbuch zeigen wir Ihnen fünf verschiedene Apps, mit denen Sie gescannte Dokumente mithilfe einer Technologie namens OCR in vollständig durchsuchbare konvertieren können.
Aktualisierung: Mit der neuen DocScan-App auf Envato Market können Sie Dokumente auch problemlos mit der OCR-Technologie über Ihr iPhone scannen.



Wenn Sie zum Scannen Ihrer Dokumente lieber einen herkömmlichen Scanner verwenden möchten, lesen Sie weiter, um alle Einzelheiten dazu zu erfahren.
Was ist OCR?
OCR steht für Optical Character Recognition. Wenn Sie ein Dokument scannen, kann der Scanner selbst nicht erkennen, was der Unterschied zwischen Text und Bild ist. Alles, was Sie scannen, ist also effektiv ein Bild. Dies gilt auch dann, wenn Sie es als PDF speichern möchten, da Sie (noch) keinen Text auswählen können.
Die OCR-Technologie gibt es schon seit einiger Zeit, aber sie ist eine oft untertriebene Funktion, die normalerweise nie übersehen wird. Wenn Sie in den letzten Jahren einen Scanner gekauft haben, haben Sie wahrscheinlich bereits eine ziemlich raffinierte OCR-Software auf der mitgelieferten Disc! Als Mac-Benutzer werden wir manchmal von der Tatsache verwöhnt, dass wir uns kaum um die Installation von Treibern kümmern müssen, sodass Software auf denselben Discs häufig ignoriert wird.
Tipp: Ein PDF ist nur ein Container für Text und Bilder, sodass Belege oder Korrespondenz, die Sie gescannt und als PDF gespeichert haben, noch nicht durchsucht werden können.
1. Prizmo
Prizmo ist eine spezielle OCR-App. Es soll Ihnen nicht dabei helfen, Ihre gescannten Dokumente zuzuschneiden oder zu begradigen. Es dient lediglich dazu, den Text von Scans zu analysieren und in durchsuchbaren Text umzuwandeln. Prizmo beschränkt sich nicht nur auf reine Textdokumente wie Quittungen und Korrespondenz, sondern analysiert sogar alte Zeitungen und Zeitschriften, Buchumschläge und so ziemlich alles, was Prizmo in Form, Größe und Farbe von Text konvertiert.
Prizmo bietet die Möglichkeit, Scans direkt von Image Capture, der in OS X integrierten Kamera- und Scanner-Import-App, zu erfassen, sodass Sie sie in Verbindung mit jedem vorhandenen Scanner verwenden können. Sie können auch vorhandene Dateien importieren, wenn Sie diese bereits gescannt haben.
Schritt 1
Wenn Sie Prizmo starten, werden Sie aufgefordert, entweder ein neues Dokument zu erstellen oder ein vorhandenes zu öffnen. Bevor Sie fortfahren, bezieht sich dies auf ein Prizmo-Dokument und nicht auf das, das Sie analysieren möchten. Es kann etwas verwirrend sein, aber Prizmo kann die von Ihnen durchgeführten Scans speichern, wenn Sie jemals zurückgehen und den Text ändern müssen, z. B. wenn Sie in einem 200-seitigen PDF gescannt haben und festgestellt haben, dass einige Seiten nicht ordnungsgemäß analysiert wurden Die Mitte und ein Teil des Textes fehlten. Wenn Sie Ihre Arbeit in Prizmo speichern, können Sie nach Bedarf Änderungen vornehmen.



Wählen Sie Neues Dokument... und Sie erhalten ein neues Prizmo-Dokument, das Sie verwenden können.



Wir können entweder eine Bilddatei (JPG, PDF, TIFF usw.) ziehen und ablegen, von unserem Scanner importieren oder sogar eine Fotobibliothek durchsuchen.
Schritt 2
Für die Zwecke dieses Tutorials verwende ich ein vorhandenes Dokument, das ich mit meinem Flachbettscanner eingescannt habe. Es wurde direkt als PDF gespeichert und wie Sie sehen, kann ich keinen Text hervorheben.
Wählen Sie Bilddatei öffnen… und wählen Sie ein Bild aus, das verwendet werden soll.
Schritt 3
Sobald Sie das Bild geladen sehen, wird Ihnen ein vertrautes Seitenlayout mit Seiten-Miniaturansichten auf der linken Seite angezeigt.



Wir haben unten einige Anpassungssteuerelemente, mit denen wir die Drehung anpassen, das Bild zuschneiden und vieles mehr können. Prizmo erkennt automatisch die Anforderungen des Dokuments und nimmt die erforderlichen Einstellungen automatisch vor. Wir können sie jedoch jederzeit anpassen, wenn dies erforderlich ist.
Schritt 4
Ich bin mit den Standardeinstellungen zufrieden. Klicken Sie einfach auf Erkennen. Prizmo erkennt automatisch alle Textbereiche und analysiert sie fast sofort.



Genauso wie Sie beim Scannen eines Dokuments einen Bereich zum Scannen zeichnen würden, können Sie dies auch für Textbereiche tun. Prizmo wird dies automatisch versuchen, aber Sie haben wieder die vollständige Kontrolle.
Der analysierte Text wird dann auf der rechten Seite des Dokuments angezeigt. Zu diesem Zeitpunkt wird nichts gespeichert. Wenn die OCR nicht vollständig korrekt war, können Sie Änderungen vornehmen.
Schritt 5
Prizmo war mit meinem Dokument 100% genau, sodass ich keine Änderungen vornehmen muss. Sie können Ihr Dokument in eine Reihe von Cloud-Diensten wie Dropbox und Google Drive exportieren oder an eine neue E-Mail-Nachricht anhängen.



Ich werde mein Dokument auf meinem Desktop speichern, also wähle ich Datei...
Prizmo ist äußerst nützlich für alle, die regelmäßig Dokumente mit einem beliebigen Scannertyp scannen. Mit den erweiterten Steuerelementen, auf die Sie zugreifen können, können Sie die Funktionsweise des OCR-Prozesses optimieren, anstatt sich auf vollautomatische Einstellungen zu verlassen.
Erfahren Sie mehr über Prizmo.
2. ABBYY FineReader Express
ABBYY FineReader Express ist ein weiteres spezielles OCR-Werkzeug, das speziell für diese Aufgabe entwickelt wurde und sehr gut funktioniert. Der OCR-Prozess ist automatisiert, sodass die einzige Benutzerinteraktion darin besteht, ABBYY FineReader Express mitzuteilen, welches Dokument geladen werden soll und wo die OCR-Version gespeichert werden soll.
Anstatt ein neues Dokument zu erstellen oder ein vorhandenes zu öffnen, verfügt ABBYY FineReader Express über ein Schnellaufgabenfenster, das beim Start geöffnet wird. Dies ist eine schnelle Möglichkeit, OCR-Dokumente mit möglichst wenigen Mausklicks zu erstellen.
Sie können gescannte Dokumente in eine Reihe verschiedener Formate konvertieren. Ein Ass im Ärmel ist die Möglichkeit, eine Tabelle zu OCRen und eine vollständig durchsuchbare und bearbeitbare auszugeben, was sie für Geschäftsanwender sehr verlockend macht.
Schritt 1
Da wir bereits eine PDF-Datei haben, müssen wir OCR ausführen, ABBYY FineReader Express starten, In durchsuchbare PDF-Datei konvertieren auswählen und das gewünschte Dokument auswählen.



Schritt 2
Das ist es eigentlich! ABBYY FineReader Express fordert Sie auf, das neue OCR-Dokument an einem Ort Ihrer Wahl zu speichern. Seltsamerweise werden Sie aufgefordert, das Dokument zu speichern, bevor die Vorschau geladen wird. Um festzustellen, ob ABBYY FineReader Express das Dokument ordnungsgemäß OCR-fähig war, müssen Sie das Speichern des Dokuments abbrechen und es stattdessen über das Menü speichern.



Erfahren Sie mehr über ABBYY FineReader Express.
3. Doxie
Wir haben den Doxie-Scanner und die Doxie-Software in unserem vorherigen Handbuch "Mit Doxie papierlos arbeiten" behandelt, aber es lohnt sich, die integrierten OCR-Funktionen noch einmal zu erwähnen.
Doxie enthält eine integrierte OCR in seiner Import-App, sodass alle von Ihnen gescannten Dokumente analysiert werden können. Doxie enthält jedoch nicht viele Steuerelemente und automatisiert den größten Teil des Prozesses.



Schritt 1
Scannen Sie jedes Dokument, das Sie OCR-fähig machen möchten, und starten Sie dann die Doxie-App. Stellen Sie dabei sicher, dass Ihr Doxie-Scanner angeschlossen ist.
Schritt 2
Nachdem Sie Ihr gescanntes Dokument importiert haben, können Sie auswählen, wo und wie Sie es exportieren möchten. In diesem Fall wähle ich PDF mit OCR (Schwarzweiß) aus. Es ist besser, den Dokumenttyp auszuwählen, da dadurch sichergestellt werden kann, dass ein Format verwendet wird, das weniger Speicherplatz beansprucht.



Tipp: Viele Unternehmen senden häufig Korrespondenzbriefe in einer bestimmten Farbe, um das Branding beizubehalten. Ich würde empfehlen, sie nur in Schwarzweiß zu speichern, um die Dateigröße so gering wie möglich zu halten.
Schritt 3
Sobald Sie ausgewählt haben, wo die PDF-Datei gespeichert werden soll, wird das Dokument von Doxie OCR-fähig gemacht und exportiert. Der Text ist vollständig durchsuchbar und ersetzt nicht den Text des Scans. Stattdessen wird eine clevere Funktion von PDFs verwendet, die als Textüberlagerung bezeichnet wird. Ihr Dokument sieht möglicherweise genauso aus wie zuvor, aber das ist gut so. Stattdessen wird der Text transparent über dem Text platziert, sodass er durchsucht und hervorgehoben werden kann.



Obwohl der Doxie-Prozess sehr einfach ist, gibt es nicht so viele Optionen wie bei einer dedizierten OCR-App wie Prizmo. Wenn Sie jedoch bereits Doxie-Benutzer sind oder nur leichte Scans durchführen, sind diese Funktionen für Sie möglicherweise nicht von großem Nutzen.
Doxie-Scanner kosten ab 119 US-Dollar und sind bei Getdoxie.com erhältlich.
4. PDFPen
PDFPen unterscheidet sich ein wenig von Prizmo, da es nicht nur ein OCR-Werkzeug ist. Es ist ein All-in-One-Werkzeug zum Ausfüllen, Bearbeiten und Ändern von PDFs. Eine seiner Funktionen ist, dass es gescannte Dokumente erkennen und in einem Schritt eine OCR durchführen kann.
Schritt 1
Starten Sie PDFPen und Sie werden automatisch aufgefordert, ein zu öffnendes PDF auszuwählen. Wählen Sie ein gescanntes Dokument aus und klicken Sie auf Öffnen.
Schritt 2
Sobald PDFPen das Dokument öffnet und feststellt, dass es gescannt wurde (anstatt heruntergeladen oder computergeneriert), werden Sie gefragt, ob Sie es analysieren und den Text digitalisieren möchten. Sie haben die Möglichkeit, das OCR-Werkzeug nur auf der aktuellen Seite oder im gesamten Dokument auszuführen.



Geben Sie die gewünschte Sprache an und klicken Sie auf die entsprechende Schaltfläche. In diesem Fall habe ich gerade OCR-Dokument ausgewählt.
Schritt 3
Speichern Sie das PDF, sobald es fertig ist. Im Gegensatz zu Doxie oder Prizmo erstellen Sie nicht sofort eine weitere Kopie. PDFPen ändert vorhandene PDF-Dateien, sodass Sie die Änderungen einfach speichern können, um die Unannehmlichkeiten beim Verwalten einer zusätzlichen Datei zu vermeiden.
Erfahren Sie mehr über PDFPen.
5. Evernote
Evernote ist ein äußerst beliebter Dienst zur Synchronisierung von Notizen, der eher als Hybrid zwischen einem Sammelalbum und einem Notizbuch fungiert. Stellen Sie sich einen Aktenschrank voller Informationen vor, der immer verfügbar und immer leicht zu suchen ist.
Wir haben Evernote bereits ausführlich auf Mactuts + behandelt und ich ermutige jeden, der Evernote verwendet (oder daran interessiert ist, es mehr zu verwenden), unseren Artikel "Den Elefanten zähmen: Tolle Tipps und Tricks für Evernote" zu lesen, um mehr darüber zu erfahren.
Eine Funktion von Evernote, die oft übersehen und dem Benutzer nie wirklich gezeigt wird, ist der automatische OCR-Dienst. Ja, jedes Bild, das Sie zu Evernote hinzufügen, wird nach Text durchsucht und Ihrer Notiz hinzugefügt. Es wird serverseitig ausgeführt, sodass das Hinzufügen eines Dokuments zu Evernote nicht sofort konvertiert wird. Aufgrund der Anzahl der Evernote-Benutzer ist dies auch nicht sofort möglich. Um Serverprobleme zu vermeiden, werden alle Dokumente, die OCR erfordern, in die Warteschlange gestellt. Es gibt keine Möglichkeit zu wissen, wann es gescannt wird, aber normalerweise innerhalb von 24 bis 48 Stunden. Wenn Sie ein Premium-Mitglied sind, geht es schneller.
Schritt 1
Um ein Dokument scannen zu lassen, ziehen Sie es einfach und fügen Sie es einer neuen oder vorhandenen Notiz hinzu. Stellen Sie sicher, dass Sie Evernote synchronisieren, sobald Sie es getan haben. Das ist alles dazu.



Schritt 2
Schließlich scannt Evernote das Dokument und führt eine OCR durch. In diesem Fall wird das Dokument aktualisiert und auf Ihrem Gerät wieder mit Evernote synchronisiert. Es dauerte ungefähr zehn Minuten, bis Evernote das von mir hinzugefügte Dokument OCR-fähig war (ich bin ein Evernote Premium-Abonnent, daher variieren die Zeiten).
Die OCR ist normalerweise sehr genau, es gibt jedoch keine Kontrolle darüber, wie die OCR funktioniert. Dies erfolgt automatisch ohne Benutzereingaben oder Einstellungen.
Schritt 3
Sie können dann nach Text suchen und, wie Sie sehen können, den Text bei der Suche hervorheben. Nach Durchsicht der Notiz scheint sie 100% genau gewesen zu sein.



Schritt 4 (Optional)
Wenn Sie eine durchsuchbare PDF-Version außerhalb von Evernote behalten möchten, können Sie mit der rechten Maustaste klicken und Suchbare PDF speichern unter...
Es ist nicht ideal, da Evernote jedes Wort mit einem grünen Kästchen umschließt, sodass das Drucken möglicherweise keine so gute Idee ist, aber es funktioniert.
Obwohl die Funktionen recht einfach sind, wird die Verwendung von Evernote als zentraler Hub für Ihr papierloses Büro immer beliebter. Wenn Sie dasselbe tun möchten, können Sie jeden OCR-Prozess ausschalten und Scans direkt in Evernote ablegen. Die OCR wird für Sie erledigt. Da es sich bei den meisten Artikeln um Belege und Korrespondenz handelt, haben Sie wahrscheinlich fast kein Problem mit dem OCR-Service von Evernote.
Evernote ist kostenlos, mit Premium-Konten für 5 USD pro Monat oder 35 USD pro Jahr.
Einpacken
Es gibt verschiedene Möglichkeiten, diese gescannten Dokumente zu digitalisieren, um sie durchsuchbar zu machen, und die Kosten für die Verwendung eines OCR-Werkzeugs sind drastisch gesunken. Vorbei sind die Zeiten, in denen Sie sich nicht mehr an die App halten, mit der Ihr Scanner geliefert wurde. Jetzt können Sie so ziemlich jede OCR-App verwenden, die Sie möchten.
Wenn Sie nicht nur OCR-Werkzeugs verwenden, sondern auch PDF-Dateien bearbeiten möchten, ist PDFPen die beste Wahl. Für alle, die nur einen Weg zu OCR suchen, würde ich Prizmo empfehlen. Selbst wenn Sie einen Doxie haben, gibt Ihnen Prizmo mehr Kontrolle darüber, wie der OCR-Prozess funktioniert.
Für alle, die gelegentlich etwas OCR machen möchten, ist es die wirtschaftlichste Option, ein kostenloses Evernote-Konto zu erhalten.
Haben Sie versucht, papierlos zu werden? Haben Sie Probleme mit OCR oder ist in Ihrem digitalen Büro alles durchsuchbar? Wir würden uns freuen, von Ihnen zu hören. Besprechen Sie das Theme daher wie immer in den Kommentaren.