Advertisement
  1. Computer Skills
  2. Productivity

5 formas de hacer OCR a documentos en tu Mac

by
Read Time:12 minsLanguages:
This post is part of a series called Going Paperless.
How to OCR Text in PDF and Image Files in Adobe Acrobat
Quick Tip: Share Your Mac's Printer and Scanner

Spanish (Español) translation by Esther (you can also view the original English article)

Si te has animado a intentar pasar a una oficina sin papel, no eres el único. 2013 es el año de la eliminación del papel y eso no solo significa escanear esos viejos recibos y correspondencia, sino también digitalizarlos por completo. En esta guía te mostraremos cinco aplicaciones diferentes que pueden convertir los documentos que has escaneado en documentos con capacidad de búsqueda mediante una tecnología llamada OCR.

Actualización: También puedes escanear fácilmente documentos con tecnología OCR a través de tu iPhone, utilizando la nueva aplicación DocScan en Envato Market.

DocScan app on Envato MarketDocScan app on Envato MarketDocScan app on Envato Market
Aplicación DocScan en Envato Market

Si prefieres utilizar un escáner tradicional para escanear tus documentos, sigue leyendo para saber cómo hacerlo.

¿Qué es el OCR?

OCR significa reconocimiento óptico de caracteres. Siempre que se escanea un documento, el propio escáner no tiene forma de saber cuál es la diferencia entre un texto y una imagen, por lo que todo lo que se escanea es efectivamente una imagen. Esto también se aplica incluso si eliges guardarlo como PDF, ya que no podrás (todavía) seleccionar ningún texto.

La tecnología OCR existe desde hace tiempo, pero es una función que a menudo se subestima y a la que nunca se presta atención. Si has comprado un escáner en los últimos años, lo más probable es que ya tuvieras un software de OCR bastante ingenioso en el disco que incluía. Como usuarios de Mac, a veces nos sentimos mimados por el hecho de que casi nunca tenemos que preocuparnos de instalar los controladores, por lo que a menudo se ignora el software de los mismos discos.

Consejo: Un PDF es sólo un contenedor de texto e imágenes, por lo que los recibos o la correspondencia que hayas escaneado y guardado como PDF aún no se pueden buscar.


1. Prizmo

Prizmo es una aplicación dedicada al OCR. No está diseñada para ayudarte a recortar o enderezar tus documentos escaneados, su único propósito es analizar el texto de cualquier escaneo y convertirlo en texto para búsquedas. No solo se limita a documentos de texto plano como recibos y correspondencia, Prizmo incluso analiza periódicos y revistas antiguas, portadas de libros, prácticamente cualquier cosa con cualquier forma, tamaño y color de texto es algo que Prizmo convertirá.

Prizmo incluye la capacidad de capturar escaneos directamente desde Image Capture, la cámara integrada de OS X y la aplicación de importación de escáneres, por lo que puede utilizarlo junto con cualquier escáner existente. También puede importar archivos existentes si ya los ha escaneado.

Paso 1

Cuando inicies Prizmo, te pedirá que crees un nuevo documento o que abras uno existente. Antes de continuar, esto se refiere a un documento de Prizmo y no al que quiere analizar. Puede ser un poco confuso, pero Prizmo puede guardar los escaneos que has hecho si alguna vez necesitas volver atrás y modificar el texto, por ejemplo, si has escaneado un PDF de 200 páginas y te has dado cuenta de que algunas páginas no estaban bien analizadas en el centro y faltaba algo de texto. Si guardas tu trabajo en Prizmo, podrás volver atrás y hacer los cambios que necesites.

Prizmo is an all-in-one OCR toolPrizmo is an all-in-one OCR toolPrizmo is an all-in-one OCR tool
Prizmo crea sus propios documentos para que puedas consultarlos (y editarlos) más tarde

Selecciona Nuevo Documento... y se te presentará un nuevo documento de Prizmo para empezar a utilizarlo.

Prizmo creates its own documents so that you can refer back to them and edit them laterPrizmo creates its own documents so that you can refer back to them and edit them laterPrizmo creates its own documents so that you can refer back to them and edit them later
Prizmo crea sus propios documentos para que puedas consultarlos (y editarlos) más tarde

Podemos arrastrar y soltar un archivo de imagen (JPG, PDF, TIFF, etc.), importarlo desde nuestro escáner o incluso navegar por una biblioteca de fotos.

Paso 2

Para el propósito de este tutorial, estoy utilizando un documento existente que había escaneado con mi escáner de superficie. Fue guardado directamente como un PDF y, como puedes ver, no puedo resaltar ningún texto.

Selecciona Abrir archivo de imagen... y selecciona una imagen para usar.

Paso 3

Una vez que veas la imagen cargada, te encontrarás con un diseño de página familiar, con miniaturas de páginas en el lado izquierdo.

Prizmo has an appearance very similar to Apples Preview appPrizmo has an appearance very similar to Apples Preview appPrizmo has an appearance very similar to Apples Preview app
Prizmo tiene una apariencia muy similar a la aplicación Preview de Apple

Tenemos algunos controles de ajuste en la parte inferior donde podemos ajustar la rotación, recortar la imagen y más. Prizmo detectará automáticamente los requisitos del documento y realizará los cambios de configuración necesarios de forma automática, pero siempre podemos retocarlos cuando sea necesario.

Paso 4

Estoy contento con la configuración por defecto, así que simplemente haz clic en Reconocer y Prizmo detectará automáticamente cualquier área de texto y la analizará casi al instante.

Prizmo can OCR documents quickly and accuratelyPrizmo can OCR documents quickly and accuratelyPrizmo can OCR documents quickly and accurately
Prizmo puede realizar el reconocimiento óptico de documentos con rapidez y precisión

De la misma manera que dibujas un área para escanear cuando estás escaneando un documento, lo mismo puedes hacer para las áreas de texto. Prizmo lo intentará automáticamente pero, de nuevo, tienes el control total.

El texto analizado aparece entonces en la parte derecha del documento. En esta fase, no se guarda nada. Si el OCR no ha sido del todo preciso, puedes entrar y hacer cualquier cambio.

Paso 5

Prizmo fue 100% preciso con mi documento así que no hay cambios que hacer. Puedes exportar tu documento a varios servicios en la nube como Dropbox y Google Drive, o adjuntarlos a un nuevo mensaje de correo.

Prizmo includes support for a number of cloud servicesPrizmo includes support for a number of cloud servicesPrizmo includes support for a number of cloud services
Prizmo incluye soporte para varios servicios en la nube

Voy a guardar mi documento en el escritorio, así que seleccionaré Archivo...

Prizmo es extremadamente útil para cualquier persona que escanee documentos de forma regular con cualquier tipo de escáner. Los controles avanzados a los que tiene acceso le permiten afinar el funcionamiento del proceso de OCR en lugar de confiar en los ajustes totalmente automáticos.

Aprende más sobre Prizmo.


2. ABBYY FineReader Express

ABBYY FineReader Express es otra herramienta de OCR especializada diseñada específicamente para esta tarea, y lo hace muy bien. El proceso de OCR está automatizado, por lo que la única interacción del usuario consiste en indicar a ABBYY FineReader Express qué documento debe cargar y dónde debe guardarse la versión OCR.

En lugar de crear un nuevo documento o abrir uno existente, ABBYY FineReader Express tiene un panel de Tareas rápidas que se abre al iniciarse. Es una forma rápida de realizar el OCR de documentos con el menor número de clics posible.

Puedes convertir los documentos escaneados a varios formatos diferentes y un as en la manga es la capacidad de hacer un OCR de una hoja de cálculo y generar una hoja totalmente consultable, lo que la hace muy tentadora para los usuarios empresariales.

Paso 1

Como ya tenemos un PDF al que tenemos que aplicar el OCR, inicia ABBYY FineReader Express y selecciona Convertir a PDF con capacidad de búsqueda y elige el documento al que quieres aplicar el OCR.

ABBY FineReader Express includes a Quick Tasks panel to make OCR easyABBY FineReader Express includes a Quick Tasks panel to make OCR easyABBY FineReader Express includes a Quick Tasks panel to make OCR easy
ABBYY FineReader Express incluye un panel de tareas rápidas para facilitar el OCR

Paso 2

Eso es todo. ABBYY FineReader Express te pedirá que guardes el nuevo documento OCR en una ubicación de tu elección. Extrañamente, se te pide que guardes el documento antes de que se cargue la vista previa, por lo que para ver si ABBYY FineReader Express fue capaz de realizar el OCR del documento correctamente, tendrás que cancelar el guardado del documento y luego guardarlo desde el menú.

ABBYY is one of the simplest apps to use when it comes to OCRABBYY is one of the simplest apps to use when it comes to OCRABBYY is one of the simplest apps to use when it comes to OCR
ABBYY es una de las aplicaciones más sencillas de usar cuando se trata de OCR

Aprende más sobre ABBYY FineReader Express.


3. Doxie

Ya hemos hablado del escáner y el software Doxie en nuestra guía anterior "Go Paperless With Doxie", pero merece la pena mencionar de nuevo sus funciones de OCR integradas.

Doxie incluye OCR integrado en su aplicación de importación, por lo que cualquier documento que escanees tendrá la opción de ser analizado. Sin embargo, Doxie no contiene muchos controles y automatiza la mayor parte del proceso.

Doxie has fewer controls than an app such as PrizmoDoxie has fewer controls than an app such as PrizmoDoxie has fewer controls than an app such as Prizmo
Doxie tiene menos controles que una aplicación como Prizmo

Paso 1

Escanea cualquier documento que quieras someter a OCR y luego inicia la aplicación Doxie, asegurándote de que tu escáner Doxie está conectado.

Paso 2

Una vez que hayas importado tu documento escaneado, puedes seleccionar dónde y cómo quieres exportarlo. En este caso, seleccionaré PDF con OCR (blanco y negro). Es mejor seleccionar el tipo de documento ya que puede asegurarse de utilizar un formato que ocupe menos espacio.

Doxie includes the option to export as a PDF or with OCR addedDoxie includes the option to export as a PDF or with OCR addedDoxie includes the option to export as a PDF or with OCR added
Doxie incluye la opción de exportar como PDF o con OCR añadido

Consejo: A menudo, muchas empresas envían cartas de correspondencia en un color determinado para mantener su marca; yo recomendaría guardarlas en blanco y negro para mantener el tamaño del archivo lo más bajo posible.

Paso 3

Una vez que hayas seleccionado dónde guardar el PDF, Doxie hará un OCR del documento y lo exportará. El texto es completamente buscable y no reemplaza el texto del escaneo, sino que utiliza una característica inteligente de los PDFs llamada superposición de texto. Tu documento puede tener el mismo aspecto que antes, pero eso es bueno. En cambio, el texto se coloca de forma transparente sobre el texto, lo que hace que se pueda buscar y resaltar.

Doxie still keeps the appearance of the PDF but overlays text that can be highlightedDoxie still keeps the appearance of the PDF but overlays text that can be highlightedDoxie still keeps the appearance of the PDF but overlays text that can be highlighted
Doxie sigue manteniendo la apariencia del PDF pero superpone el texto que se puede resaltar

Aunque el proceso de Doxie es muy sencillo, no hay tantas opciones como una aplicación de OCR dedicada como Prizmo. Sin embargo, esto significa que si ya eres un usuario de Doxie o solo realizas escaneos ligeros, estas características pueden no ser de mucho beneficio para ti.

Los escáneres Doxie cuestan desde 119 dólares y están disponibles en Getdoxie.com.


4. PDFPen

PDFPen es un poco diferente a Prizmo ya que no es solo una herramienta de OCR. Es una herramienta todo en uno diseñada para rellenar, editar y alterar PDFs. Una de sus características es que puede detectar documentos escaneados y realizar el OCR en un solo paso.

Paso 1

Inicia PDFPen y automáticamente te pedirá que selecciones un PDF para abrirlo. Selecciona un documento escaneado y haz clic en Abrir.

Paso 2

Una vez que PDFPen abre el documento y detecta que ha sido escaneado (en lugar de descargado o generado por ordenador), te preguntará si quieres analizarlo y digitalizar el texto. Tienes la opción de ejecutar la herramienta OCR solo en la página actual o en todo el documento.

PDFPen is another app designed to automate most of the OCR processPDFPen is another app designed to automate most of the OCR processPDFPen is another app designed to automate most of the OCR process
PDFPen es otra aplicación diseñada para automatizar la mayor parte del proceso de OCR

Especifica el idioma requerido y selecciona el botón correspondiente, en este caso solo seleccioné Documento OCR.

Paso 3

Una vez que hayas terminado, guarda el PDF. A diferencia de Doxie o Prizmo, no se crea otra copia inmediatamente. PDFPen modifica los archivos PDF existentes para que puedas simplemente guardar los cambios, eliminando la molestia de gestionar un archivo adicional.

Aprende más sobre PDFPen.


5. Evernote

Evernote es un servicio de sincronización de notas muy popular que actúa como un híbrido entre un álbum de recortes y un cuaderno. Piensa en ello como si tuvieras un archivador lleno de información siempre disponible y fácil de buscar.

Ya hemos cubierto Evernote extensamente aquí en Mactuts+ y animo a cualquiera que use Evernote (o esté interesado en usarlo más) a leer nuestro artículo "Domando al elefante: Impresionantes consejos y trucos de Evernote" para aprender más sobre él.

Una característica de Evernote que a menudo se pasa por alto y nunca se muestra realmente al usuario es su servicio de OCR automático. Sí, cualquier imagen que añadas a Evernote es escaneada en busca de texto y añadida a tu nota. Se realiza del lado del servidor, por lo que añadir un documento a Evernote no se convierte instantáneamente. Debido al número de usuarios de Evernote, tampoco es instantáneo. Para evitar problemas con el servidor, todos los documentos que requieren OCR se ponen en cola. No hay forma de saber cuándo se escaneará, pero suele ser en un plazo de 24 a 48 horas. Si eres miembro premium, es más rápido.

Paso 1

Para tener un documento escaneado, simplemente arrástralo y añádelo a una nota nueva o existente, asegurándote de sincronizar Evernote en cuanto lo hayas hecho. Eso es todo.

Evernote supports attachments for notes and any images will automatically be OCRd by their serversEvernote supports attachments for notes and any images will automatically be OCRd by their serversEvernote supports attachments for notes and any images will automatically be OCRd by their servers
Evernote admite archivos adjuntos para las notas y cualquier imagen será automáticamente reconocida por sus servidores.

Paso 2

Finalmente, Evernote escaneará el documento y realizará un OCR. Una vez que esto ocurra, el documento se actualizará y se sincronizará de vuelta con Evernote en tu dispositivo. Evernote tardó unos diez minutos en hacer el reconocimiento óptico del documento que añadí (soy suscriptor de Evernote Premium, así que los tiempos pueden variar).

El OCR suele ser muy preciso, pero no hay ningún control sobre su funcionamiento. Se realiza de forma automática sin que el usuario introduzca ningún dato o ajuste.

Paso 3

Puedes entonces buscar el texto y, como puedes ver, el texto se resalta mientras buscas. Después de revisar la nota, parece haber sido 100% precisa.

Once the document has been OCRd by Evernotes servers it will be searchable within Evernote and youll have the ability to export the document as a searchable PDF as wellOnce the document has been OCRd by Evernotes servers it will be searchable within Evernote and youll have the ability to export the document as a searchable PDF as wellOnce the document has been OCRd by Evernotes servers it will be searchable within Evernote and youll have the ability to export the document as a searchable PDF as well
Una vez que los servidores de Evernote hayan realizado el reconocimiento óptico del documento, se podrá buscar en Evernote y se podrá exportar el documento como un PDF con capacidad de búsqueda.

Paso 4 (opcional)

Si quieres conservar una versión en PDF con capacidad de búsqueda fuera de Evernote, puedes hacer clic con el botón derecho y seleccionar Guardar PDF con capacidad de búsqueda como...

No es lo ideal, ya que Evernote envuelve cada palabra con un recuadro verde, por lo que imprimirlo puede no ser una buena idea, pero funciona.

Aunque sus funciones son bastante básicas, el uso de Evernote como eje central de tu oficina sin papeles es cada vez más popular, así que si quieres hacer lo mismo, puedes eliminar cualquier proceso de OCR y simplemente colocar los escaneos directamente en Evernote. Se encargará del OCR por ti y como la mayoría de los elementos van a ser recibos y correspondencia, entonces es probable que no tengas casi ningún problema con el servicio de OCR de Evernote.

Evernote es gratuito, con cuentas premium a 5 dólares al mes o 35 dólares al año.


Conclusión

Hay varias formas de digitalizar los documentos escaneados para que se puedan buscar en el texto, y el coste de utilizar una herramienta de OCR se ha reducido drásticamente. Atrás quedaron los días en los que estabas atado a la aplicación que traía tu escáner, ahora eres libre de usar prácticamente cualquier aplicación de OCR que desees.

Si vas a utilizar no solo herramientas de OCR, sino que quieres una forma de manipular los PDF, entonces PDFPen es la mejor opción. Para cualquier persona que quiera una forma de OCR entonces yo recomendaría Prizmo. Incluso si tienes un Doxie, Prizmo te da más control sobre cómo funciona el proceso de OCR.

Para cualquiera que quiera hacer OCR muy ocasionalmente, la opción más económica es obtener una cuenta gratuita de Evernote.

¿Has intentado prescindir del papel? ¿Te preocupas por el OCR o todo se puede buscar en tu oficina digital? Nos encantaría saber tu opinión, así que, como siempre, discute el tema en los comentarios.

Advertisement
Advertisement
Looking for something to help kick start your next project?
Envato Market has a range of items for sale to help get you started.