Unlimited WordPress themes, graphics, videos & courses! Unlimited asset downloads! From $16.50/m
Advertisement
  1. Computer Skills
  2. Productivity

5 Cara untuk Membuat Dokumen OCR di Mac

by
Read Time:12 minsLanguages:
This post is part of a series called Going Paperless.
How to OCR Text in PDF and Image Files in Adobe Acrobat
Quick Tip: Share Your Mac's Printer and Scanner

Indonesian (Bahasa Indonesia) translation by Haikal Kamil (you can also view the original English article)

Jika selama ini Anda telah didorong untuk mencoba dan berpindah ke arah kantor tanpa kertas maka Anda tidak sendirian! 2013 adalah tahun tanpa kertas dan itu tidak hanya berarti men-scanning semua receipt dan surat-menyurat lama, ini juga berarti sepenuhnya men-digitalisasi mereka juga. Dalam panduan ini, kami akan menunjukkan kepada Anda lima aplikasi berbeda yang dapat mengonversi dokumen yang telah Anda scan ke dalam yang sepenuhnya dapat dicari (searchable) menggunakan teknologi yang disebut OCR.

Update: Anda juga dapat dengan mudah men-scan dokumen dengan teknologi OCR melalui iPhone Anda, dengan menggunakan aplikasi baru DocScan di Envato Market.

DocScan app on Envato MarketDocScan app on Envato MarketDocScan app on Envato Market
DocScan app di Envato Market

Jika Anda lebih suka menggunakan scanner tradisional untuk scaning dokumen Anda, baca terus untuk mengetahui detail lengkap tentang cara melakukannya.

Apa Itu OCR?

OCR adalah singkatan dari Optical Character Recognition. Setiap kali Anda men-scan dokumen, scanner tersebut itu sendiri tidak memiliki cara untuk mengetahui apa perbedaan antara teks dan gambar, jadi semua yang Anda scan secara efektif adalah gambar. Ini juga berlaku meskipun Anda memilih untuk menyimpannya sebagai PDF karena Anda tidak akan dapat (belum) memilih teks apa pun.

Teknologi OCR telah ada cukup lama tetapi ini adalah fitur yang sering dielu-elukan yang biasanya tidak pernah dilihat. Jika Anda telah membeli scanner dalam beberapa tahun terakhir maka kemungkinan Anda sudah memiliki perangkat lunak OCR yang cukup bagus pada disk yang disertakan! Sebagai pengguna Mac, kita terkadang dimanjakan oleh fakta bahwa kita hampir tidak perlu khawatir menginstal driver sehingga perangkat lunak pada disk yang sama sering diabaikan.

Tips: PDF hanyalah sebuah wadah untuk teks dan gambar sehingga setiap receipt atau suarat-menyurat yang telah Anda scan dan simpan sebagai PDF belum dapat ditelusuri (belum searchable).


1. Prizmo

Prizmo adalah aplikasi OCR khusus. Prizmo tidak dirancang untuk membantu Anda meng-crop atau membetulkan dokumen yang di-scan, satu-satunya tujuan adalah menganalisis teks apa pun yang di-scane dan mengubahnya menjadi teks yang dapat ditelusuri (searchable). Ini tidak hanya terbatas pada dokumen teks biasa seperti receipt dan surat-menyurat, Prizmo bahkan akan menganalisis surat kabar dan majalah lama, sampul buku, banyak hal dengan beragam bentuk, ukuran dan warna teks apa pun yang akan dikonversi oleh Prizmo.

Prizmo menyertakan kemampuan untuk meng-capture scan langsung dari Image Capture, karena terintegrasi dengan kamera built-in OSX dan aplikasi import scanner, sehingga Anda dapat menggunakannya bersama dengan scanner yang ada. Anda juga dapat mengimpor file yang sudah ada jika Anda sudah men-scan-nya.

Langkah 1

Ketika Anda menjalankan Prizmo, Anda akan diminta untuk membuat new document atau membuka dokumen yang sudah ada. Sebelum melanjutkan, ini mengacu pada dokumen Prizmo dan bukan dokumen yang ingin Anda analisis. Hal ini bisa sedikit membingungkan, tetapi Prizmo dapat menyimpan hasil scan yang Anda lakukan jika Anda perlu kembali dan mengubah teksnya, misalnya jika Anda telah memindai dalam 200 halaman PDF dan melihat beberapa halaman tidak dianalisis dengan benar di tengah dan beberapa teks hilang. Menyimpan pekerjaan Anda di Prizmo berarti Anda dapat kembali dan membuat perubahan apa pun sesuai kebutuhan.

Prizmo is an all-in-one OCR toolPrizmo is an all-in-one OCR toolPrizmo is an all-in-one OCR tool

Prizmo membuat dokumennya sendiri sehingga Anda dapat merujuk kembali kepada mereka (dan mengeditnya) nanti

Pilih New Document… dan Anda akan disajikan dengan dokumen Prizmo baru untuk mulai digunakan.

Prizmo creates its own documents so that you can refer back to them and edit them laterPrizmo creates its own documents so that you can refer back to them and edit them laterPrizmo creates its own documents so that you can refer back to them and edit them later

Prizmo membuat dokumennya sendiri sehingga Anda dapat merujuk kembali kepada mereka (dan mengeditnya) nanti

Kita dapat drag and drop file gambar (JPG, PDF, TIFF, dll), meng-import dari scanner kita atau bahkan menelusuri library foto.

Langkah 2

Untuk keperluan tutorial ini, saya menggunakan dokumen yang sudah ada yang telah saya scan menggunakan scanner flatbed saya. Disimpan secara langsung sebagai PDF dan seperti yang Anda lihat, saya tidak dapat meng-highlight teks apa pun.

Pilih Open Image File… dan pilih gambar untuk digunakan.

Langkah 3

Setelah Anda melihat gambar dimuat, Anda akan disajikan dengan layout laman yang familiar, lengkap dengan thumbnail halaman di sisi kiri.

Prizmo has an appearance very similar to Apples Preview appPrizmo has an appearance very similar to Apples Preview appPrizmo has an appearance very similar to Apples Preview app

Prizmo memiliki tampilan yang sangat mirip dengan Preview app milik Apple

Kita memiliki beberapa kontrol adjustment di bagian bawah tempat kita dapat menyesuaikan rotasi, crop gambar, dan banyak lagi. Prizmo akan secara otomatis mendeteksi requirement dokumen dan membuat setting yang diperlukan berubah secara otomatis, tetapi kita selalu dapat menyesuaikannya kapan pun diperlukan.

Langkah 4

Saya senang dengan pengaturan default-nya, jadi cukup klik Recognize dan Prizmo akan secara otomatis mendeteksi area teks apa pun dan menganalisisnya hampir seketika.

Prizmo can OCR documents quickly and accuratelyPrizmo can OCR documents quickly and accuratelyPrizmo can OCR documents quickly and accurately

Prizmo dapat membuat dokumen OCR dengan cepat dan akurat

Dengan cara yang sama ketika Anda menggambar area untuk men-scan ketika Anda men-scane dokumen, hal yang sama dapat dilakukan untuk area teks. Prizmo akan melakukan ini secara otomatis, tetapi sekali lagi, Anda memiliki kendali penuh.

Teks yang dianalisis kemudian ditampilkan di sisi kanan dokumen. Pada tahap ini, tidak ada yang disimpan. Jika OCR tidak sepenuhnya akurat, Anda dapat masuk kembali dan membuat perubahan apa pun.

Langkah 5

Prizmo 100% akurat dengan dokumen saya sehingga tidak ada perubahan yang perlu saya lakukan. Anda dapat meng-export dokumen Anda ke sejumlah layanan cloud seperti Dropbox dan Google Drive, atau melampirkannya ke pesan email baru.

Prizmo includes support for a number of cloud servicesPrizmo includes support for a number of cloud servicesPrizmo includes support for a number of cloud services

Prizmo mencakup dukungan untuk sejumlah layanan cloud

Saya akan menyimpan dokumen saya ke desktop saya, jadi saya akan pilih File…

Prizmo sangat berguna bagi siapa saja yang secara reguler melakukan scanning dengan semua jenis scanner. Kontrol advanced-nya Anda miliki akses berarti Anda dapat menyesuaikan cara kerja proses OCR tersebut ketimbang mengandalkan setting yang sepenuhnya otomatis.

Pelajari lebih lanjut tentang Prizmo.


2. ABBYY FineReader Express

ABBYY FineReader Express adalah tool OCR khusus yang dirancang khusus untuk tugas ini, dan ABBYY melakukannya dengan sangat baik. Proses OCR diotomatisasi sehingga satu-satunya interaksi pengguna memberitahu ABBYY FineReader Express yang memuat dokumen dan ke mana versi OCR akan disimpan.

Daripada membuat dokumen baru atau membuka yang sudah ada, ABBYY FineReader Express memiliki Quick Tasks panel yang terbuka saat dijalankan. Ini adalah cara cepat untuk dokumen OCR dengan beberapa klik mouse yang sesedikit mungkin.

Anda dapat meng-convert dokumen yang telah di-scand ke sejumlah format yang berbeda dan kartu asnya adalah kemampuan untuk OCR spreadsheet dan menghasilkan yang sepenuhnya dapat ditelusuri (searchable) - dan dapat diedit (editable)- membuatnya sangat menarik bagi pengguna bisnis.

Langkah 1

Karena kita sudah memiliki PDF yang kita butuhkan untuk OCR, jalankan ABBYY FineReader Express dan pilih Convert to Searchable PDF dan pilih dokumen yang Anda inginkan jadi OCR.

ABBY FineReader Express includes a Quick Tasks panel to make OCR easyABBY FineReader Express includes a Quick Tasks panel to make OCR easyABBY FineReader Express includes a Quick Tasks panel to make OCR easy

ABBYY FineReader Express yang include Quick Tasks panel membuat OCR manjadi mudah

Langkah 2

Inilah yang sebenarnya! ABBYY FineReader Express akan meminta Anda untuk menyimpan dokumen OCR yang baru ke lokasi pilihan Anda. Anehnya, Anda diminta untuk menyimpan dokumen sebelum preview dimuat sehingga untuk melihat apakah ABBYY FineReader Express dapat membuat veri OCR dokumen tresebut dengan benar, Anda harus cancel menyimpan dokumen tersebut dan kemudian menyimpannya dari menu.

ABBYY is one of the simplest apps to use when it comes to OCRABBYY is one of the simplest apps to use when it comes to OCRABBYY is one of the simplest apps to use when it comes to OCR

ABBYY adalah salah satu aplikasi paling sederhana untuk digunakan ketika membutuhkan OCR

Pelajari lebih lanjut tentang ABBYY FineReader Express.


3. Doxie

Kami telah mengulas scanner dan software Doxie di panduan sebelumnya, “Go Paperless With Doxie”, tetapi perlu disebutkan lagi fitur OCR bawaannya.

Doxie menyertakan OCR built-in dalam aplikasi impornya sehingga setiap dokumen yang Anda scan akan memiliki opsi untuk dianalisis. Namun, Doxie tidak memberi banyak kontrol dan mengotomatiskan sebagian besar prosesnya.

Doxie has fewer controls than an app such as PrizmoDoxie has fewer controls than an app such as PrizmoDoxie has fewer controls than an app such as Prizmo

Doxie memiliki kontrol lebih sedikit daripada aplikasi seperti Prizmo

Langkah 1

Scan dokumen apa pun yang Anda inginkan untuk dijadikan OCR dan kemudian jalankan aplikasi Doxie, pastikan Doxie scanner Anda terhubung.

Langkah 2

Setelah mengimpor dokumen yang telah Anda scan, Anda dapat memilih di mana dan bagaimana Anda ingin mengekspornya. Dalam hal ini, saya akan memilih PDF with OCR (Black and White). Lebih baik memilih jenis dokumen ini karena dapat dipastikan menggunakan format yang memakan lebih sedikit space.

Doxie includes the option to export as a PDF or with OCR addedDoxie includes the option to export as a PDF or with OCR addedDoxie includes the option to export as a PDF or with OCR added

Doxie include opsi untuk mengekspor sebagai PDF atau dengan OCR yang ditambahkan

Tips: Anda sering menemukan bahwa banyak perusahaan mengirim surat korespondensi yang memiliki warna tertentu agar tetap dengan pencitraan merek mereka - saya sarankan Anda hanya menyimpannya sebagai hitam dan putih untuk menjaga ukuran file serendah mungkin.

Langkah 3

Setelah Anda memilih tempat untuk menyimpan PDF, Doxie akan meng-OCR dokumen dan mengekspornya. Teks benar-benar dapat ditelusuri (searchable) dan tidak menggantikan teks scan-nya, melainkan menggunakan fitur pintar PDF yang disebut text overlay. Dokumen Anda mungkin terlihat sama seperti sebelumnya, tetapi itu hal yang baik. Sebaliknya, teks diletakkan secara transparan di atas teksnya, membuatnya dapat ditelusuri dan dapat di-highligh (highlightable).

Doxie still keeps the appearance of the PDF but overlays text that can be highlightedDoxie still keeps the appearance of the PDF but overlays text that can be highlightedDoxie still keeps the appearance of the PDF but overlays text that can be highlighted

Doxie masih menyimpan tampilan PDF tetapi melapisi teks yang dapat di-highligh

Meskipun proses Doxie sangat mudah, tidak ada banyak opsi seperti aplikasi OCR khusus seperti Prizmo. Namun hal itu berarti jika Anda sudah menjadi pengguna Doxie atau hanya melakukan scanning kecil, fitur tersebut mungkin tidak banyak bermanfaat bagi Anda.

Doxie scanner mulai dari $119 dan tersedia dari Getdoxie.com.


4. PDFPen

PDFPen sedikit berbeda dari Prizmo karena bukan hanya tool untuk OCR. PDFPen adalah tool all-in-one yang dirancang untuk mengisi, mengedit, dan mengubah PDF. Salah satu fiturnya adalah dapat mendeteksi dokumen yang di-scan dan melakukan OCR dalam satu langkah.

Langkah 1

Jalankan PDFPen dan secara otomatis akan meminta Anda memilih PDF untuk dibuka. Pilih dokumen yang telah di-scan dan klik Open.

Langkah 2

Setelah PDFPen membuka dokumen tersebut dan mendeteksi dokumen itu telah di-scan (bukan diunduh atau di-generate oleh komputer), ia akan menanyakan apakah Anda ingin menganalisisnya dan mendigitalkan teks tersebut. Anda memiliki opsi untuk hanya menjalankan tool OCR pada current page atau keseluruhan dokumen.

PDFPen is another app designed to automate most of the OCR processPDFPen is another app designed to automate most of the OCR processPDFPen is another app designed to automate most of the OCR process

PDFPen adalah aplikasi lain yang dirancang untuk mengotomatiskan sebagian besar proses OCR

Tentukan bahasa yang diperlukan dan pilih tombol yang relevan - dalam hal ini saya hanya memilih OCR Document.

Langkah 3

Setelah selesai, simpan PDFnya. Tidak seperti Doxie atau Prizmo, Anda tidak membuat salinan lain dengan segera. PDFPen memodifikasi file PDF yang ada sehingga Anda cukup menyimpan perubahan, menghilangkan ketidaknyamanan mengelola file tambahan.

Pelajari lebih lanjut tentang PDFPen.


5. Evernote

Evernote adalah layanan catatan-sinkronisasi (note-syncin) yang sangat populer yang bertindak lebih dari hybrid antara scrapbook dan notebook. Anggap saja sebagai lemari arsip penuh dengan informasi yang selalu tersedia dan selalu mudah dicari.

Kami telah membahas Evernote secara ekstensif sebelum di sini di Mactuts+ dan saya mengajak siapa saja yang menggunakan Evernote (atau tertarik untuk menggunakannya lebih banyak) untuk membaca artikel kami "Taming the Elephant: Awesome Evernote Tips and Tricks" untuk mempelajari lebih lanjut tentang Evernote.

Salah satu fitur Evernote yang sering diabaikan dan tidak pernah benar-benar ditampilkan kepada pengguna adalah layanan OCR otomatis mereka. Yap, gambar apa pun yang Anda tambahkan ke Evernote dipindai untuk teks dan ditambahkan ke note Anda. Ini dilakukan di sisi server sehingga menambahkan dokumen ke Evernote tidak langsung dikonversi. Karena jumlah pengguna Evernote, dan hal tersebut juga tidak instan. Untuk mencegah masalah server, semua dokumen yang membutuhkan OCR diantrekan. Tidak ada cara untuk mengetahui kapan akan di-scan tetapi biasanya dalam 24-48 jam. Jika Anda anggota premium, itu bisa lebih cepat.

Langkah 1

Agar dokumen dapat di-scan, cukup drag dan tambahkan ke catatan baru atau yang sudah ada, pastikan untuk menyinkronkan Evernote segera setelah Anda melakukannya. Hanya itu saja.

Evernote supports attachments for notes and any images will automatically be OCRd by their serversEvernote supports attachments for notes and any images will automatically be OCRd by their serversEvernote supports attachments for notes and any images will automatically be OCRd by their servers

Evernote mendukung attachment untuk catatan dan gambar apa pun secara otomatis akan menjadi OCR oleh server mereka

Langkah 2

Akhirnya, Evernote akan men-scan dokumen dan melakukan OCR. Setelah itu terjadi, dokumen tersebut kemudian akan diperbarui dan disinkronkan kembali ke Evernote di perangkat Anda. Butuh waktu sekitar sepuluh menit untuk Evernote ke OCR dokumen yang saya tambahkan (saya adalah subscriber Evernote Premium sehingga waktu akan bervariasi).

OCR biasanya sangat akurat tetapi tidak ada kontrol atas cara kerja OCR. Ini dilakukan secara otomatis tanpa input atau setting pengguna.

Langkah 3

Anda kemudian dapat mencari teks dan, seperti yang Anda lihat, highlight teks saat Anda mencari. Setelah melihat melalui catatan, tampaknya sudah 100% akurat.

Once the document has been OCRd by Evernotes servers it will be searchable within Evernote and youll have the ability to export the document as a searchable PDF as wellOnce the document has been OCRd by Evernotes servers it will be searchable within Evernote and youll have the ability to export the document as a searchable PDF as wellOnce the document has been OCRd by Evernotes servers it will be searchable within Evernote and youll have the ability to export the document as a searchable PDF as well

Setelah dokumen tersebut di-OCR oleh server Evernote, dokumen itu akan dapat ditelusuri (searchable) dalam Evernote dan Anda akan memiliki kemampuan untuk mengekspor dokumen tersebut sebagai PDF yang dapat ditelusuri juga

Langkah 4 (Opsional)

Jika Anda ingin menyimpan versi PDF yang searchable di luar Evernote, Anda dapat mengeklik kanan dan memilih Save Searchable PDF As…

Ini tidak ideal karena Evernote membungkus setiap kata dengan kotak hijau sehingga mencetaknya mungkin bukan ide yang bagus, tetapi ini berfungsi.

Meskipun fitur-fiturnya cukup mendasar, menggunakan Evernote sebagai central hub untuk kantor tanpa kertas Anda bahkan menjadi lebih populer sehingga jika Anda ingin melakukan hal yang sama maka Anda dapat memotong proses OCR dan hanya drop scan langsung ke Evernote. Ini akan mengurus proses OCR untuk Anda dan karena sebagian besar item akan menjadi tanda terima dan korespondensi, maka Anda mungkin hampir tidak memiliki masalah dengan layanan OCR Evernote.

Evernote gratis, dengan akun premium $5 per bulan atau $35 per tahun.


Penutup

Ada sejumlah cara untuk Anda dapat mendigitalkan dokumen yang dipindai tersebut untuk menjadikannya dapat ditelusuri oleh teks dan biaya penggunaan tool OCR telah turun secara dramatis. Lewatlah sudah hari-hari di mana Anda terjebak dengan aplikasi apa pun yang dimiliki scanner Anda, kini Anda bebas menggunakan hampir semua aplikasi OCR yang Anda inginkan.

Jika Anda akan mendapati diri Anda menggunakan tidak hanya satu tool untuk OCR tetapi ingin juga memanipulasi PDF, maka PDFPen adalah pilihan terbaik. Bagi siapa saja yang hanya menginginkan cara untuk OCR, saya akan merekomendasikan Prizmo. Bahkan jika Anda memiliki Doxie, Prizmo memberi Anda lebih banyak kendali atas bagaimana proses OCR bekerja.

Bagi siapa saja yang menginginkan sesuatu OCR sesekali, mendapatkan akun Evernote gratis adalah pilihan yang paling ekonomis.

Apakah Anda mencoba untuk pergi tanpa kertas? Apakah Anda peduli dengan OCR atau apakah semuanya searchable di kantor digital Anda? Kami ingin sekali mendengar pendapat Anda, seperti biasa, diskusikan topik lebih lanjut di komentar.

Advertisement
Advertisement
Looking for something to help kick start your next project?
Envato Market has a range of items for sale to help get you started.