Pengertian OCR

OCR (Optical Character Recognition) adalah aplikasi yang berfungsi untuk men scan gambar pada image dan dijadikan text, dan aplikasi ini juga bisa menjadi support /aplikasi tambahan untuk scanner. Dengan adanya OCR, Image yang bertulisan tangan, tulisan mesin ketik atau computer text, dapat dimanipulasi. Text yang discan dengan OCR dapat dicari kata per kata atau per kalimat. Dan setiap text dapat dimanipulasi, diganti, atau diberikan barcode. 

Contoh pengunaan :
Riwayat kerja Pegawai Negeri. Setiap Pegawai Negeri mempunya arsip sendiri 2x, dokument kenaikan pangkat, dokument kenaikan gaji, dokument pindah alamat kerja dan lain sebagainya. Dengan mengunakan scanner dan OCR semua ini dapat disimpan dengan mudah dikomputer, lalu atasan dapat dengan mudah melihat arsip pegawainya hanya dengan mencari dokument tersebut melalui nama depan atau belakang. 

Pengertian OMR
                                              
Optical Mark Reader (OMR) adalah perangkat “membaca” tanda pensil bulatan yang discan dalam bentuk kompatibel NCS bentuk seperti survey atau jawaban test. Bisa juga dijelaskan dalam bentuk pilihan ganda computer. Dalam dokumen ini The Optical Mark Reader akan disebut sebagai pemindai atau OMR. Bentuk tes computer yang dirancang untuk OMR NCS dikenal sebagai bentuk scan yang kompatibel. Tes dan survey selesai pada bentuk ini dibaca oleh pemindai, diperiksa dan hasilnya disimpan ke sebuah file. Data ini dapat di konversi menjadi ouput file dari beberapa format yang berbeda, tergantung pada jenis output yang anda inginkan.

OMR biasanya digunakan untuk survey dan ujian (test). Berbeda dengan OCR tingkat kebenaran OMR mencapai 100%. 

Beberapa perangkat OMR mengunakan bentuk-bentuk yang dicetak ke “transoptic” kertas dan mengukur jumlah cahaya yang melewati kertas, dengan demikian suatu tanda di kedua sisi kertas akan mengurangi jumlah  sinar yang melewati  kertas. Berbeda dengan perangkat OMR khusus, perangkat lunak Desktop OMR memperbolehkan user untuk membuat bentuk-bentuk mereka sendiri dalam pengolahan kata dan mencetaknya pada printer laser. OMR lunak yang kemudian bekerja dengan common pemindai gambar desktop dengan document feeder untuk  memperoses formulir yang diisi sekali. 

  • Fungsi aplikasi OCR:

Fungsi aplikasi OCR berfungsi untuk merubah data yang telah selasai discan oleh scanner yang akan menjadi file berupa image dan image tersebut akan diconvert atau dijadikan file berupa taxt

Optical Mark Recognition (juga disebut Optical Mark Membaca dan OMR) adalah proses-manusia ditandai menangkap data dari bentuk-bentuk dokumen seperti tes ujian nasional dengan mneggunakkan pensil 2b

Beginilah Cara Kerja Optical Character Recognition

Posted on January 22, 2004 by Willy Saefurrahman

Saat bekerja, software pengenal teks berpikir hampir sama banyaknya dengan manusia—bahkan ia melakukan diskusi sendiri: Dalam kasus yang sulit para “pakar” di dalam program mendiskusikan hasil penelitian mereka. Peserta rapat terpintar berfungsi sebagai moderator: Fuzzy Logic.

Program pengenal teks memang tidak secepat manusia dengan kecerdasan rata-rata dalam hal membaca. Namun, ia bertambah pintar dan sangat bermanfaat. Sebagai contoh, misalkan konsep yang masih harus Anda proses datang melalui faksimil, sementara contoh tabel yang penting berupa hasil fotokopi, bukan berbentuk file.
Seorang kolega di dekat Anda bercanda: “Kalau hitam di atas putih bawa pulang saja dan salin di rumah.”

Menyalin teks dan menyusun tabel baru? Sangat tidak praktis. Seperti berusaha memasukkan sinar matahari ke dalam rumah tak berjendela; padahal dokumen tersebut sudah hampir rampung. Anda meletakkan halaman-halaman kertas tersebut pada scanner untuk menampilkan teksnya pada monitor. Dengan membuat salinan 1:1 dari scanner, aplikasi word processor maupun spreadsheet tidak dapat langsung bekerja. Untuk itu Anda harus menjalankan sebuah program pengenal teks, yang menerjemahkan kembali tanda-tanda hitam pada monitor menjadi huruf-huruf.

Pengenal teks modern menggunakan jasa berbagai “pakar” teknik software, yang bekerja bersama-sama atau satu setelah yang lain. Sebagian prosedur berasal dari masa-masa awal program OCR ditemukan, hanya saja selalu dilengkapi dengan metoda terbaru.

Tingkat pertama: Perbandingan sederhana

Kini terdapat lima pakar teknik penting dalam pengenalan teks. Prosedur pemeriksaan tertua dan termudah adalah pengenalan pola. Analisa ciri dan pemeriksaan sintaksis menyusul pada tingkat kedua dan ketiga. Fuzzy-Logic–aplikasi dengan aturan yang luwes–membuat keputusan dalam kasus yang sulit.

Satu pakar lainnya memungkinkan pengguna melatih program. Prosedur dasar untuk mengenali teks tercetak (OCR: Optical Character Recognition = pengenalan karakter secara optik) telah ada sejak lebih dari seperempat abad yang lalu.

Awalnya berbasis hardware, digunakan untuk membandingkan sebuah huruf dengan font referensinya. Pertengahan tahun 60-an mulai digunakan standar OCR-A dan OCR-B. Hingga kini tipe huruf tersebut masih digunakan dalam kode baris pada bank-check, yang disimpan sebagai pola pixel pada perangkat pembacanya. Bila huruf sesuai dengan referensi, huruf tersebut mendapatkan nilai ASCII: Huruf berhasil dikenali. Sayangnya, ini berlaku jika setiap A, B, atau C identik dengan A, B, atau referensinya.

Di samping pengenalan karakter sederhana, perangkat yang lebih canggih dapat mengenali huruf dari mesin ketik yang umum dipakai. Prosesnya juga melalui perbandingan karakter dengan pola pixel, yang disebut “matrix matching“. Penyimpangan yang lebih besar mulai 1975 pengenalan pola dilengkapi dengan metoda analisa ciri (feature recognition).

Analisa detil tipografi setiap huruf tidak memerlukan pembandingan dengan referensi. Ia mencari bentuk lengkung tertentu, besar sudut, bentuk membulat, serta proporsi antara garis horizontal dan vertikal, juga besarnya celah.

Karena ciri khas huruf yang matematik-geometrik ini kurang lebih sama dalam semua font—kecuali karakter Arab, Cina, atau Rusia—metoda ini tidak terbatas pada font tertentu. Karena itu ia juga disebut Omni-Font (omni = semua).

Perangkat baca pertama yang memakai metoda ini diperkenalkan tahun 1975 dengan nama sesuai penciptanya Raymond Kurzweil, yaitu Kurzweil Reading Machine (KRM). Klien pribadi pertamanya adalah Stevie Wonder, pelantun lagu I Just Called To Say I Love You. Dengan KRM ia menerjemahkan teks ke dalam huruf Braille.

Bersama Xerox, pada awal tahun 80-an Kurzweil mengembangkan sebuah program OCR yang mampu sekaligus melakukan metoda pembandingan pola dan analisa ciri. Kemampuan pengenalannya dapat dilatih, karena software ini memiliki kecerdasan buatan: Huruf yang salah dikenali dan dapat dikoreksi oleh pengguna serta secara otomatis dimasukkan ke dalam kamus software. Info baru tersebut akan dimanfaatkan dalam pengenalan berikutnya. Untuk mengenali tulisan tangan yang sangat individual pada setiap orang, program ini harus mempelajarinya lebih dulu. Di sini ia harus terus berlatih.

Kini kedua metoda di atas mendapat dukungan dari pakar linguistik pada tingkat ketiga: Analisa sintaksis, juga disebut analisa bahasa. Ia menentukan apakah rangkaian huruf tertentu cocok dengan bahasa yang digunakan. Misalnya dalam bahasa Inggris tidak ada rangkaian kata yang dimulai dengan nng (kecuali singkatan) atau huruf konsonan berganda lainnya. Analisa sintaksis kebanyakan program OCR hanya memeriksa 3 karakter dalam sebuah kata yang tak dikenali dengan jelas oleh pakar lainnya.

Pakar pada tingkat lebih tinggi bekerja seperti jaringan syaraf

Meskipun memiliki kemampuan belajar dan prosedur Omni-Font, program OCR tidak mampu mengatasi semua penyimpangan tipografi. Sejak pertengahan tahun 80-an pengembang OCR bereksperimen dengan prosedur pengenalan yang antara lain meniru otak manusia. Dalam jaringan syaraf (neuron) alami atau buatan, pemrosesan informasi mengikuti aturan-aturan fuzzy logic yang tidak kaku (fuzzy = tidak tentu, kabur, atau mengambang).

Prosedur solusi masalah yang algoritmik seperti pengenalan pola sebaliknya menggu-nakan aturan-aturan yang pasti; dalam sistem yang dapat belajar selalu ditambahkan aturan-aturan baru yang juga dirumuskan dengan jelas. Fuzzy Logic dibuat berdasarkan kenyataan bahwa tanpa parameter yang jelas pun otak manusia dapat mencari solusi yang berguna: Ia memasukkan nilai pendekatan seperti cukup, hampir, atau sangat ke dalam pemikirannya.

Serupa manusia, pakar Fuzzy Logic dalam program OCR juga berpikir: Mereka bekerja secara analog, bukan digital. Ia tidak hanya mengenal istilah Ya dan Tidak, tetapi juga banyak dan sedikit. Namun demikian, pengertian sedikit, lebih banyak, dan banyak setidaknya harus memiliki batasan yang jelas agar dapat diproses. Untuk itu hasil pemeriksaan pakar pada tingkat di bawahnya seperti analisa ciri, diterjemahkan ke nilai fuzzy (fuzzification), yang tidak kaku dan bergradasi–disebut variabel linguistik. Dalam sistem fuzzy, variabel ini mencakup beberapa nilai analisa yang pasti, disebut “himpunan fuzzy“.

Setiap himpunan mendapat nama variabel tertentu. Biasanya digunakan singkatan dari bahasa Inggris sebagai berikut:

  • NB (negative big): Penyimpangan besar
  • NM (negative medium): Penyimpangan sedang
  • NS (negative small): Penyimpangan kecil
  • ZE (zero): Tidak ada penyimpangan

Dalam sistem fuzzy lainnya ada variabel seperti PS, PM, dan PB (positive small, positive medium, dan positive big) untuk penyimpangan dari nilai ideal.

Seberapa banyak nilai matematik-geometrik sebuah karakter, yang didapat melalui analisa ciri mengarah ke huruf A, misalnya, juga dapat ditampilkan dengan fungsi “Belong to“: Tingkat Belong to pada himpunan segala jenis A dinyatakan dengan nilai antara 0 dan 1.

Fuzzy Logic, perantara para pakar

Bila beberapa nilai fuzzy dari berbagai analisa pakar dihubungkan satu sama lain
melalui operator Boolean AND (dan), OR (atau), IF-THEN (jika-maka), kemungkinan membuat kesimpulan yang benar semakin tinggi. Artinya, pada program OCR: JIKA dua ciri huruf A kurang jelas tetapi tiga ciri lainnya jelas, DAN hasil analisa sintaksis mengatakan hal yang sama, MAKA pakar memutuskan itu huruf A.

Pakar Fuzzy Logic dalam program OCR juga dapat mengatasi hasil analisa yang bertentangan dengan sebagian aturan yang digunakan. Sebaliknya, sistem dengan aturan yang pasti akan tersandung pada ketidaksesuaian dengan aturan dan melimpahkan pengambilan keputusan kepada pengguna. Sistem fuzzy menghindari hal semacam itu, sehingga mempercepat dan meningkatkan ketepatan pengenalan teks. Tetapi ini juga menuntut kemampuan komputasi pada PC, setidaknya 32 MB RAM dan sebuah scanner yang bagus dengan resolusi minimal 300 dpi untuk mempermudah pengenalan teks.

Temukan bagaimana aplikasi OCR (Optical Character Recognition) dapat mengubah dokumen kertas menjadi sebuah file digital, menyederhanakan data entri dan pencarian yang cepat, serta banyak manfaat lain nya. 

 

OCR dapat di gunakan pada HP Scanner, HP Photo Scanner dan Printer All in One

Keuntungan dan kemudahan menggunakan OCR

Pencarian data yang cepat untuk menghemat ruang, banyak manfaat memindai dokumen Anda dengan aplikasi OCR

1. Tidak Perlu lagi mengetik ulang
Jika Anda kehilangan atau tanpa sengaja menghapus file digital penting, seperti proposal atau faktur Penjualan, namun masih memiliki Dokumen aslinya, Anda dapat dengan mudah menggantinya ke dalam sistem pengarsipan secara digital dengan menggunakan software OCR untuk memindai Dokumen tersebut.

2. Pencarian yang cepat secara digital 

OCR software mengkonversi teks hasil pindaian ke file pengolah kata, memberikan Anda kemudahan untuk mencari dokumen tertentu menggunakan kata kunci atau frase. Misalnya, Anda dengan mudah dapat mencari ratusan invoice dan menemukan nama tertentu atau account tertentu, tanpa harus mencarinya satu persatu melalui file yang di arsip di lemari yang begitu banyak.

3. Teks yang bisa di edit 

Setelah Anda men-scan dokumen Anda menggunakan OCR, Anda memiliki pilihan untuk mengedit teks dalam program pengolah kata pilihan Anda. Memindai Dokumen yang mungkin perlu diperbarui di masa yang akan datang untuk membantu mempercepat proses editing, seperti:

a. Resep Makanan keluarga 
b. Perjanjian Sewa Menyewa 
c. Lamaran Kerja
d. Kontrak

4. Menghemat Tempat
Membebaskan banyak ruang (Space) dengan memindai Dokumen Kertas menjadi bentuk Digital yang dapat diedit, dan menciptakan sistem cadangan (Backup) dalam satu CD.

5. Aksesibilitas
OCR software sangat mudah di akses dan bermanfaat bagi pengguna PC lain yang dapat memindai buku, majalah, faks masuk, atau dokumen lainnya ke dalam program pengolah kata yang akan digunakan berhubungan dengan utility Komputer voice-over

Bagaimana Cara menggunakan OCR?
Readiris Pro OCR software yang dilengkapi pada HP scanner Manajemen Dokumen, Scanner foto dan scanner pada printer All-in-Ones (Type tertentu)

Selain itu, aplikasi OCR secara otomatis akan di install ketika menginstal driver printer yang di paketkan pada penjualan Printer HP type tertentu. Jika HP Scanner atau Printer All in One Anda tidak dilengkapi software OCR pada paket penjualan yang ditawarkan, Anda dapat membeli “Readiris Pro OCR” secara online.

Untuk menginstal aplikasi ini, ikuti langkah-langkah sebagai berikut:

a. Masukkan CD ROM Readiris Pro ke PC Anda.
b. InstallShield Wizard akan muncul. Klik Next. Ikuti petunjuk instalasi sampai Readiris for HP muncul.
c. Aplikasi OCR Anda sekarang telah berhasil di-instal, Anda dapat mulai memindai dokumen Anda!

Bagaimana cara Memindai Dokumen dengan OCR?
 
Untuk memindai dokumen Anda: 
1. Silahkan muat dokumen Anda ke flatbed Scanner atau ke Dokumen Feeder otomatis (ADF).
2. Pilih Pindai pada menu Readiris, di bawah pilihan Scanning 
3. Dokumen akan dipindai secara otomatis dan langsung muncul di layar menu aplikasi Readiris.

 

Bagaimana cara Untuk mengirim atau menyimpan dokumen Anda:
Setelah dokumen hasil scan Anda muncul dalam aplikasi Readiris, pilih “Recognize” + Simpan di bawah pilihan Recognition untuk mengirim dokumen Anda ke aplikasi seperti Microsoft Word, Microsoft Excel, Adobe Acrobat, atau Internet Explorer.

Readiris Desktop Search
Readiris Program Desktop Search akan secara otomatis diinstal bersama dengan aplikasi Readiris. Cukup masukkan kata pencarian Anda atau frase ke menu pencarian program akan mencocokkan semua file yang sesuai dengan kata kunci. Anda bahkan dapat mempersempit pencarian Anda dengan kategori seperti ukuran file, folder, dan tanggal.

Mendapatkan hasil maksimal dari penggunaan OCR

Untuk memastikan kualitas hasil pemindaian, pastikan Anda hanya memindai jenis dokumen berikut:

a. Dokumen cetak Teks ukuran dari 6 poin (08 inci) sampai 72 poin (1 inci)
b. Dokumen teks yang Diketik
c. Dokumen yang di cetak oleh Printer Laser dan inkjet
d. Dokumen Surat dari Printer dot matrix 
e. Majalah, koran, buku, brosur, dll
f. Dokumen Faks dengan resolusi lebih besar dari 200 dpi.

Readiris tidak bisa mengenali karakter berbentuk “script”, “font khusus”, atau tulisan tangan.

Ketersediaan:
Aplikasi OCR dilengkapi pada HP scanner Dokumen Manajemen dan beberapa type HP Scanner Foto dan scanner pada Printer All-in-Ones.

Dokumen Manajemen scanner: Ideal bagi mereka yang membutuhkan kecepatan cetak yang tinggi dan Dokumen Feeder otomatis (ADF) untuk mengakomodasi volume scan yang besar. Untuk menemukan produk HP dengan software OCR yang tepat untuk kebutuhan Scan Anda, silahkan cek di link ini **

Jika Anda memilih “Allow Senders Only”, Anda dapat memasukkan alamat e-mail untuk mencetak ke printer Anda. Anda dapat menentukan hingga 500 alamat e-mail.

Scanner Foto: Bagi Anda yang kadang-kadang membutuhkan Scanner untuk memindai gambar Foto berkualitas dan tidak membutuhkan volume scan yang tinggi, ada beberapa HP Photo Scanner yang sudah di lengkapi software OCR, silahkan cek di link ini **

Printer All-in-One: Jika Anda ingin perangkat dengan kemampuan cetak, copy, dan fax bersamaan dengan kemampuan untuk menggunakan OCR pada saat pemindaian, Silahkan cek di link ini **

Jika Anda memilih “Allow Senders Only”, Anda dapat memasukkan alamat e-mail untuk mencetak ke printer Anda. Anda dapat menentukan hingga 500 alamat e-mail.

Scanner Foto: Bagi Anda yang kadang-kadang membutuhkan Scanner untuk memindai gambar Foto berkualitas dan tidak membutuhkan volume scan yang tinggi, ada beberapa HP Photo Scanner yang sudah di lengkapi software OCR, silahkan cek di link ini **

Printer All-in-One: Jika Anda ingin perangkat dengan kemampuan cetak, copy, dan fax bersamaan dengan kemampuan untuk menggunakan OCR pada saat pemindaian, Silahkan cek di link ini **

Artikel Terkait : Scanning Tips

 

Artikel Terkait : Scanning Tips

Anda mungkin juga meminati:

 

Cara Scan Foto Untuk Dicetak

 

Mencetak Foto Hasil Scan Resolusi Tinggi

 

Bagaimana Cara Menggunakan Scanner?