Optical Character Recognition (OCR) adalah proses dimana gambar teks diubah menjadi format teks yang dapat dibaca oleh mesin. Misalnya, jika Anda memindai formulir atau tanda terima, komputer Anda akan menyimpan pindaian tersebut sebagai file gambar. Anda tidak dapat menggunakan editor teks untuk mengedit, mencari, atau menghitung kata dalam file gambar. Namun, OCR dapat digunakan untuk mengonversi gambar menjadi dokumen teks dengan isinya sebagai data teks.
Mengapa OCR penting? Sebagian besar alur kerja bisnis melibatkan penerimaan informasi dari media cetak. Formulir cetak, faktur, pindaian dokumen hukum, dan kontrak cetak adalah bagian dari proses bisnis. Dokumen dalam jumlah besar ini membutuhkan banyak waktu dan ruang untuk disimpan dan dikelola. Sementara manajemen dokumen digital dianjurkan, mendigitalkan dokumen menciptakan tantangan. Prosesnya membutuhkan intervensi manual dan bisa membosankan serta memakan waktu. Selain itu, memindai konten dokumen membuat file gambar dengan teks tersembunyi di dalamnya. Teks dalam gambar tidak dapat diproses oleh perangkat lunak pengolah kata dengan cara yang sama seperti dokumen teks. Teknologi OCR memecahkan masalah tersebut dengan mengubah gambar teks menjadi data teks yang dapat diuraikan oleh perangkat lunak bisnis lainnya. Anda kemudian dapat menggunakan data tersebut untuk melakukan analitik, mengoptimalkan operasi, mengotomatiskan proses, dan meningkatkan produktivitas.
Bagaimana cara kerja OCR?
![]() Mesin OCR atau perangkat lunak OCR bekerja melalui langkah-langkah berikut:
Akuisisi gambar Pemindai membaca dokumen dan mengubahnya menjadi data biner. Perangkat lunak OCR menganalisis gambar yang dipindai dan mengklasifikasikan area terang sebagai latar belakang dan area gelap sebagai teks .
Pra-pemrosesan Perangkat lunak OCR pertama-tama membersihkan gambar dan menghilangkan kesalahan untuk mempersiapkannya untuk dibaca. Berikut adalah beberapa teknik pembersihan: · Luruskan atau miringkan sedikit dokumen yang dipindai untuk memperbaiki ketidaksejajaran selama pemindaian. · Noda dihapus dari gambar digital atau tepi gambar teks dihaluskan. · Bingkai dan garis gambar dibersihkan. · Skrip dikenali untuk teknologi OCR multibahasa. Pengenalan teks Dua jenis utama algoritma OCR atau proses perangkat lunak yang digunakan oleh perangkat lunak OCR untuk pengenalan teks disebut pencocokan pola dan ekstraksi fitur.
Pencocokan pola Pencocokan pola mengisolasi gambar karakter, yang disebut mesin terbang, dan membandingkannya dengan mesin terbang yang disimpan serupa. Pengenalan pola hanya berfungsi jika mesin terbang yang disimpan memiliki font dan skala yang sama dengan mesin terbang input. Metode ini bekerja dengan baik dengan gambar dokumen yang dipindai yang telah ditulis dalam font yang dikenal.
Ekstraksi Fitur Ekstraksi fitur membagi atau menguraikan mesin terbang menjadi fitur seperti garis, putaran, arah garis, dan perpotongan garis. Kemudian menggunakan fitur ini untuk menemukan kecocokan terbaik atau tetangga terdekat di antara mesin terbang yang disimpan.
Pengolahan pasca Setelah analisis, sistem mengubah data teks yang diekstraksi menjadi file terkomputerisasi. Beberapa sistem OCR dapat membuat file PDF beranotasi yang menyertakan versi sebelum dan sesudah dari dokumen yang dipindai.
Apa saja jenis-jenis OCR? Ilmuwan data mengklasifikasikan berbagai jenis teknologi OCR berdasarkan penggunaan dan aplikasinya. Berikut beberapa contohnya: Perangkat lunak pengenalan karakter optik sederhana Mesin OCR sederhana menyimpan banyak pola gambar teks dan banyak font berbeda sebagai templat. Perangkat lunak OCR menggunakan algoritme pencocokan pola untuk membandingkan gambar teks , karakter demi karakter, dengan basis data internalnya. Jika sistem mencocokkan teks kata demi kata, itu disebut pengenalan kata optik. Solusi ini memiliki keterbatasan, karena font dan gaya penulisan hampir tidak terbatas, dan tidak semua jenis dapat ditangkap dan disimpan dalam database.
Perangkat lunak pengenal karakter optik cerdas Sistem OCR modern menggunakan teknologi Intelligent Character Recognition (ICR) untuk membaca teks dengan cara yang sama seperti manusia. Mereka menggunakan metode canggih yang melatih mesin untuk berperilaku seperti manusia menggunakan perangkat lunak pembelajaran mesin . Sistem pembelajaran mesin yang disebut jaringan saraf menganalisis teks di berbagai tingkatan dan memproses gambar berulang kali. Itu mencari atribut gambar yang berbeda, seperti kurva, garis, persimpangan, dan sirkuit, dan menggabungkan hasil dari semua tingkat analisis yang berbeda ini untuk mendapatkan hasil akhir. Meskipun ICR biasanya memproses gambar satu karakter dalam satu waktu, prosesnya cepat, dengan hasil yang dikirimkan dalam hitungan detik.
Pengenalan kata yang cerdas Sistem pengenalan kata yang cerdas bekerja dengan prinsip yang sama seperti ICR, tetapi memproses gambar kata penuh alih-alih melakukan pra-pemrosesan gambar karakter.
Pengenalan merek optik Pengenalan Tanda Optik mengidentifikasi logo, tanda air, dan simbol teks lainnya dalam dokumen.
Apa manfaat yang ditawarkan OCR? Ilmuwan data mengklasifikasikan berbagai jenis teknologi OCR berdasarkan penggunaan dan aplikasinya. Berikut beberapa contohnya:
Perangkat lunak pengenalan karakter optik sederhana Mesin OCR sederhana menyimpan banyak pola gambar teks dan banyak font berbeda sebagai templat. Perangkat lunak OCR menggunakan algoritme pencocokan pola untuk membandingkan gambar teks , karakter demi karakter, dengan basis data internalnya. Jika sistem mencocokkan teks kata demi kata, itu disebut pengenalan kata optik. Solusi ini memiliki keterbatasan, karena font dan gaya penulisan hampir tidak terbatas, dan tidak semua jenis dapat ditangkap dan disimpan dalam database. Perangkat lunak pengenal karakter optik cerdas Sistem OCR modern menggunakan teknologi Intelligent Character Recognition (ICR) untuk membaca teks dengan cara yang sama seperti manusia. Mereka menggunakan metode canggih yang melatih mesin untuk berperilaku seperti manusia menggunakan perangkat lunak pembelajaran mesin . Sistem pembelajaran mesin yang disebut jaringan saraf menganalisis teks di berbagai tingkatan dan memproses gambar berulang kali. Itu mencari atribut gambar yang berbeda, seperti kurva, garis, persimpangan, dan sirkuit, dan menggabungkan hasil dari semua tingkat analisis yang berbeda ini untuk mendapatkan hasil akhir. Meskipun ICR biasanya memproses gambar satu karakter dalam satu waktu, prosesnya cepat, dengan hasil yang dikirimkan dalam hitungan detik. Pengenalan kata yang cerdas Sistem pengenalan kata yang cerdas bekerja dengan prinsip yang sama seperti ICR, tetapi memproses gambar kata penuh alih-alih melakukan pra-pemrosesan gambar karakter.
Pengenalan merek optik Pengenalan Tanda Optik mengidentifikasi logo, tanda air, dan simbol teks lainnya dalam dokumen.
Apa manfaat yang ditawarkan OCR? Berikut adalah manfaat utama dari teknologi OCR:
Teks yang dapat dicari Bisnis dapat mengubah dokumen lama dan baru mereka menjadi arsip pengetahuan yang dapat ditelusuri sepenuhnya. Mereka juga dapat memproses database teks secara otomatis dengan menggunakan perangkat lunak analisis data untuk pemrosesan pengetahuan lebih lanjut.
Efektifitas operasional Anda dapat meningkatkan efisiensi dengan perangkat lunak OCR untuk secara otomatis mengintegrasikan alur kerja dokumen dan alur kerja digital dalam bisnis Anda. Berikut adalah beberapa contoh yang dapat dilakukan perangkat lunak OCR :
· Pindai formulir yang diisi tangan untuk verifikasi, peninjauan, pengeditan, dan analisis otomatis. Ini menghemat waktu yang diperlukan untuk pemrosesan dokumen manual dan entri data. · Temukan dokumen yang diperlukan dengan mencari istilah secara cepat di database sehingga Anda tidak perlu mengurutkan file secara manual di dalam kotak. · Ubah catatan tulisan tangan menjadi teks dan dokumen yang dapat diedit.
Solusi kecerdasan buatan OCR sering menjadi bagian dari solusi kecerdasan buatan lain yang dapat diterapkan oleh perusahaan. Misalnya, memindai dan membaca pelat nomor dan rambu jalan di kendaraan otonom, mendeteksi logo merek di postingan media sosial, atau mengidentifikasi kemasan produk dalam gambar iklan. Teknologi kecerdasan buatan ini membantu perusahaan membuat keputusan pemasaran dan operasional yang lebih baik yang mengurangi biaya dan meningkatkan pengalaman pelanggan.
Untuk apa OCR digunakan? Berikut adalah beberapa kasus penggunaan umum untuk OCR di berbagai industri:
Perbankan Industri perbankan menggunakan OCR untuk memproses dan memverifikasi dokumen untuk dokumen pinjaman, cek deposito, dan transaksi keuangan lainnya. Verifikasi ini meningkatkan pencegahan penipuan dan meningkatkan keamanan transaksi. Misalnya, BlueVine adalah perusahaan teknologi keuangan yang menyediakan pembiayaan untuk usaha kecil dan menengah. Menggunakan Amazon Textract, layanan OCR berbasis cloud, untuk mengembangkan produk bagi usaha kecil di AS agar dapat dengan cepat mengakses pinjaman Program Perlindungan Gaji (PPP) sebagai bagian dari paket stimulus dari bantuan COVID-19. Amazon Textract secara otomatis memproses dan menganalisis puluhan ribu formulir PPP per hari sehingga BlueVine dapat membantu ribuan bisnis memperoleh pendanaan, menghemat lebih dari 400.000 pekerjaan dalam prosesnya.
Kesehatan Industri perawatan kesehatan menggunakan OCR untuk memproses catatan pasien, termasuk perawatan, tes, catatan rumah sakit, dan pembayaran asuransi. OCR membantu merampingkan alur kerja dan mengurangi pekerjaan manual di rumah sakit sambil terus memperbarui catatan. Misalnya, nib Group memberikan asuransi kesehatan dan medis kepada lebih dari satu juta warga Australia dan menerima ribuan permintaan medis setiap hari. Pelanggan dapat mengambil foto tagihan medis mereka dan mengirimkannya melalui aplikasi seluler nib. Amazon Texttract memproses gambar ini secara otomatis sehingga perusahaan dapat menyetujui klaim lebih cepat.
Logistik
Perusahaan logistik menggunakan OCR untuk melacak label paket, faktur, kuitansi, dan dokumen lainnya dengan lebih efisien. Misalnya, Foresight Group menggunakan Amazon Textract untuk mengotomatiskan pemrosesan faktur di SAP. Entri dokumen bisnis ini secara manual memakan waktu dan rawan kesalahan, karena karyawan Foresight harus memasukkan data ke dalam beberapa sistem akuntansi. Dengan Amazon Textract, perangkat lunak Foresight dapat membaca karakter dengan lebih akurat di berbagai tata letak, sehingga meningkatkan efisiensi bisnis. |