OCR (Recunoaștere optică a caracterelor)

Recunoașterea optică a caracterelor (OCR) este una dintre cele mai vechi tehnici de introducere a datelor, permițând mașinilor să citească direct caractere tipărite și, în anumite aplicații controlate, să depășească codurile de bare în ceea ce privește densitatea de informație.

După perforarea cartelelor (keypunching), recunoașterea optică a caracterelor este cea mai veche tehnică de introducere a datelor existentă. Cu mult înainte de apariția primelor sisteme key-to-disk sau bazate pe CRT, cititoarele optice de caractere introduceau date în instalații comerciale și guvernamentale de prelucrare electronică a datelor.

Popularitatea OCR a crescut în fiecare an odată cu apariția microprocesoarelor rapide, care au permis tehnici de recunoaștere mult îmbunătățite. Acest lucru se observă în stilourile OCR (OCR wands) care acum citesc texte pe care, cu peste 10 ani în urmă, cititoarele de loturi mari le-ar fi respins. Au existat de asemenea îmbunătățiri considerabile atât în ratele efective de citire, cât și în acuratețe. Introducerea datelor prin OCR este mai rapidă, mai precisă și, în general, mai eficientă decât introducerea manuală de la tastatură. Scanerele OCR de birou pot citi date dactilografiate într-un computer la rate de până la 2400 de cuvinte pe minut!

Cum funcționează OCR

Există două metode de bază utilizate pentru OCR: potrivirea matricială (matrix matching) și extragerea de caracteristici (feature extraction). Dintre cele două, potrivirea matricială este mai simplă și mai comună.

Potrivirea matricială compară ceea ce scanerul OCR vede ca fiind un caracter cu o bibliotecă de matrice sau șabloane de caractere. Când o imagine se potrivește cu una dintre aceste matrice prescrise de puncte, în limitele unui anumit nivel de similitudine, computerul etichetează acea imagine drept caracterul ASCII corespunzător.

Extragerea de caracteristici este OCR fără potrivire strictă cu șabloane prescrise. Cunoscută și sub numele de Recunoaștere Inteligentă a Caracterelor (ICR) sau analiză topologică a caracteristicilor, această metodă variază în funcție de cât de multă "inteligență artificială" aplică producătorul. Computerul caută caracteristici generale precum zone deschise, forme închise, linii diagonale, intersecții de linii etc. Această metodă este mult mai versatilă decât potrivirea matricială. Potrivirea matricială funcționează cel mai bine atunci când OCR-ul întâlnește un repertoriu limitat de stiluri de tipar, cu variații mici sau deloc în cadrul fiecărui stil. Acolo unde caracterele sunt mai puțin previzibile, analiza de caracteristici sau topografică este superioară.

Fonturi OCR

Ce este un font? Font este termenul dat unui set de caractere, de obicei 0-9, A până la Z și câteva caractere speciale. Fiecare caracter dintr-un font are o dimensiune și o formă definite, reproductibile. Pentru OCR, acestea sunt definite de ANSI, Institutul Național American de Standarde.

Fonturile OCR, sau caracterele, care pot fi citite de sistemele cu viteză mai mică și cost mai redus discutate aici necesită forme de caractere bine definite, foarte reproductibile și proiectate pentru a fi citibile atât de mașini, cât și de oameni. Aceste seturi de caractere unice și bine definite permit o acuratețe mai mare.

Scanere OCR

Dispozitivele de citire OCR se împart fundamental în două categorii: introducere de text și captură de date.

Dispozitivele de introducere de text sunt cititoare de pagini sau scanere de documente care scanează documente întregi sau porțiuni mari din documente. Datele sursă sunt introduse cu așteptarea ca cineva să le editeze în timpul sau după scanare. Dispozitivele de introducere de text au grade variate de automatizare, de la alimentare manuală până la alimentare, citire, sortare și stivuire complet automate.

Dispozitivele de captură de date sunt proiectate să capteze date repetitive și să efectueze funcții de formatare asupra lor pe măsură ce sunt introduse. Datele livrate de scaner către computer trebuie să fie foarte precise, deoarece sunt introduse fără intenția de a fi editate ulterior, deci acuratețea trebuie să fie mai mare decât la introducerea de text.

Elementele unei aplicații OCR de succes

Elementele unei instalări OCR de succes includ:
¤ Suport media adecvat
¤ Proiectarea formularelor
¤ Integritatea datelor și procesarea rezultatelor
¤ Cititorul OCR

Motive pentru utilizarea OCR

Există mai multe motive pentru a alege scanarea OCR în locul altor metode de introducere a datelor.
Câteva dintre cele mai importante includ:
¤ Reducerea erorilor de introducere a datelor
¤ Consolidarea introducerii datelor
¤ Gestionarea sarcinilor de vârf
¤ Citibilitate umană
¤ Compatibilitate cu multe tehnici de tipărire
¤ Corecții la scanare

Când este OCR preferat față de codurile de bare?

OCR este mai potrivit pentru introducerea datelor într-un mediu controlat, pentru orice număr de caractere. De exemplu, procesarea plăților (remittance processing), unde datele de pe facturile de utilități sau alte documente de retur trebuie introduse într-un sistem.

Unele linii de scanare OCR pot conține peste 40 de caractere și o varietate de informații valoroase, precum data scadenței facturii, numărul contului, suma datorată, tipul serviciului etc.

Codurile de bare sunt cele mai potrivite acolo unde funcția principală este identificarea pieselor sau articolelor în medii dure, sau unde suportul este reutilizat în mod repetat și conține relativ puține caractere. De exemplu, identificarea și urmărirea bagajelor pasagerilor în industria aviatică. Codurile de bare sunt foarte tolerante la manipulare dură și medii dure, dar necesită mult mai mult spațiu pe o etichetă sau document decât OCR. La suprafață egală, OCR poate stoca de șase ori mai multă informație decât un cod de bare standard.