Hvad er Optisk Tegngenkendelse (OCR)?

Optisk tegnegenkendelse (OCR) refererer til software, der opretter en digital version af et trykt, skrevet eller håndskrevet dokument, som computere kan læse uden at man manuelt skriver eller indtaster teksten. OCR bruges generelt på scannede dokumenter i PDF-format, men kan også skabe en computerlæsbar version af tekst i en billedfil.

Hvad er OCR?

OCR, også kaldet tekstgennemgang, er software teknologi, der omdanner tegn som tal, bogstaver og tegnsætning (også kaldet glyfer) fra trykte eller skriftlige dokumenter til en elektronisk form, der lettere kan genkendes og læses af computere og andre softwareprogrammer. Nogle OCR-programmer gør dette, da et dokument scannes eller fotograferes med et digitalkamera, og andre kan anvende denne proces på dokumenter, der tidligere er scannet eller fotograferet uden OCR. OCR giver brugere mulighed for at søge inden for PDF-dokumenter, redigere tekst og omformater dokumenter.

Hvad bruges OCR til?

For hurtig, hver dag scanning behov, OCR kan ikke være en big deal. Hvis du gør en stor scanning, kan du søge i PDF-filer for at finde den nøjagtige, du har brug for, kan spare en smule tid og gør OCR-funktionaliteten i dit scannerprogram vigtigere. Her er nogle andre ting, OCR hjælper med:

Automatisk databehandling og dataindtastning (Eksempel: Jobsøgersporing til genoptagelse)
Gør scannede bøger søgbare
Konvertering af håndskrevne scanninger til computerlæsbar tekst
Gør dokumenter mere anvendelige af læseren programmer, der hjælper synshandicappede brugere
Bevare historiske dokumenter og aviser, samtidig med at de bliver søgbare
Dataudvinding og overførsel til regnskabsprogrammer (Eksempel: Kvitteringer og fakturaer)
Indeksering af dokumenter til brug for søgemaskiner
Anerkendelse af kørekort til kørekort med hastighedskamera og røde lys kamera software
Talesynteseapparater til folk, der ikke kan tale - teoretisk fysiker, Stephen Hawking, er måske den mest kendte bruger af et tale synthesizer program

Hvorfor brug OCR?

Hvorfor ikke bare tage et billede, ikke? Fordi du ikke ville kunne redigere noget eller søge i teksten, fordi det bare ville være et billede. Scanning af dokumentet og kørende OCR-software kan gøre denne fil til noget, du kan redigere og være i stand til at søge.

Historie om OCR

Mens den aller tidligste anvendelse af tekstgenkendelse datoer til 1914, begyndte den omfattende udvikling og brug af OCR-relaterede teknologier alvorligt i 1950'erne, specielt med oprettelsen af meget forenklede skrifttyper, der var lettere at konvertere til digitalt læsbar tekst. Den første af disse forenklede skrifttyper blev oprettet af David Shepard og almindeligvis kendt som OCR-7B. OCR-7B er stadig i brug i dag i den finansielle sektor for standardfonten, der bruges på kreditkort og debetkort. I 1960'erne begyndte posttjenester i flere lande at bruge OCR-teknologi til hurtigt at fremskynde post sortering, herunder USA, Storbritannien, Canada og Tyskland. OCR er stadig kerneteknologien, der bruges til at sortere post til posttjenester rundt om i verden. I 2000 blev nøglekendskabet til OCR-teknologiens grænser og kapaciteter brugt til at udvikle CAPTCHA-programmerne til at stoppe bots og spammere.

I løbet af årtierne er OCR vokset mere præcist og mere sofistikeret på grund af fremskridt inden for beslægtede teknologiske områder som kunstig intelligens, maskinindlæring og computersyn. I dag bruger OCR-software mønstergenkendelse, funktionsdetektering og tekstmining til at omdanne dokumenter hurtigere og mere præcist end nogensinde før.