Znanost

Što je ocr? »Njegova definicija i značenje

Anonim

OCR su oni za optičko prepoznavanje znakova ili su na španjolskom poznati i kao optičko prepoznavanje znakova. OCR je softver koji omogućuje prepoznavanje teksta, stvarajući njegovu sliku kako bi ga pretvorio u niz znakova, a zatim ih spremio u zadani format koji se može koristiti u tim programima za uređivanje teksta. Drugim riječima, zahvaljujući ovoj novoj tehnologiji, bilo koja vrsta teksta ili dokumenta, uključujući PDF datoteke, skenirane papire ili čak slike preuzete s digitalnih fotoaparata, može se pretvoriti u podatke kako bi se imala mogućnost uređivanja.

Ovaj softver radi na sljedeći način, prvo analizira svaki dio slike predmetnog dokumenta; distribuirati stranicu u dijelovima poput tablica, slika, tekstualnih blokova, između ostalog; tada se redovi distribuiraju riječima da bi kasnije postali likovi; a budući da su znakovi već naznačeni, softver vrši usporedbu sa skupinom slika uzorka. To napreduje prema nizu hipoteza o tome što je svaki lik; i na temelju tih hipoteza analizira različite varijante razbijanja linija u riječi i riječi u znakove. I nakon velikog broja analiza i obrade hipoteza, program konačno predstavlja tekst koji je već prepoznat i transformiran u novi format.

Valja napomenuti da danas postoji niz programa koje tržište računala nudi na temelju OCR-a poput OmniPage, Abbyy Fine Reader ili READiris. YY koji imaju sposobnost, ne samo da analiziraju i prepoznaju tekst kao takav, već prepoznaju i format i stil, ali uz određena ograničenja, što zahtijeva da se tekst nakon analize analizira kako bi se izvršile prilagodbe koje su zahtijevati.