Optyczne rozpoznawanie znaków,OCR (ang. optical character recognition) – zestaw technik luboprogramowanie służące do rozpoznawania znaków i całych tekstów wplikugraficznym o postacirastrowej. ZadaniemOCR jest zwykle rozpoznanie tekstu wzeskanowanym dokumencie (na przykład papierowym formularzu lub stronie książki).
Niegdyś termin oznaczał samo rozpoznawanie ciągów znaków, głównie drukowanych, które są łatwiejsze do rozpoznania, dziś również pisma odręcznego oraz cechformatowania, jakkrój pisma,stopień pisma,interlinia (techniki służące do tego typu zaawansowanego rozpoznawania nazywane są terminemICR), a nawetukładów tabelarycznych.
Techniki optycznego rozpoznawania znaków stosowane są, między innymi, przydigitalizacji zasobów bibliotek, a także jako ułatwienie przy odczytywaniu danych z formularzy wypełnianych pismem odręcznym. W obu przypadkach oprogramowanieOCR nie jest tak skuteczne jak człowiek, zatem w przypadkach wątpliwych (trudności z odczytaniem fragmentu) oraz w celu uniknięcia błędów nieodzowna jest weryfikacja wynikuOCR przez człowieka.
Nowoczesną metodą współpracy oprogramowaniaOCR z ludźmi jest technikareCAPTCHA[1]. Nie wymaga ona zatrudniania osób specjalnie do weryfikacjiOCR, lecz wykorzystuje rozproszoną aktywność milionów użytkowników Internetu, którzy wchodząc nastrony internetowe zabezpieczone przezCAPTCHA rozpoznają fragmenty tekstu wymagające weryfikacji.
Postęp w optycznym rozpoznawaniu znaków jest bardzo widoczny – drogie komercyjne oprogramowanie z lat 90. XX wieku wymagało dobrego skanu, najlepiej w językach zachodnioeuropejskich. W 2013 możliwe było rozpoznawanie mało dokładnych skanów, wykonanych telefonami komórkowymi zszumami na obrazkach, z tekstem napisanym pod nienaturalnymi kątami, w 120–186 językach (w zależności od programu).
Rozpoznawanie pisma jest możliwe dzięki zastosowaniu metod z dziedzinyrozpoznawania wzorców (zaliczanej dosztucznej inteligencji). OprogramowanieOCR wykorzystuje różne metodysegmentacji obrazu, na przykładprogowanie, aby wyodrębnić poszczególne znaki z obrazu, które następnie są najczęściej osobno klasyfikowane jako poszczególne litery. Zwykle w tym procesie wykorzystywane sąsieci neuronowe. Zazwyczaj, by wyeliminować pomyłki, program sprawdza całość rozpoznanego tekstu lub poszczególne wyrazy pod kątem poprawności ortograficznej i gramatycznej danego języka.
| Główne cechy | |
|---|
| Filozofia | |
|---|
| Pojęcia | |
|---|
| Zastosowania | |
|---|
| Implementacje | | Audio-wizualne | - tekst-do-obrazu
- tekst-do-wideo
|
|---|
| Tekstowe | |
|---|
| Decyzyjne | |
|---|
|
|---|
| Architektury | |
|---|