Co to jest OCR?

Co to jest OCR?

Zamiast przepisywać tekst ręcznie, możemy powierzyć to zadanie komputerowi. Za pomocą odpowiedniego oprogramowania możemy błyskawicznie „przepisywać” całe strony. Umożliwia to technologia rozpoznawania znaków. Co to jest OCR i jak działa?

  • Jaka jest definicja OCR?

OCR (Optical Character Recognition), czyli technologia, która wyodrębnia tekst z obrazów stron, nazywana jest OCR. Pozwala ona na przekształcenie zdjęcia lub skanu w zwykły dokument tekstowy, który można łatwo edytować lub zmieniać.

Optofon, prototyp OCR, to urządzenie o nazwie Optofon. Jest to rodzaj ręcznego skanera, który został opracowany w 1913 roku przez Edmunda Fournier d’Albe z Uniwersytetu Birmingham. Optofon rozpoznaje litery i przekształca je w dźwięki poprzez przesuwanie po tekście.

  • Jak działa OCR?

Zanim oprogramowanie odpowiedzialne za rozpoznawanie tekstu będzie mogło przekształcić skan lub zdjęcie w tekst, musi przejść przez kilka etapów. Te kroki to:

  1. Wczytanie obrazu i wyodrębnienie jego elementów (oprogramowanie określa położenie pustej przestrzeni, elementów graficznych oraz tekstu do rozpoznania).
  2. Rozpoznanie wyodrębnionego tekstu (istnieje kilka metod, które można do tego wykorzystać; najpopularniejsze z nich to analiza cech oraz porównywanie obrazów znaków z bazą wzorców).
  3. Zapisywanie i tworzenie rozpoznanego tekstu.

Przyszłość księgowości zależy od budowania marki – czytaj więcej na https://centrum-biurowe.pl/ksiegowosc/przyszlosc-ksiegowosci-zalezy-od-budowania-marki/qkge_zjyr

  • Współczesna technologia OCR

Już w latach 20. ubiegłego wieku optyczne rozpoznawanie znaków było wykorzystywane do przeszukiwania i archiwizacji zawartości mikrofilmów. IBM zakupił technologię, która została opracowana przez Emanuela Goldberga. Maszyny te potrafiły rozpoznawać pojedyncze znaki, ale nie całe strony tekstu.

Ray Kurzweil wynalazł OCR, czyli OCR w nowoczesnym znaczeniu. W latach 70. stworzył on urządzenie, które zamienia zeskanowany tekst na mowę. Oprogramowanie Kurzweila było w stanie rozpoznać tekst napisany niemal każdym krojem pisma. Dzięki temu Kurzweil mógł nie tylko porównywać znaki z wzorcami, ale także analizować ich kluczowe cechy.

W 1978 roku pojawiło się pierwsze urządzenie OCR. Było to połączenie skanera i syntezatora mowy. Stevie Wonder, niewidomy muzyk, był jednym z pierwszych, którzy zakupili ten sprzęt. Technologię tę opracowała firma Kurzweil Computer Products, Inc. Została ona szybko zastosowana w skanerze dla osób niewidomych oraz w komercyjnym oprogramowaniu, zapoczątkowując tym samym współczesną erę optycznego rozpoznawania znaków.

  • Prywatność i OCR

Maszynowe rozpoznawanie tekstu może stanowić zagrożenie dla prywatności. Sang Mun, były agent amerykańskiej agencji NSA, opracował czcionkę nieczytelną dla algorytmów, aby rozwiązać ten problem. Chociaż czcionka ZXX może być odczytywana przez człowieka, OCR nie jest możliwe ze względu na dodawanie elementów do liter.

  • Oprogramowanie OCR jest nauczane przez użytkowników

Użytkownicy Internetu przyczyniają się do udoskonalania oprogramowania OCR na ogromną skalę. Wiele osób robi to nieświadomie, wypełniając formularze reCAPTCHA. Są to fragmenty tekstu, które nie są możliwe do odczytania przez oprogramowanie OCR. Oprogramowanie OCR służy do weryfikacji, czy przed komputerem siedzi człowiek, czy też bot wypełnił komentarz lub formularz rejestracyjny.

Oznacza to, że użytkownicy „uczą” algorytm nowych wzorów i sylab. Umiejętności algorytmu są stale doskonalone – w ten sposób rozpoznawane są miliony próbek tekstu. Technologia OCR również staje się coraz bardziej zaawansowana.

Previous Jakie kosmetyki stosować jesienią?
Next Gdzie szukać pracy jako lektor języka angielskiego?

Może to Ci się spodoba

Organizacja pracy

Przewodnik po Zatrudnianiu Programistów w Medellin: Najlepsze Praktyki i Wskazówki

Medellin, znane jako miasto wiecznej wiosny, nie tylko przyciąga turystów swoim klimatem i pięknymi krajobrazami, ale również staje się ważnym centrum technologicznym w Ameryce Łacińskiej. Coraz więcej firm z całego

Organizacja pracy

Pracodawcy z nowymi licznymi obowiązkami dotyczącymi pracy zdalnej. Przepisy określają także, kiedy mogą odmówić na nią zgody

Polacy polubili pracę zdalną. Jak wynika z badania firmy ADP „People at Work 2022: A Global Workforce View”, ponad 41 proc. pracowników w wieku 34–44 lata twierdzi, że praca wykonywana z domu ułatwia

Organizacja pracy

Zatrudnienie pracowników z Ameryki Południowej. Jak legalnie zatrudnić pracownika z Ameryki Południowej!

W ostatnich latach pracownicy z Ameryki Południowej cieszą się rosnącym zainteresowaniem wśród polskich pracodawców. Doskonale sprawdzają się w wybranych sektorach gospodarki i chętnie zostają w Polsce na dłużej. Sprawdź, jak