Co to jest OCR?

Co to jest OCR?

Zamiast przepisywać tekst ręcznie, możemy powierzyć to zadanie komputerowi. Za pomocą odpowiedniego oprogramowania możemy błyskawicznie „przepisywać” całe strony. Umożliwia to technologia rozpoznawania znaków. Co to jest OCR i jak działa?

  • Jaka jest definicja OCR?

OCR (Optical Character Recognition), czyli technologia, która wyodrębnia tekst z obrazów stron, nazywana jest OCR. Pozwala ona na przekształcenie zdjęcia lub skanu w zwykły dokument tekstowy, który można łatwo edytować lub zmieniać.

Optofon, prototyp OCR, to urządzenie o nazwie Optofon. Jest to rodzaj ręcznego skanera, który został opracowany w 1913 roku przez Edmunda Fournier d’Albe z Uniwersytetu Birmingham. Optofon rozpoznaje litery i przekształca je w dźwięki poprzez przesuwanie po tekście.

  • Jak działa OCR?

Zanim oprogramowanie odpowiedzialne za rozpoznawanie tekstu będzie mogło przekształcić skan lub zdjęcie w tekst, musi przejść przez kilka etapów. Te kroki to:

  1. Wczytanie obrazu i wyodrębnienie jego elementów (oprogramowanie określa położenie pustej przestrzeni, elementów graficznych oraz tekstu do rozpoznania).
  2. Rozpoznanie wyodrębnionego tekstu (istnieje kilka metod, które można do tego wykorzystać; najpopularniejsze z nich to analiza cech oraz porównywanie obrazów znaków z bazą wzorców).
  3. Zapisywanie i tworzenie rozpoznanego tekstu.

Przyszłość księgowości zależy od budowania marki – czytaj więcej na https://centrum-biurowe.pl/ksiegowosc/przyszlosc-ksiegowosci-zalezy-od-budowania-marki/qkge_zjyr

  • Współczesna technologia OCR

Już w latach 20. ubiegłego wieku optyczne rozpoznawanie znaków było wykorzystywane do przeszukiwania i archiwizacji zawartości mikrofilmów. IBM zakupił technologię, która została opracowana przez Emanuela Goldberga. Maszyny te potrafiły rozpoznawać pojedyncze znaki, ale nie całe strony tekstu.

Ray Kurzweil wynalazł OCR, czyli OCR w nowoczesnym znaczeniu. W latach 70. stworzył on urządzenie, które zamienia zeskanowany tekst na mowę. Oprogramowanie Kurzweila było w stanie rozpoznać tekst napisany niemal każdym krojem pisma. Dzięki temu Kurzweil mógł nie tylko porównywać znaki z wzorcami, ale także analizować ich kluczowe cechy.

W 1978 roku pojawiło się pierwsze urządzenie OCR. Było to połączenie skanera i syntezatora mowy. Stevie Wonder, niewidomy muzyk, był jednym z pierwszych, którzy zakupili ten sprzęt. Technologię tę opracowała firma Kurzweil Computer Products, Inc. Została ona szybko zastosowana w skanerze dla osób niewidomych oraz w komercyjnym oprogramowaniu, zapoczątkowując tym samym współczesną erę optycznego rozpoznawania znaków.

  • Prywatność i OCR

Maszynowe rozpoznawanie tekstu może stanowić zagrożenie dla prywatności. Sang Mun, były agent amerykańskiej agencji NSA, opracował czcionkę nieczytelną dla algorytmów, aby rozwiązać ten problem. Chociaż czcionka ZXX może być odczytywana przez człowieka, OCR nie jest możliwe ze względu na dodawanie elementów do liter.

  • Oprogramowanie OCR jest nauczane przez użytkowników

Użytkownicy Internetu przyczyniają się do udoskonalania oprogramowania OCR na ogromną skalę. Wiele osób robi to nieświadomie, wypełniając formularze reCAPTCHA. Są to fragmenty tekstu, które nie są możliwe do odczytania przez oprogramowanie OCR. Oprogramowanie OCR służy do weryfikacji, czy przed komputerem siedzi człowiek, czy też bot wypełnił komentarz lub formularz rejestracyjny.

Oznacza to, że użytkownicy „uczą” algorytm nowych wzorów i sylab. Umiejętności algorytmu są stale doskonalone – w ten sposób rozpoznawane są miliony próbek tekstu. Technologia OCR również staje się coraz bardziej zaawansowana.

Może to Ci się spodoba

Organizacja pracy 0 Comments

Jak dobrze zorganizować automatyzację stanowisk roboczych?

Firmy przemysłowe poniekąd zobligowane są do wprowadzania zautomatyzowanych rozwiązań technologicznych. Dzięki robotyce bowiem praca jest sprawniejsza, wydajniejsza, a przez to i bardziej ekonomiczna. Jednak, aby systemy te działały sprawnie muszą

Organizacja pracy 0 Comments

Większość polskich firm nie mierzy efektywności pracy. W Europie to już standard

Tylko 45 proc. przedsiębiorców deklaruje, że ich firma jest dojrzała procesowo – wynika z badania Macrologic. To oznacza, że mają one rozpisane poszczególne procesy, potrafią je kontrolować i mierzyć efektywność. Brak takiego

Organizacja pracy 0 Comments

EPR Optima – bezkonkurencyjny produkt

Technologia komputerowa to dla każdego przedsiębiorcy znaczne ułatwienie, w prowadzeniu firmy. Rozwój systemów informatycznych, zwłaszcza w obszarze programów EPR, pozwolił na znaczące zoptymalizowanie wszystkich procesów, zachodzących wewnątrz firmy. Na tym

0 Comments

Brak komentarzy!

You can be first to comment this post!

Zostaw odpowiedź