Co to jest OCR?

Co to jest OCR?

Zamiast przepisywać tekst ręcznie, możemy powierzyć to zadanie komputerowi. Za pomocą odpowiedniego oprogramowania możemy błyskawicznie „przepisywać” całe strony. Umożliwia to technologia rozpoznawania znaków. Co to jest OCR i jak działa?

  • Jaka jest definicja OCR?

OCR (Optical Character Recognition), czyli technologia, która wyodrębnia tekst z obrazów stron, nazywana jest OCR. Pozwala ona na przekształcenie zdjęcia lub skanu w zwykły dokument tekstowy, który można łatwo edytować lub zmieniać.

Optofon, prototyp OCR, to urządzenie o nazwie Optofon. Jest to rodzaj ręcznego skanera, który został opracowany w 1913 roku przez Edmunda Fournier d’Albe z Uniwersytetu Birmingham. Optofon rozpoznaje litery i przekształca je w dźwięki poprzez przesuwanie po tekście.

  • Jak działa OCR?

Zanim oprogramowanie odpowiedzialne za rozpoznawanie tekstu będzie mogło przekształcić skan lub zdjęcie w tekst, musi przejść przez kilka etapów. Te kroki to:

  1. Wczytanie obrazu i wyodrębnienie jego elementów (oprogramowanie określa położenie pustej przestrzeni, elementów graficznych oraz tekstu do rozpoznania).
  2. Rozpoznanie wyodrębnionego tekstu (istnieje kilka metod, które można do tego wykorzystać; najpopularniejsze z nich to analiza cech oraz porównywanie obrazów znaków z bazą wzorców).
  3. Zapisywanie i tworzenie rozpoznanego tekstu.

Przyszłość księgowości zależy od budowania marki – czytaj więcej na https://centrum-biurowe.pl/ksiegowosc/przyszlosc-ksiegowosci-zalezy-od-budowania-marki/qkge_zjyr

  • Współczesna technologia OCR

Już w latach 20. ubiegłego wieku optyczne rozpoznawanie znaków było wykorzystywane do przeszukiwania i archiwizacji zawartości mikrofilmów. IBM zakupił technologię, która została opracowana przez Emanuela Goldberga. Maszyny te potrafiły rozpoznawać pojedyncze znaki, ale nie całe strony tekstu.

Ray Kurzweil wynalazł OCR, czyli OCR w nowoczesnym znaczeniu. W latach 70. stworzył on urządzenie, które zamienia zeskanowany tekst na mowę. Oprogramowanie Kurzweila było w stanie rozpoznać tekst napisany niemal każdym krojem pisma. Dzięki temu Kurzweil mógł nie tylko porównywać znaki z wzorcami, ale także analizować ich kluczowe cechy.

W 1978 roku pojawiło się pierwsze urządzenie OCR. Było to połączenie skanera i syntezatora mowy. Stevie Wonder, niewidomy muzyk, był jednym z pierwszych, którzy zakupili ten sprzęt. Technologię tę opracowała firma Kurzweil Computer Products, Inc. Została ona szybko zastosowana w skanerze dla osób niewidomych oraz w komercyjnym oprogramowaniu, zapoczątkowując tym samym współczesną erę optycznego rozpoznawania znaków.

  • Prywatność i OCR

Maszynowe rozpoznawanie tekstu może stanowić zagrożenie dla prywatności. Sang Mun, były agent amerykańskiej agencji NSA, opracował czcionkę nieczytelną dla algorytmów, aby rozwiązać ten problem. Chociaż czcionka ZXX może być odczytywana przez człowieka, OCR nie jest możliwe ze względu na dodawanie elementów do liter.

  • Oprogramowanie OCR jest nauczane przez użytkowników

Użytkownicy Internetu przyczyniają się do udoskonalania oprogramowania OCR na ogromną skalę. Wiele osób robi to nieświadomie, wypełniając formularze reCAPTCHA. Są to fragmenty tekstu, które nie są możliwe do odczytania przez oprogramowanie OCR. Oprogramowanie OCR służy do weryfikacji, czy przed komputerem siedzi człowiek, czy też bot wypełnił komentarz lub formularz rejestracyjny.

Oznacza to, że użytkownicy „uczą” algorytm nowych wzorów i sylab. Umiejętności algorytmu są stale doskonalone – w ten sposób rozpoznawane są miliony próbek tekstu. Technologia OCR również staje się coraz bardziej zaawansowana.

Może to Ci się spodoba

Organizacja pracy 0 Comments

Zmiany w unijnych przepisach o delegowaniu pracowników mogą zatrząść polskim rynkiem pracy. Część firm czeka bankructwo

W Brukseli trwają prace nad zmianami w dyrektywie o delegowaniu pracowników za granicę. Komisja Europejska chce, by pracownicy delegowani po przekroczeniu granicy mieli opłacane wszystkie składowe wynagrodzenia miejscowych specjalistów. To nie tylko podniesie

Organizacja pracy 0 Comments

Urlop może być źródłem stresu. Problemem są zbyt duże wymagania

Urlop od pracy zamiast czasem relaksu może być źródłem stresu. Przede wszystkim ze względu na brak umiejętności odpoczywania. Podczas wakacji stawiamy sobie zbyt wysokie wymagania, co powoduje, że każda drobnostka

Organizacja pracy 0 Comments

Profesjonalne tablice i znaki bhp

Podczas wykonywania każdej pracy, niezależnie od zajmowanego przez nas stanowiska, bardzo ważne jest przestrzeganie zasad BHP. Z pewnością bardzo pomocne nam w tym będą odpowiednie znaki oraz instrukcje. Obecnie obowiązujące

0 Comments

Brak komentarzy!

You can be first to comment this post!

Zostaw odpowiedź