Co to jest OCR?

Co to jest OCR?

Zamiast przepisywać tekst ręcznie, możemy powierzyć to zadanie komputerowi. Za pomocą odpowiedniego oprogramowania możemy błyskawicznie „przepisywać” całe strony. Umożliwia to technologia rozpoznawania znaków. Co to jest OCR i jak działa?

  • Jaka jest definicja OCR?

OCR (Optical Character Recognition), czyli technologia, która wyodrębnia tekst z obrazów stron, nazywana jest OCR. Pozwala ona na przekształcenie zdjęcia lub skanu w zwykły dokument tekstowy, który można łatwo edytować lub zmieniać.

Optofon, prototyp OCR, to urządzenie o nazwie Optofon. Jest to rodzaj ręcznego skanera, który został opracowany w 1913 roku przez Edmunda Fournier d’Albe z Uniwersytetu Birmingham. Optofon rozpoznaje litery i przekształca je w dźwięki poprzez przesuwanie po tekście.

  • Jak działa OCR?

Zanim oprogramowanie odpowiedzialne za rozpoznawanie tekstu będzie mogło przekształcić skan lub zdjęcie w tekst, musi przejść przez kilka etapów. Te kroki to:

  1. Wczytanie obrazu i wyodrębnienie jego elementów (oprogramowanie określa położenie pustej przestrzeni, elementów graficznych oraz tekstu do rozpoznania).
  2. Rozpoznanie wyodrębnionego tekstu (istnieje kilka metod, które można do tego wykorzystać; najpopularniejsze z nich to analiza cech oraz porównywanie obrazów znaków z bazą wzorców).
  3. Zapisywanie i tworzenie rozpoznanego tekstu.

Przyszłość księgowości zależy od budowania marki – czytaj więcej na https://centrum-biurowe.pl/ksiegowosc/przyszlosc-ksiegowosci-zalezy-od-budowania-marki/qkge_zjyr

  • Współczesna technologia OCR

Już w latach 20. ubiegłego wieku optyczne rozpoznawanie znaków było wykorzystywane do przeszukiwania i archiwizacji zawartości mikrofilmów. IBM zakupił technologię, która została opracowana przez Emanuela Goldberga. Maszyny te potrafiły rozpoznawać pojedyncze znaki, ale nie całe strony tekstu.

Ray Kurzweil wynalazł OCR, czyli OCR w nowoczesnym znaczeniu. W latach 70. stworzył on urządzenie, które zamienia zeskanowany tekst na mowę. Oprogramowanie Kurzweila było w stanie rozpoznać tekst napisany niemal każdym krojem pisma. Dzięki temu Kurzweil mógł nie tylko porównywać znaki z wzorcami, ale także analizować ich kluczowe cechy.

W 1978 roku pojawiło się pierwsze urządzenie OCR. Było to połączenie skanera i syntezatora mowy. Stevie Wonder, niewidomy muzyk, był jednym z pierwszych, którzy zakupili ten sprzęt. Technologię tę opracowała firma Kurzweil Computer Products, Inc. Została ona szybko zastosowana w skanerze dla osób niewidomych oraz w komercyjnym oprogramowaniu, zapoczątkowując tym samym współczesną erę optycznego rozpoznawania znaków.

  • Prywatność i OCR

Maszynowe rozpoznawanie tekstu może stanowić zagrożenie dla prywatności. Sang Mun, były agent amerykańskiej agencji NSA, opracował czcionkę nieczytelną dla algorytmów, aby rozwiązać ten problem. Chociaż czcionka ZXX może być odczytywana przez człowieka, OCR nie jest możliwe ze względu na dodawanie elementów do liter.

  • Oprogramowanie OCR jest nauczane przez użytkowników

Użytkownicy Internetu przyczyniają się do udoskonalania oprogramowania OCR na ogromną skalę. Wiele osób robi to nieświadomie, wypełniając formularze reCAPTCHA. Są to fragmenty tekstu, które nie są możliwe do odczytania przez oprogramowanie OCR. Oprogramowanie OCR służy do weryfikacji, czy przed komputerem siedzi człowiek, czy też bot wypełnił komentarz lub formularz rejestracyjny.

Oznacza to, że użytkownicy „uczą” algorytm nowych wzorów i sylab. Umiejętności algorytmu są stale doskonalone – w ten sposób rozpoznawane są miliony próbek tekstu. Technologia OCR również staje się coraz bardziej zaawansowana.

Może to Ci się spodoba

Organizacja pracy 0 Comments

Jak prawidłowo opiekować się osobą leżącą?

Osoby obłożnie chore wymagają opieki przez całą dobę. Gdy senior nie wstaje z łóżka, staje się całkowicie zależny od opiekuna. Sprawdź, jak prawidłowo zadbać o potrzeby osoby leżącej! Co może

Organizacja pracy 0 Comments

Rośnie liczba poszkodowanych w wypadkach przy pracy

W pierwszej połowie tego roku blisko 40 tys. osób zostało poszkodowanych przy pracy, co oznacza, że średnio 215 osób dziennie ulega tego typu wypadkowi. To więcej niż przed rokiem, ale

Organizacja pracy 0 Comments

Skuteczne triki na poprawę koncentracji

Pamięć pogarsza nam się wskutek zachodzących w naszym organizmie zmian hormonalnych, przemęczenia, stresu, wieku czy czynników zewnętrznych. Powinniśmy codziennie dbać o prawidłowe funkcjonowanie mózgu. Sprawdź, co możesz zrobić, aby pożegnać

0 Comments

Brak komentarzy!

You can be first to comment this post!

Zostaw odpowiedź