OCR AI – Instalacja

Facebooktwitterpinterestlinkedinmail

dotyczy wersji: 8.2.x; autor: Filip Jawień

OCR AI – Proces Instalacji

Wersja 8.2 systemu WEBCON BPS od strony technologicznej, wprowadza ogromną zmianę w zakresie rozpoznawania i automatycznego rejestrowania dokumentów. Zupełnie nowy, autorski mechanizm został zbudowany w oparciu o sieci neuronowe.

Podstawowym scenariuszem zastosowania mechanizmu jest rozpoznawanie informacji zawartych na otrzymywanych przez firmę dokumentach w celu przeniesienia ich do elektronicznego formularza WEBCON BPS. Współpracując z silnikiem OCR, system zamienia skanowane obrazy na tekst, po czym korzystając z sieci neuronowej rozpoznaje poszczególne dane nagłówkowe dokumentu.

Wymagane komponenty do instalacji:

  • WEBCON BPS w wersji 8.2
  • ABBYY FineReader 11 z aktywną licencją – komponent odpowiedzialny za generowanie warstwy tekstowej. Do poprawnego działania komponentu wartwa tekstowa musi być wygenerowana przez oprogramowanie ABBYY FindReader 11
  • Projekt OCR AI dostarczony przez WEBCON – komponent odpowiedzialny za rozpoznawanie tekstu i umieszczanie w uprzednio skonfigurowanych atrybutach

Instalacja

Do poprawnej instalacji wymagany jest folder z plikami instalacyjnymi dla ABBYY FineReader 11. Pliki instalacyjne należy umieścić w folderze zawierającym instalator WEBCON BPS w podfolderze o nazwie ABBYY

ocr1

ocr2

Po uruchomieniu instalatora należy wybrać zaawansowaną instalację WEBCON Business Process Suite, wybrać do instalacji odpowiednie elementy WEBCON BPS i dodatkowo komponent ABBYY FineReader Engine 11.0.

ocr3

Gdy wszystkie elementy WEBCON BPS zostaną zainstalowane, na ekranie pojawi się okno umożliwiające konfiguracje parametrów instalacji ABBYY FineReader 11.

Do poprawnej instalacji komponentu FineReader 11 wymagane jest podanie klucza produktu.

Istnieją dwa rodzaje klucza:

  • Stand–alone – klucz USB, który musi być wpięty do maszyny, na której zostanie zainstalowany komponent FineReader. Klucz może obsłużyć tylko jeden serwis przetwarzający pliki.
  • Licencja sieciowa – klucz USB musi być wpięty do serwera licencji. Może obsłużyć większą liczbę serwisów.

ocr4

W zakładce: „Główne parametry instalacji” należy podać numer aktywnego klucza produktu, a także ścieżkę instalacji na dysku komputera.

Aby korzystać z pełnej funkcjonalności instalacji, należy także zaznaczyć pola: „Instaluj serwer licencji” i „Instaluj sterowniki klucza”.

Pole „Użyj licencji sieciowej” należy zaznaczyć tylko, jeżeli używany jest klucz sieciowy. Po zaznaczeniu tego pola, umożliwione zostanie wpisanie nazwy serwera licencji.

Jeżeli wszystkie pola zostały poprawnie wypełnione, należy wcisnąć przycisk OK, aby rozpocząć proces instalacji.

Podczas instalacji program poprosi o nadanie uprawnień do FineReader 11, zgoda na nadanie uprawnień otworzy aplikacje DCOM gdzie uprawnienia należy nadać (co najmniej) użytkownikowi na którym postawiony jest serwis. Jest to konieczne do poprawnej współpracy między WEBCON BPS a FineReader 11.

Licencja powinna się aktywować automatycznie, jeżeli jednak pojawi się potrzeba ręcznego zarządzania kluczami licencji FineReader 11:

Aktywacja klucza

Po zakończeniu instalacji należy przejść do folderu w którym został zainstalowany FineReader 11:

C:\Program Files\FineReader 11\Bin64

Następnie należy uruchomić aplikacje LicenseManager

4

Po uruchomieniu aplikacji należy sprawdzić czy zainstalowana licencja jest aktywna. Jeśli żadna aktywna licencja nie jest widoczna, należy ją aktywować wybierając przycisk „Activate license…”

2

 

Należy wybrać sposób aktywacji i ponownie wprowadzić numer klucza, wcześniej podawany podczas instalacji. Jeśli podany klucz jest prawidłowy, aktywna licencja powinna zostać wyświetlona w oknie License Manager’a.

3

Konfiguracja systemu WEBCON BPS do współpracy z FineReader 11.

Po poprawnej instalacji, aby oprogramowanie FineReader 11 poprawnie współpracowało z WEBCON BPS należy przejść do konfiguracji serwisów i wybrać komponent OCR – FineReader.

ocr5

Następnie należy przejść do konfiguracji wybranego serwisu i zaznaczyć rolę OCR AI

ocr6

W zakładce konfiguracja można także ustawić ilość wątków dla poszczególnych funkcji OCR. Dla najefektywniejszego działania, zalecane jest ustawienie wątków na ilość o jeden większą niż liczba rdzeni procesora.

ocr7

Dla wykorzystania pełnej funkcjonalności komponentu OCR AI, należy dodać w systemie projekt OCR AI. W tym celu należy przejść do zakładki Projekty OCR AI i wybrać dostarczony folder zawierający projekt.

Projekt OCR AI jest to komponent odpowiedzialny za rozpoznawanie pól dokumentu. Jest to rodzaj szablonu, który wskazuje systemowi, w których miejscach dokumentu należy szukać wybranych pól.

W celu rozpoznawania dokumentów innych niż faktury, należy stworzyć osobny projekt OCR AI. Obecnie, aby stworzyć nowy osobny projekt OCR AI, należy skontaktować się z firmą WEBCON.

ocr8

 

Gdy projekt zostanie wczytany, należy kliknąć Zapisz. Po pomyślnym zapisie, system jest w pełni gotowy do przetwarzania plików za pomocą OCR AI.

Konfiguracja przykładowego obiegu

ocr9

Przykładowy proces składa się z 7 kroków:

  • Rejestracja – Krok startowy, służy do wypełnienia podstawowych, wymaganych atrybutów i dodaniu załączników, które zostaną przetworzone.
  • Oczekiwanie na warstwę tekstową – krok systemowy, oczekuje na przetworzenie plików (dodanie warstwy tekstowej) przez komponent FineReader. Po zakończeniu przetwarzania, obieg zostanie automatycznie przeniesiony do następnego kroku.
  • Oczekiwanie na rozpoznanie NIP – krok systemowy, oczekuje na przetworzenie plików przez komponent OCR AI. W tym wypadku wyszukiwany jest jedynie wyróżnik, tu – ustawiony na atrybut: NIP kontrahenta, który później, już w następnym kroku, umożliwi wybranie odpowiedniego projektu OCR AI dla przetwarzania pozostałych pól. Po zakończeniu przetwarzania, obieg zostanie automatycznie przeniesiony do następnego kroku.
  • Oczekiwanie na rozpoznanie OCR AI – krok systemowy, oczekuje na przetworzenie plików przez komponent OCR AI. Po zakończeniu przetwarzania, obieg zostanie automatycznie przeniesiony do następnego kroku.
  • Weryfikacja – krok weryfikacji OCR, pozwalający na zweryfikowanie wyników przedstawionych przez akcję rozpoznania OCR AI.
  • Oczekiwanie na naukę – krok systemowy, oczekujący na zakończenie nauczania sieci. Po zakończeniu przetwarzania, obieg zostanie automatycznie przeniesiony do następnego kroku.
  • Archiwum – krok końcowy pozytywny.

Akcje

 

Akcja generowania warstwy tekstowej

 

Akcja dodająca pliki do kolejki „generowanie warstwy tekstowej”. W przykładowej konfiguracji akcja pobiera do przetwarzania wszystkie pliki formatu: pdf, jpg lub tiff, które zostaną dołączone do obiegu i po wygenerowaniu warstwy tekstowej, nadpisze pierwotne pliki.

ocr10

W akcji można skonfigurować, dla których plików zostanie wygenerowania warstwa tekstowa. System może je wybierać na podstawie ich typu, kategorii do jakiej zostały dodane lub na podstawie wyrażenia regularnego.

Po wygenerowaniu warstwy tekstowej akcja może nadpisywać pliki, tworzyć nową ich wersję lub tworzyć zupełnie nowy plik, dla którego można skonfigurować nazwę, opis i kategorię, do której zostaną dodane.

Akcja pozwala na ustawienie priorytetu, z jakim pliki trafiają do kolejki, w zakresie od 1 do 10, gdzie pliki z priorytetem 1 będą przetwarzane jako pierwsze. Po zaznaczeniu opcji „Nocny OCR” priorytet zostanie automatycznie ustawiony na 11. Pliki z priorytetem 11 będą przetwarzane tylko w godzinach nocnych, które można skonfigurować w konfiguracji serwisów w gałęzi „Harmonogramy”.

Akcja rozpoznania NIP’u kontrahenta

 

Akcja rozpoznaje NIP kontrahenta, który będzie wyróżnikiem dla akcji rozpoznania OCR dla pozostałych pól, dostępnej w kolejnym kroku. Dzięki rozpoznaniu wyróżnika, akcja OCR AI będzie wiedziała czy i ewentualnie jakiego projektu OCR AI użyć w celu jak najlepszego rozpoznania plików.

W konfiguracji tej akcji pole wyróżnika zostaje puste, gdyż ten jest rozpoznawany przez jeden, dedykowany mu projekt.

Należy zmapować pole do wybranego atrybutu. Zaznaczenie pola NIP powoduje, że z numeru NIP zostaną usunięte wszelkie znaki, które nie są liczbami.

ocr11

W obiegu występują dwie bliźniacze akcje. Pierwsza prowadząca z korku oczekiwania na warstwę tekstową do kroku rozpoznania OCR AI i druga, używana do powtórnego rozpoznania, po pomyślnym zakończeniu nauki, prowadząca z kroku oczekiwania na naukę do kroku oczekiwania na rozpoznanie OCR AI.

Akcja rozpoznania OCR AI

 

Akcja rozpoznająca pozostałe pola projektu. W tej akcji wyróżnikiem jest ustawiony NIP sprzedającego, który został rozpoznany w poprzedniej akcji – rozpoznanie NIP. Na podstawie jego wartości, system wybierze odpowiednią sieć dedykowaną, lub w przypadku braku odpowiadającej sieci, użyje szablonu uniwersalnego.

ocr12

W tym wypadku należy wybrać pełny projekt OCR AI i dla niego zmapować odpowiednie atrybuty. Należy pominąć mapowanie dla wcześniej rozpoznanego pola NIP sprzedającego, gdyż jest ono już rozpoznane.

Akcje nauki OCR

ocr13

W przykładowym obiegu znajdują się 4 akcje nauki OCR.

  1. Douczanie – akcja doucza sieć, która została użyta do rozpoznania plików. Douczanie powoduje, że dotychczasowa sieć nie powinna ulec poważnym zmianom, gdyż akcja jedynie dodaje nowe informacje do aktualnej siec.
  2. Ponowne nauczanie – akcja ponownie naucza sieć. Akcja ponownego nauczania tworzy sieć od nowa. Używanie tej akcji jest niezalecane dla, przykładowo: szablonu uniwersalnego, który został nauczony dużą liczbą faktur. Ponowne nauczanie małą liczbą faktur może pogorszyć efekty rozpoznania.
  3. Tworzenie sieci dedykowanej – akcja tworzy sieć dedykowaną dla rozpoznanego wyróżnika. Opcja ta jest polecana w przypadku faktur o niestandardowym szablonie, dla których efekty rozpoznania szablonem uniwersalnym są niesatysfakcjonujące.
  4. Douczanie NIP – akcja doucza jedynie sieć użytą do rozpoznania wyróżnika – pola NIP sprzedającego.

Każda z akcji nauczania jest akcją na ścieżce. Żeby wybrać tryb nauki, należy przejść ścieżką ze skonfigurowaną odpowiednią akcją.

Krok weryfikacji OCR

 

Krok weryfikacji OCR służy weryfikowaniu danych rozpoznanych przez OCR AI i ewentualnej korekcie błędnie rozpoznanych danych

Aby skorzystać z funkcjonalności kroku weryfikacji OCR, należy przejść do konfiguracji kroku, a następnie w zakładce Ogólne, przejść do okna Właściwości i zaznaczyć pole „Krok weryfikacji OCR”

ocr14

Tryb weryfikacji OCR jest dostępny jedynie wtedy, gdy dokument został przetworzony przez komponent OCR AI. W przypadku, gdy rozpoznanie OCR AI zostanie pominięte, tryb weryfikacji OCR nie będzie dostępny.

Formularz weryfikacji OCR

Dla trybu weryfikacji OCR widok atrybutu jest rozszerzony o podgląd fragmentu tekstu, jaki został rozpoznany, oraz o pola pozwalające na wybranie czy sieć ma być nauczana nową wartością tego pola.ocr15

Poprzez kliknięcie na podgląd rozpoznanego fragmentu tekstu, podgląd automatycznie przybliży rozpoznany fragment tekstu i zaznaczy go czerwoną ramką. Taki widok pozwala dokładniej określić, czy wpisany tekst jest rzeczywiście poprawną wartością.

ocr16

Korekta rozpoznanych danych

 

Jeżeli system nie znajdzie odpowiedniego fragmentu tekstu, bądź odnajdzie nieprawidłowy fragment, istnieje możliwość skorygowania takich wartości.

Aby wprowadzić korektę, należy kliknąć na żądany wyraz. Po kliknięciu w tekst, zostanie on automatycznie wpisany do ostatnio zaznaczonego atrybutu.

ocr17

Po korekcie wprowadzonych danych, można zaznaczyć pola, którymi uzytkownik chce poprawić wyniki rozpoznania poprzez skorzystanie z akcji nauczania OCR.

ocr18

Po wprowadzeniu nowych danych, system umożliwi zaznaczenie pól, dla których użytkownik chce poprawić rozpoznanie korzystając z akcji nauczania OCR.

 

Po zakończeniu konfiguracji, system jest gotowy do pełnej obsługi komponentu OCR AI.