Wprowadzenie do narzędzia do etykietowania przykładowego analizy dokumentów
Ta zawartość dotyczy: wersja 2.1.
Napiwek
- Aby uzyskać ulepszone środowisko i zaawansowaną jakość modelu, wypróbuj narzędzie Document Intelligence w wersji 3.0 Studio.
- Program Studio w wersji 3.0 obsługuje dowolny model trenowany z danymi oznaczonymi etykietami w wersji 2.1.
- Szczegółowe informacje na temat migracji z wersji 2.1 do wersji 3.0 można znaleźć w przewodniku migracji interfejsu API.
- Zobacz przewodniki Szybki start dotyczące interfejsu API REST lub języka C#, Java, JavaScript lub Python SDK, aby rozpocząć pracę z wersją 3.0.
Narzędzie do etykietowania przykładowego analizy dokumentów usługi Azure AI to narzędzie typu open source, które umożliwia testowanie najnowszych funkcji usług analizy dokumentów i optycznego rozpoznawania znaków (OCR):
Analizowanie dokumentów przy użyciu interfejsu API układu. Wypróbuj interfejs API układu, aby wyodrębnić tekst, tabele, znaczniki wyboru i strukturę z dokumentów.
Analizowanie dokumentów przy użyciu wstępnie utworzonego modelu. Zacznij od wstępnie utworzonego modelu, aby wyodrębnić dane z faktur, paragonów, dokumentów tożsamości lub wizytówek.
Trenowanie i analizowanie niestandardowego formularza. Użyj modelu niestandardowego, aby wyodrębnić dane z dokumentów specyficznych dla odrębnych danych biznesowych i przypadków użycia.
Wymagania wstępne
Aby rozpocząć pracę, potrzebne są następujące elementy:
Subskrypcja platformy Azure — możesz bezpłatnie utworzyć subskrypcję platformy Azure
Usługi azure AI lub zasób analizy dokumentów. Po utworzeniu subskrypcji platformy Azure utwórz zasób analizy dokumentów z jedną usługą lub wieloma usługami w witrynie Azure Portal, aby uzyskać klucz i punkt końcowy. Możesz użyć warstwy cenowej bezpłatna (
F0
), aby wypróbować usługę, a następnie uaktualnić ją do warstwy płatnej dla środowiska produkcyjnego.Napiwek
Utwórz zasób usług Azure AI, jeśli planujesz uzyskać dostęp do wielu usług azure AI w ramach jednego punktu końcowego/klucza. W przypadku dostępu tylko do analizy dokumentów utwórz zasób analizy dokumentów. Należy pamiętać, że jeśli zamierzasz używać uwierzytelniania firmy Microsoft Entra, potrzebujesz zasobu z jedną usługą.
Tworzenie zasobu analizy dokumentów
Przejdź do witryny Azure Portal i utwórz nowy zasób analizy dokumentów. W okienku Tworzenie podaj następujące informacje:
Szczegóły projektu | opis |
---|---|
Subskrypcja | Wybierz subskrypcję platformy Azure, której udzielono dostępu. |
Grupa zasobów: | Grupa zasobów platformy Azure zawierająca zasób. Możesz utworzyć nową grupę lub dodać ją do istniejącej grupy. |
Region | Lokalizacja zasobu usług Azure AI. Różne lokalizacje mogą powodować opóźnienie, ale nie mają wpływu na dostępność zasobu w czasie wykonywania. |
Nazwa/nazwisko | Opisowa nazwa zasobu. Zalecamy użycie nazwy opisowej, na przykład MyNameFormRecognizer. |
Warstwa cenowa | Koszt zasobu zależy od wybranej warstwy cenowej i użycia. Aby uzyskać więcej informacji, zobacz szczegóły cennika interfejsu API. |
Przeglądanie i tworzenie | Wybierz przycisk Przejrzyj i utwórz, aby wdrożyć zasób w witrynie Azure Portal. |
Pobieranie klucza i punktu końcowego
Po zakończeniu wdrażania zasobu analizy dokumentów znajdź go i wybierz go z listy Wszystkie zasoby w portalu. Klucz i punkt końcowy będą znajdować się na stronie Klucz i punkt końcowy zasobu w obszarze Zarządzanie zasobami. Zapisz oba te elementy w lokalizacji tymczasowej przed kontynuowaniem.
Analizowanie przy użyciu wstępnie utworzonego modelu
Analiza dokumentów oferuje kilka wstępnie utworzonych modeli do wyboru. Każdy model ma własny zestaw obsługiwanych pól. Model do użycia dla Analyze
operacji zależy od typu dokumentu do przeanalizowania. Poniżej przedstawiono wstępnie utworzone modele obecnie obsługiwane przez usługę Analizy dokumentów:
- Faktura: wyodrębnia tekst, znaczniki wyboru, tabele, pary klucz-wartość i kluczowe informacje z faktur.
- Potwierdzenie: wyodrębnia tekst i kluczowe informacje z paragonów.
- Dokument identyfikacyjny: wyodrębnia tekst i kluczowe informacje z licencji kierowców i międzynarodowych paszportów.
- Wizytówka: wyodrębnia tekst i kluczowe informacje z wizytówek.
Przejdź do narzędzia przykładowego analizy dokumentów.
Na stronie głównej przykładowego narzędzia wybierz kafelek Użyj wstępnie utworzonego modelu, aby pobrać dane .
Wybierz typ formularza do przeanalizowania z menu rozwijanego.
Wybierz adres URL pliku, który chcesz przeanalizować z poniższych opcji:
- Przykładowy dokument faktury.
- Przykładowy dokument o identyfikatorze.
- Przykładowy obraz potwierdzenia.
- Przykładowy obraz wizytówki.
W polu Źródło wybierz pozycję Adres URL z menu rozwijanego, wklej wybrany adres URL i wybierz przycisk Pobierz.
W polu Punkt końcowy usługi Analizy dokumentów wklej punkt końcowy uzyskany w ramach subskrypcji analizy dokumentów.
W polu klucza wklej klucz uzyskany z zasobu analizy dokumentów.
Wybierz pozycję Uruchom analizę. Narzędzie do etykietowania przykładowego analizy dokumentów wywołuje interfejs API analizy wstępnie utworzonej i analizuje dokument.
Wyświetl wyniki — zobacz wyodrębnione pary klucz-wartość, elementy wiersza, wyróżniony tekst wyodrębniony i wykryte tabele.
Pobierz plik wyjściowy JSON, aby wyświetlić szczegółowe wyniki.
- Węzeł "readResults" zawiera każdy wiersz tekstu z odpowiednim umieszczeniem pola ograniczenia na stronie.
- W węźle "selectionMarks" jest wyświetlany każdy znacznik zaznaczenia (pole wyboru, znacznik radiowy) oraz czy jego stan to
selected
, czyunselected
. - Sekcja "pageResults" zawiera wyodrębnione tabele. Dla każdej tabeli wyodrębniono tekst, wiersz i indeks kolumn, zakres wierszy i kolumn, pole ograniczenia i nie tylko.
- Pole "documentResults" zawiera informacje o parach klucz/wartość i informacje o elementach wiersza dla najbardziej odpowiednich części dokumentu.
Analizowanie układu
Interfejs API układu analizy dokumentów platformy Azure wyodrębnia tekst, tabele, znaczniki wyboru i informacje o strukturze z dokumentów (PDF, TIFF) i obrazów (JPG, PNG, BMP).
Przejdź do narzędzia przykładowego analizy dokumentów.
Na stronie głównej przykładowego narzędzia wybierz pozycję Użyj układu, aby pobrać tekst, tabele i znaczniki wyboru.
W polu Punkt końcowy usługi Analizy dokumentów wklej punkt końcowy uzyskany w ramach subskrypcji analizy dokumentów.
W polu klucza wklej klucz uzyskany z zasobu analizy dokumentów.
W polu Źródło wybierz pozycję Adres URL z menu rozwijanego, wklej następujący adres URL
https://raw.githubusercontent.com/Azure-Samples/cognitive-services-REST-api-samples/master/curl/form-recognizer/layout-page-001.jpg
i wybierz przycisk Pobierz.Wybierz pozycję Uruchom układ. Narzędzie do etykietowania przykładowego analizy dokumentów wywołuje
Analyze Layout API
element i analizuje dokument.Wyświetl wyniki — zobacz wyodrębniony tekst wyróżniony, wykryte znaczniki zaznaczenia i wykryte tabele.
Pobierz plik wyjściowy JSON, aby wyświetlić szczegółowe wyniki układu.
- Węzeł
readResults
zawiera każdy wiersz tekstu z odpowiednim umieszczeniem pola ograniczenia na stronie. - Węzeł
selectionMarks
pokazuje każdy znacznik zaznaczenia (pole wyboru, znacznik radiowy) i określa, czy jego stan toselected
, czyunselected
. - Sekcja
pageResults
zawiera wyodrębnione tabele. Dla każdej tabeli wyodrębniono tekst, wiersz i indeks kolumn, zakres wierszy i kolumn, pole ograniczenia i nie tylko.
- Węzeł
Trenowanie niestandardowego modelu formularzy
Trenowanie modelu niestandardowego w celu analizowania i wyodrębniania danych z formularzy i dokumentów specyficznych dla Twojej firmy. Interfejs API to program uczenia maszynowego wyszkolony do rozpoznawania pól formularzy w ramach odrębnej zawartości i wyodrębniania par klucz-wartość i danych tabeli. Aby rozpocząć pracę, potrzebujesz co najmniej pięciu przykładów tego samego typu formularza, a model niestandardowy można wytrenować przy użyciu zestawów danych oznaczonych etykietami lub bez ich użycia.
Wymagania wstępne dotyczące trenowania niestandardowego modelu formularzy
Kontener obiektów blob usługi Azure Storage zawierający zestaw danych szkoleniowych. Upewnij się, że wszystkie dokumenty szkoleniowe mają ten sam format. Jeśli masz formularze w wielu formatach, podziel je na podfoldery w oparciu o wspólny format. W tym projekcie możesz użyć naszego przykładowego zestawu danych.
Jeśli nie wiesz, jak utworzyć konto usługi Azure Storage za pomocą kontenera, postępuj zgodnie z przewodnikiem Szybki start usługi Azure Storage w witrynie Azure Portal.
Konfigurowanie mechanizmu CORS
Mechanizm CORS (współużytkowanie zasobów między źródłami) musi być skonfigurowany na koncie usługi Azure Storage, aby był dostępny z poziomu programu Document Intelligence Studio. Aby skonfigurować mechanizm CORS w witrynie Azure Portal, musisz mieć dostęp do karty CORS konta magazynu.
Wybierz kartę CORS dla konta magazynu.
Zacznij od utworzenia nowego wpisu CORS w usłudze Blob Service.
Ustaw wartość Dozwolone źródła na
https://fott-2-1.azurewebsites.net
.Napiwek
Można użyć symbolu wieloznakowego "*", a nie określonej domeny, aby umożliwić wszystkim domenom pochodzenia wykonywanie żądań za pośrednictwem mechanizmu CORS.
Wybierz wszystkie dostępne 8 opcji dla dozwolonych metod.
Zatwierdź wszystkie dozwolone nagłówki i uwidocznione nagłówki, wprowadzając element * w każdym polu.
Ustaw maksymalny wiek na 120 sekund lub dowolną akceptowalną wartość.
Wybierz przycisk Zapisz w górnej części strony i zapisz zmiany.
Korzystanie z narzędzia do etykietowania przykładowego
Przejdź do narzędzia przykładowego analizy dokumentów.
Na przykładowej stronie głównej narzędzia wybierz pozycję Użyj formularza niestandardowego, aby wytrenować model z etykietami i pobrać pary klucz-wartość.
Wybierz pozycję Nowy projekt
Tworzenie nowego projektu
Skonfiguruj pola Ustawienia projektu z następującymi wartościami:
Wyświetlana nazwa. Nadaj projektowi nazwę.
Token zabezpieczający. Każdy projekt automatycznie ocenia token zabezpieczający, który może służyć do szyfrowania/odszyfrowywania poufnych ustawień projektu. Tokeny zabezpieczające można znaleźć w obszarze Ustawienia aplikacji, wybierając ikonę koła zębatego w dolnej części lewego paska nawigacyjnego.
Połączenie źródłowe. Narzędzie Przykładowe etykietowanie łączy się ze źródłem (oryginalnymi przekazanymi formularzami) i elementem docelowym (utworzone etykiety i dane wyjściowe). Połączenia można konfigurować i udostępniać w projektach. Używają one rozszerzalnego modelu dostawcy, dzięki czemu można łatwo dodawać nowych dostawców źródłowych/docelowych.
- Utwórz nowe połączenie. Wybierz przycisk Dodaj połączenie. Wypełnij pola następującymi wartościami:
- Wyświetlana nazwa. Nazwij połączenie.
- Opis. Dodaj krótki opis.
- Adres URL sygnatury dostępu współdzielonego. Wklej adres URL sygnatury dostępu współdzielonego (SAS) dla kontenera usługi Azure Blob Storage.
Aby pobrać adres URL sygnatury dostępu współdzielonego dla danych trenowania modelu niestandardowego, przejdź do zasobu magazynu w witrynie Azure Portal i wybierz kartę Eksplorator usługi Storage. Przejdź do kontenera, kliknij prawym przyciskiem myszy i wybierz pozycję Pobierz sygnaturę dostępu współdzielonego. Ważne jest, aby uzyskać sygnaturę dostępu współdzielonego dla kontenera, a nie dla samego konta magazynu. Upewnij się, że zaznaczono uprawnienia Odczyt, Zapis, Usuwanie i Lista , a następnie wybierz pozycję Utwórz. Następnie skopiuj wartość w sekcji Adres URL do lokalizacji tymczasowej. Powinna ona mieć postać:
https://<storage account>.blob.core.windows.net/<container name>?<SAS value>
.
Ścieżka folderu (opcjonalnie). Jeśli formularze źródłowe znajdują się w folderze w kontenerze obiektów blob, określ nazwę folderu.
Identyfikator URI usługi Document Intelligence Service — adres URL punktu końcowego analizy dokumentów.
Klucz. Klucz analizy dokumentów.
Wersja interfejsu API. Zachowaj wartość v2.1 (domyślna).
Opis (opcjonalnie). Opisz projekt.
Etykietowanie formularzy
Po utworzeniu lub otwarciu projektu zostanie otwarte okno edytora tagów głównych. Edytor tagów składa się z trzech części:
- Okienko podglądu z możliwością zmiany rozmiaru zawierające przewijaną listę formularzy z połączenia źródłowego.
- Okienko edytora głównego, które umożliwia stosowanie tagów.
- Okienko edytora tagów umożliwiające użytkownikom modyfikowanie, blokowanie, zmienianie kolejności i usuwanie tagów.
Identyfikowanie tekstu i tabel
Wybierz pozycję Uruchom układ dla nienadzorowanych dokumentów w okienku po lewej stronie, aby uzyskać informacje o tekście i układzie tabeli dla każdego dokumentu. Narzędzie etykietowania rysuje pola ograniczenia wokół każdego elementu tekstowego.
Narzędzie etykietowania pokazuje również, które tabele zostały wyodrębnione automatycznie. Wybierz ikonę tabeli/siatki po lewej stronie dokumentu i zobacz wyodrębnionej tabeli. Ponieważ zawartość tabeli jest automatycznie wyodrębniona, nie oznaczamy zawartości tabeli, ale raczej polegamy na automatycznym wyodrębnieniu.
Stosowanie etykiet do tekstu
Następnie utworzysz tagi (etykiety) i zastosujesz je do elementów tekstowych, które mają być analizowane przez model. Zwróć uwagę, że zestaw danych przykładowej etykiety zawiera już oznaczone pola; Dodamy kolejne pole.
Użyj okienka edytora tagów, aby utworzyć nowy tag, który chcesz zidentyfikować:
Wybierz + znak plus, aby utworzyć nowy tag.
Wprowadź nazwę tagu "Total".
Wybierz Enter, aby zapisać tag.
W edytorze głównym wybierz łączną wartość z wyróżnionych elementów tekstowych.
Wybierz tag Total ,aby zastosować wartość, lub naciśnij odpowiedni klawiatury. Klucze liczbowe są przypisywane jako klucze dostępu dla pierwszych 10 tagów. Tagi można zmienić za pomocą ikon strzałek w górę i w dół w okienku edytora tagów. Wykonaj następujące kroki, aby oznaczyć wszystkie pięć formularzy w przykładowym zestawie danych:
Napiwek
Podczas etykietowania formularzy pamiętaj o następujących wskazówkach:
Do każdego zaznaczonego elementu tekstowego można zastosować tylko jeden tag.
Każdy tag można stosować tylko raz na stronę. Jeśli wartość jest wyświetlana wiele razy w tym samym formularzu, utwórz różne tagi dla każdego wystąpienia. Na przykład: "invoice# 1", "invoice# 2" itd.
Tagi nie mogą obejmować między stronami.
Etykiety wartości wyświetlane w formularzu; Nie próbuj dzielić wartości na dwie części z dwoma różnymi tagami. Na przykład pole adresu powinno być oznaczone pojedynczym tagiem, nawet jeśli obejmuje wiele wierszy.
Nie dołączaj kluczy do otagowanych pól — tylko wartości.
Dane tabeli powinny być wykrywane automatycznie i będą dostępne w ostatnim wyjściowym pliku JSON w sekcji "pageResults". Jeśli jednak model nie wykryje wszystkich danych tabeli, możesz również oznaczyć i wytrenować model do wykrywania tabel, zobacz Trenowanie modelu niestandardowego | Etykietowanie formularzy
Użyj przycisków z prawej strony, + aby wyszukać, zmienić nazwę, zmienić kolejność i usunąć tagi.
Aby usunąć zastosowany tag bez usuwania samego tagu, zaznacz prostokąt oznakowany w widoku dokumentu i naciśnij delete.
Trenowanie modelu niestandardowego
Wybierz ikonę Trenowanie w okienku po lewej stronie i otwórz stronę Trenowanie. Następnie wybierz przycisk Trenuj, aby rozpocząć trenowanie modelu. Po zakończeniu procesu trenowania zobaczysz następujące informacje:
Identyfikator modelu — identyfikator modelu, który został utworzony i wytrenowany. Każde wywołanie trenowania tworzy nowy model z własnym identyfikatorem. Skopiuj ten ciąg do bezpiecznej lokalizacji; potrzebujesz go, jeśli chcesz wykonywać wywołania przewidywania za pośrednictwem interfejsu API REST lub biblioteki klienta.
Średnia dokładność — średnia dokładność modelu. Dokładność modelu można poprawić przez etykietowanie większej liczby formularzy i ponowne trenowanie w celu utworzenia nowego modelu. Zalecamy rozpoczęcie od etykietowania pięciu formularzy analizujących i testujących wyniki, a następnie w razie potrzeby dodając więcej formularzy zgodnie z potrzebami.
Lista tagów i szacowana dokładność na tag. Aby uzyskać więcej informacji, zobacz Interpretowanie i zwiększanie dokładności i pewności.
Analizowanie formularza niestandardowego
Wybierz ikonę
Analyze
na pasku nawigacyjnym i przetestuj model.Wybierz źródłowy plik lokalny i wyszukaj plik do wybrania z przykładowego zestawu danych, który został rozpakowany w folderze testowym.
Wybierz przycisk Uruchom analizę, aby pobrać pary klucz/wartość, tekst i tabele przewidywania dla formularza. Narzędzie stosuje tagi w polach ograniczenia i zgłasza pewność każdego tagu.
I już! Pokazano, jak używać przykładowego narzędzia analizy dokumentów dla wstępnie utworzonych, układów i modeli niestandardowych analizy dokumentów. Przedstawiono również analizę formularza niestandardowego z ręcznie oznaczonymi danymi.