Udostępnij za pośrednictwem


Wprowadzenie do narzędzia do etykietowania przykładowego analizy dokumentów

Ta zawartość dotyczy:Znacznik wyboru Analiza dokumentów w wersji 2.1v2.1.

Napiwek

  • Aby uzyskać ulepszone środowisko i zaawansowaną jakość modelu, wypróbuj narzędzie Document Intelligence w wersji 3.0 Studio.
  • Program Studio w wersji 3.0 obsługuje dowolny model trenowany z danymi oznaczonymi etykietami w wersji 2.1.
  • Szczegółowe informacje na temat migracji z wersji 2.1 do wersji 3.0 można znaleźć w przewodniku migracji interfejsu API.
  • Zobacz przewodniki Szybki start dotyczące interfejsu API REST lub języka C#, Java, JavaScript lub Python SDK, aby rozpocząć pracę z wersją 3.0.

Narzędzie do etykietowania przykładowego analizy dokumentów usługi Azure AI to narzędzie typu open source, które umożliwia testowanie najnowszych funkcji usług analizy dokumentów i optycznego rozpoznawania znaków (OCR):

Wymagania wstępne

Aby rozpocząć pracę, potrzebne są następujące elementy:

  • Subskrypcja platformy Azure — możesz bezpłatnie utworzyć subskrypcję platformy Azure

  • Usługi azure AI lub zasób analizy dokumentów. Po utworzeniu subskrypcji platformy Azure utwórz zasób analizy dokumentów z jedną usługą lub wieloma usługami w witrynie Azure Portal, aby uzyskać klucz i punkt końcowy. Możesz użyć warstwy cenowej bezpłatna (F0), aby wypróbować usługę, a następnie uaktualnić ją do warstwy płatnej dla środowiska produkcyjnego.

    Napiwek

    Utwórz zasób usług Azure AI, jeśli planujesz uzyskać dostęp do wielu usług azure AI w ramach jednego punktu końcowego/klucza. W przypadku dostępu tylko do analizy dokumentów utwórz zasób analizy dokumentów. Należy pamiętać, że jeśli zamierzasz używać uwierzytelniania firmy Microsoft Entra, potrzebujesz zasobu z jedną usługą.

Tworzenie zasobu analizy dokumentów

Przejdź do witryny Azure Portal i utwórz nowy zasób analizy dokumentów. W okienku Tworzenie podaj następujące informacje:

Szczegóły projektu opis
Subskrypcja Wybierz subskrypcję platformy Azure, której udzielono dostępu.
Grupa zasobów: Grupa zasobów platformy Azure zawierająca zasób. Możesz utworzyć nową grupę lub dodać ją do istniejącej grupy.
Region Lokalizacja zasobu usług Azure AI. Różne lokalizacje mogą powodować opóźnienie, ale nie mają wpływu na dostępność zasobu w czasie wykonywania.
Nazwa/nazwisko Opisowa nazwa zasobu. Zalecamy użycie nazwy opisowej, na przykład MyNameFormRecognizer.
Warstwa cenowa Koszt zasobu zależy od wybranej warstwy cenowej i użycia. Aby uzyskać więcej informacji, zobacz szczegóły cennika interfejsu API.
Przeglądanie i tworzenie Wybierz przycisk Przejrzyj i utwórz, aby wdrożyć zasób w witrynie Azure Portal.

Pobieranie klucza i punktu końcowego

Po zakończeniu wdrażania zasobu analizy dokumentów znajdź go i wybierz go z listy Wszystkie zasoby w portalu. Klucz i punkt końcowy będą znajdować się na stronie Klucz i punkt końcowy zasobu w obszarze Zarządzanie zasobami. Zapisz oba te elementy w lokalizacji tymczasowej przed kontynuowaniem.

Zrzut ekranu przedstawiający klucze i lokalizację punktu końcowego w witrynie Azure Portal.

Analizowanie przy użyciu wstępnie utworzonego modelu

Analiza dokumentów oferuje kilka wstępnie utworzonych modeli do wyboru. Każdy model ma własny zestaw obsługiwanych pól. Model do użycia dla Analyze operacji zależy od typu dokumentu do przeanalizowania. Poniżej przedstawiono wstępnie utworzone modele obecnie obsługiwane przez usługę Analizy dokumentów:

  • Faktura: wyodrębnia tekst, znaczniki wyboru, tabele, pary klucz-wartość i kluczowe informacje z faktur.
  • Potwierdzenie: wyodrębnia tekst i kluczowe informacje z paragonów.
  • Dokument identyfikacyjny: wyodrębnia tekst i kluczowe informacje z licencji kierowców i międzynarodowych paszportów.
  • Wizytówka: wyodrębnia tekst i kluczowe informacje z wizytówek.
  1. Przejdź do narzędzia przykładowego analizy dokumentów.

  2. Na stronie głównej przykładowego narzędzia wybierz kafelek Użyj wstępnie utworzonego modelu, aby pobrać dane .

    Zrzut ekranu przedstawiający operację analizowania wyników w modelu układu.

  3. Wybierz typ formularza do przeanalizowania z menu rozwijanego.

  4. Wybierz adres URL pliku, który chcesz przeanalizować z poniższych opcji:

  5. W polu Źródło wybierz pozycję Adres URL z menu rozwijanego, wklej wybrany adres URL i wybierz przycisk Pobierz.

    Zrzut ekranu przedstawiający menu rozwijane lokalizacji źródłowej.

  6. W polu Punkt końcowy usługi Analizy dokumentów wklej punkt końcowy uzyskany w ramach subskrypcji analizy dokumentów.

  7. W polu klucza wklej klucz uzyskany z zasobu analizy dokumentów.

    Zrzut ekranu przedstawiający menu rozwijane

  8. Wybierz pozycję Uruchom analizę. Narzędzie do etykietowania przykładowego analizy dokumentów wywołuje interfejs API analizy wstępnie utworzonej i analizuje dokument.

  9. Wyświetl wyniki — zobacz wyodrębnione pary klucz-wartość, elementy wiersza, wyróżniony tekst wyodrębniony i wykryte tabele.

    Analizowanie wyników modelu faktury analizy dokumentów

  10. Pobierz plik wyjściowy JSON, aby wyświetlić szczegółowe wyniki.

    • Węzeł "readResults" zawiera każdy wiersz tekstu z odpowiednim umieszczeniem pola ograniczenia na stronie.
    • W węźle "selectionMarks" jest wyświetlany każdy znacznik zaznaczenia (pole wyboru, znacznik radiowy) oraz czy jego stan to selected , czy unselected.
    • Sekcja "pageResults" zawiera wyodrębnione tabele. Dla każdej tabeli wyodrębniono tekst, wiersz i indeks kolumn, zakres wierszy i kolumn, pole ograniczenia i nie tylko.
    • Pole "documentResults" zawiera informacje o parach klucz/wartość i informacje o elementach wiersza dla najbardziej odpowiednich części dokumentu.

Analizowanie układu

Interfejs API układu analizy dokumentów platformy Azure wyodrębnia tekst, tabele, znaczniki wyboru i informacje o strukturze z dokumentów (PDF, TIFF) i obrazów (JPG, PNG, BMP).

  1. Przejdź do narzędzia przykładowego analizy dokumentów.

  2. Na stronie głównej przykładowego narzędzia wybierz pozycję Użyj układu, aby pobrać tekst, tabele i znaczniki wyboru.

    ustawienia Połączenie ion dla narzędzia Do analizy dokumentów układu.

  3. W polu Punkt końcowy usługi Analizy dokumentów wklej punkt końcowy uzyskany w ramach subskrypcji analizy dokumentów.

  4. W polu klucza wklej klucz uzyskany z zasobu analizy dokumentów.

  5. W polu Źródło wybierz pozycję Adres URL z menu rozwijanego, wklej następujący adres URLhttps://raw.githubusercontent.com/Azure-Samples/cognitive-services-REST-api-samples/master/curl/form-recognizer/layout-page-001.jpgi wybierz przycisk Pobierz.

  6. Wybierz pozycję Uruchom układ. Narzędzie do etykietowania przykładowego analizy dokumentów wywołuje Analyze Layout API element i analizuje dokument.

    Zrzut ekranu przedstawiający menu rozwijane układu.

  7. Wyświetl wyniki — zobacz wyodrębniony tekst wyróżniony, wykryte znaczniki zaznaczenia i wykryte tabele.

    ustawienia Połączenie ion narzędzia do analizy dokumentów.

  8. Pobierz plik wyjściowy JSON, aby wyświetlić szczegółowe wyniki układu.

    • Węzeł readResults zawiera każdy wiersz tekstu z odpowiednim umieszczeniem pola ograniczenia na stronie.
    • Węzeł selectionMarks pokazuje każdy znacznik zaznaczenia (pole wyboru, znacznik radiowy) i określa, czy jego stan to selected , czy unselected.
    • Sekcja pageResults zawiera wyodrębnione tabele. Dla każdej tabeli wyodrębniono tekst, wiersz i indeks kolumn, zakres wierszy i kolumn, pole ograniczenia i nie tylko.

Trenowanie niestandardowego modelu formularzy

Trenowanie modelu niestandardowego w celu analizowania i wyodrębniania danych z formularzy i dokumentów specyficznych dla Twojej firmy. Interfejs API to program uczenia maszynowego wyszkolony do rozpoznawania pól formularzy w ramach odrębnej zawartości i wyodrębniania par klucz-wartość i danych tabeli. Aby rozpocząć pracę, potrzebujesz co najmniej pięciu przykładów tego samego typu formularza, a model niestandardowy można wytrenować przy użyciu zestawów danych oznaczonych etykietami lub bez ich użycia.

Wymagania wstępne dotyczące trenowania niestandardowego modelu formularzy

  • Kontener obiektów blob usługi Azure Storage zawierający zestaw danych szkoleniowych. Upewnij się, że wszystkie dokumenty szkoleniowe mają ten sam format. Jeśli masz formularze w wielu formatach, podziel je na podfoldery w oparciu o wspólny format. W tym projekcie możesz użyć naszego przykładowego zestawu danych.

  • Jeśli nie wiesz, jak utworzyć konto usługi Azure Storage za pomocą kontenera, postępuj zgodnie z przewodnikiem Szybki start usługi Azure Storage w witrynie Azure Portal.

  • Konfigurowanie mechanizmu CORS

    Mechanizm CORS (współużytkowanie zasobów między źródłami) musi być skonfigurowany na koncie usługi Azure Storage, aby był dostępny z poziomu programu Document Intelligence Studio. Aby skonfigurować mechanizm CORS w witrynie Azure Portal, musisz mieć dostęp do karty CORS konta magazynu.

    1. Wybierz kartę CORS dla konta magazynu.

      Zrzut ekranu przedstawiający menu ustawień mechanizmu CORS w witrynie Azure Portal.

    2. Zacznij od utworzenia nowego wpisu CORS w usłudze Blob Service.

    3. Ustaw wartość Dozwolone źródła na https://fott-2-1.azurewebsites.net.

      Zrzut ekranu przedstawiający konfigurację mechanizmu CORS dla konta magazynu.

      Napiwek

      Można użyć symbolu wieloznakowego "*", a nie określonej domeny, aby umożliwić wszystkim domenom pochodzenia wykonywanie żądań za pośrednictwem mechanizmu CORS.

    4. Wybierz wszystkie dostępne 8 opcji dla dozwolonych metod.

    5. Zatwierdź wszystkie dozwolone nagłówki i uwidocznione nagłówki, wprowadzając element * w każdym polu.

    6. Ustaw maksymalny wiek na 120 sekund lub dowolną akceptowalną wartość.

    7. Wybierz przycisk Zapisz w górnej części strony i zapisz zmiany.

Korzystanie z narzędzia do etykietowania przykładowego

  1. Przejdź do narzędzia przykładowego analizy dokumentów.

  2. Na przykładowej stronie głównej narzędzia wybierz pozycję Użyj formularza niestandardowego, aby wytrenować model z etykietami i pobrać pary klucz-wartość.

    Trenowanie modelu niestandardowego.

  3. Wybierz pozycję Nowy projekt

    Zrzut ekranu przedstawiający wybieranie nowego monitu o projekt.

Tworzenie nowego projektu

Skonfiguruj pola project Ustawienia z następującymi wartościami:

  1. Wyświetlana nazwa. Nadaj projektowi nazwę.

  2. Token zabezpieczający. Każdy projekt automatycznie ocenia token zabezpieczający, który może służyć do szyfrowania/odszyfrowywania poufnych ustawień projektu. Tokeny zabezpieczające można znaleźć w aplikacji Ustawienia, wybierając ikonę koła zębatego w dolnej części lewego paska nawigacyjnego.

  3. Połączenie źródłowe. Narzędzie Przykładowe etykietowanie łączy się ze źródłem (oryginalnymi przekazanymi formularzami) i elementem docelowym (utworzone etykiety i dane wyjściowe). Połączenie ions można konfigurować i udostępniać między projektami. Używają one rozszerzalnego modelu dostawcy, dzięki czemu można łatwo dodawać nowych dostawców źródłowych/docelowych.

    • Utwórz nowe połączenie, wybierz przycisk Dodaj Połączenie ion. Wypełnij pola następującymi wartościami:
    • Wyświetlana nazwa. Nazwij połączenie.
    • Opis. Dodaj krótki opis.
    • Adres URL sygnatury dostępu współdzielonego. Wklej adres URL sygnatury dostępu współdzielonego (SAS) dla kontenera usługi Azure Blob Storage.
    • Aby pobrać adres URL sygnatury dostępu współdzielonego dla danych trenowania modelu niestandardowego, przejdź do zasobu magazynu w witrynie Azure Portal i wybierz kartę Eksplorator usługi Storage. Przejdź do kontenera, kliknij prawym przyciskiem myszy i wybierz pozycję Pobierz sygnaturę dostępu współdzielonego. Ważne jest, aby uzyskać sygnaturę dostępu współdzielonego dla kontenera, a nie dla samego konta magazynu. Upewnij się, że zaznaczono uprawnienia Odczyt, Zapis, Usuwanie i Lista , a następnie wybierz pozycję Utwórz. Następnie skopiuj wartość w sekcji Adres URL do lokalizacji tymczasowej. Powinna ona mieć postać: https://<storage account>.blob.core.windows.net/<container name>?<SAS value>.

      Lokalizacja sygnatury dostępu współdzielonego.

  4. Ścieżka folderu (opcjonalnie). Jeśli formularze źródłowe znajdują się w folderze w kontenerze obiektów blob, określ nazwę folderu.

  5. Identyfikator URI usługi Document Intelligence Service — adres URL punktu końcowego analizy dokumentów.

  6. Klucz. Klucz analizy dokumentów.

  7. Wersja interfejsu API. Zachowaj wartość v2.1 (domyślna).

  8. Opis (opcjonalnie). Opisz projekt.

    Ustawienia połączenia

Etykietowanie formularzy

Nowa strona projektu

Po utworzeniu lub otwarciu projektu zostanie otwarte okno edytora tagów głównych. Edytor tagów składa się z trzech części:

  • Okienko podglądu z możliwością zmiany rozmiaru zawierające przewijaną listę formularzy z połączenia źródłowego.
  • Okienko edytora głównego, które umożliwia stosowanie tagów.
  • Okienko edytora tagów umożliwiające użytkownikom modyfikowanie, blokowanie, zmienianie kolejności i usuwanie tagów.
Identyfikowanie tekstu i tabel

Wybierz pozycję Uruchom układ dla nienadzorowanych dokumentów w okienku po lewej stronie, aby uzyskać informacje o tekście i układzie tabeli dla każdego dokumentu. Narzędzie etykietowania rysuje pola ograniczenia wokół każdego elementu tekstowego.

Narzędzie etykietowania pokazuje również, które tabele zostały wyodrębnione automatycznie. Wybierz ikonę tabeli/siatki po lewej stronie dokumentu i zobacz wyodrębnionej tabeli. Ponieważ zawartość tabeli jest automatycznie wyodrębniona, nie oznaczamy zawartości tabeli, ale raczej polegamy na automatycznym wyodrębnieniu.

Wizualizacja tabeli w narzędziu do etykietowania przykładowego.

Stosowanie etykiet do tekstu

Następnie utworzysz tagi (etykiety) i zastosujesz je do elementów tekstowych, które mają być analizowane przez model. Zwróć uwagę, że zestaw danych przykładowej etykiety zawiera już oznaczone pola; Dodamy kolejne pole.

Użyj okienka edytora tagów, aby utworzyć nowy tag, który chcesz zidentyfikować:

  1. Wybierz + znak plus, aby utworzyć nowy tag.

  2. Wprowadź nazwę tagu "Total".

  3. Wybierz klawisz Enter, aby zapisać tag.

  4. W edytorze głównym wybierz łączną wartość z wyróżnionych elementów tekstowych.

  5. Wybierz tag Total ,aby zastosować wartość, lub naciśnij odpowiedni klawisz klawiatury. Klucze liczbowe są przypisywane jako klucze dostępu dla pierwszych 10 tagów. Tagi można zmienić za pomocą ikon strzałek w górę i w dół w okienku edytora tagów. Wykonaj następujące kroki, aby oznaczyć wszystkie pięć formularzy w przykładowym zestawie danych:

    Napiwek

    Podczas etykietowania formularzy pamiętaj o następujących wskazówkach:

    • Do każdego zaznaczonego elementu tekstowego można zastosować tylko jeden tag.

    • Każdy tag można stosować tylko raz na stronę. Jeśli wartość jest wyświetlana wiele razy w tym samym formularzu, utwórz różne tagi dla każdego wystąpienia. Na przykład: "invoice# 1", "invoice# 2" itd.

    • Tagi nie mogą obejmować między stronami.

    • Etykiety wartości wyświetlane w formularzu; Nie próbuj dzielić wartości na dwie części z dwoma różnymi tagami. Na przykład pole adresu powinno być oznaczone pojedynczym tagiem, nawet jeśli obejmuje wiele wierszy.

    • Nie dołączaj kluczy do otagowanych pól — tylko wartości.

    • Dane tabeli powinny być wykrywane automatycznie i będą dostępne w ostatnim wyjściowym pliku JSON w sekcji "pageResults". Jeśli jednak model nie wykryje wszystkich danych tabeli, możesz również oznaczyć i wytrenować model do wykrywania tabel, zobacz Trenowanie modelu niestandardowego | Etykietowanie formularzy

    • Użyj przycisków z prawej strony, + aby wyszukać, zmienić nazwę, zmienić kolejność i usunąć tagi.

    • Aby usunąć zastosowany tag bez usuwania samego tagu, zaznacz prostokąt oznakowany w widoku dokumentu i naciśnij klawisz delete.

Oznacz etykietami przykłady.

Trenowanie modelu niestandardowego

Wybierz ikonę Trenowanie w okienku po lewej stronie i otwórz stronę Trenowanie. Następnie wybierz przycisk Trenuj, aby rozpocząć trenowanie modelu. Po zakończeniu procesu trenowania zobaczysz następujące informacje:

  • Identyfikator modelu — identyfikator modelu, który został utworzony i wytrenowany. Każde wywołanie trenowania tworzy nowy model z własnym identyfikatorem. Skopiuj ten ciąg do bezpiecznej lokalizacji; potrzebujesz go, jeśli chcesz wykonywać wywołania przewidywania za pośrednictwem interfejsu API REST lub biblioteki klienta.

  • Średnia dokładność — średnia dokładność modelu. Dokładność modelu można poprawić przez etykietowanie większej liczby formularzy i ponowne trenowanie w celu utworzenia nowego modelu. Zalecamy rozpoczęcie od etykietowania pięciu formularzy analizujących i testujących wyniki, a następnie w razie potrzeby dodając więcej formularzy zgodnie z potrzebami.

  • Lista tagów i szacowana dokładność na tag. Aby uzyskać więcej informacji, zobaczInterpretowanie i zwiększanie dokładności i pewności.

    Narzędzie do wyświetlania trenowania.

Analizowanie formularza niestandardowego

  1. Wybierz ikonę Analyze na pasku nawigacyjnym i przetestuj model.

  2. Wybierz źródłowy plik lokalny i wyszukaj plik do wybrania z przykładowego zestawu danych, który został rozpakowany w folderze testowym.

  3. Wybierz przycisk Uruchom analizę, aby pobrać pary klucz/wartość, tekst i tabele przewidywania dla formularza. Narzędzie stosuje tagi w polach ograniczenia i zgłasza pewność każdego tagu.

    Widok trenowania.

I już! Pokazano, jak używać przykładowego narzędzia analizy dokumentów dla wstępnie utworzonych, układów i modeli niestandardowych analizy dokumentów. Przedstawiono również analizę formularza niestandardowego z ręcznie oznaczonymi danymi.

Następne kroki