Udostępnij za pośrednictwem


Wprowadzenie: Document Intelligence Studio

Ta zawartość dotyczy:Znacznik wersja 4.0 (wersja zapoznawcza) | Poprzednie wersje: niebieski znacznik wyboru v3.1 (GA) v3.0 (GA) niebieski znacznik wyboru

Document Intelligence Studio to narzędzie online umożliwiające wizualne eksplorowanie, zrozumienie i integrowanie funkcji z usługi Analizy dokumentów w aplikacjach. Możesz rozpocząć od eksplorowania wstępnie wytrenowanych modeli przy użyciu przykładu lub własnych dokumentów. Możesz również tworzyć projekty do tworzenia niestandardowych modeli szablonów i odwoływać się do modeli w aplikacjach przy użyciu zestawu SDK języka Python i innych przewodników Szybki start.

Wymagania wstępne dla nowych użytkowników

Do korzystania z programu Document Intelligence Studio potrzebne są następujące zasoby i ustawienia:

Napiwek

Utwórz zasób usług Azure AI, jeśli planujesz uzyskać dostęp do wielu usług azure AI w ramach jednego punktu końcowego/klucza. W przypadku dostępu tylko do analizy dokumentów utwórz zasób analizy dokumentów. Należy pamiętać, że jeśli zamierzasz używać uwierzytelniania firmy Microsoft Entra, potrzebujesz zasobu z jedną usługą.

Analiza dokumentów obsługuje teraz uwierzytelnianie tokenu usługi AAD dodatkowe do uwierzytelniania lokalnego (opartego na kluczach) podczas uzyskiwania dostępu do zasobów analizy dokumentów i kont magazynu. Postępuj zgodnie z poniższymi instrukcjami, aby skonfigurować prawidłowe role dostępu, zwłaszcza jeśli zasoby są stosowane z zasadami DisableLocalAuth .

  • Prawidłowe przypisania ról platformy Azure w celu analizy dokumentów i wstępnie utworzonych modeli wymagane są następujące przypisania ról w różnych scenariuszach.

    • Podstawowy ✔️ użytkownik usług Cognitive Services: ta rola jest potrzebna w zasobie usługi Document Intelligence lub Azure AI, aby wprowadzić stronę analizy.

    • Współautor zaawansowany ✔️: ta rola jest potrzebna do tworzenia grupy zasobów, usługi Analizy dokumentów lub zasobów usług Azure AI.

      Aby uzyskać więcej informacji na temat autoryzacji, zobacz Zasady autoryzacji usługi Document Intelligence Studio.

      Uwaga

      Jeśli lokalne (oparte na kluczach) uwierzytelnianie jest wyłączone dla zasobu usługi Document Intelligence Service, upewnij się, że uzyskasz rolę użytkownika usług Cognitive Services, a token usługi AAD będzie używany do uwierzytelniania żądań w usłudze Document Intelligence Studio. Rola Współautor umożliwia wyświetlanie listy kluczy, ale nie daje uprawnień do korzystania z zasobu, gdy dostęp do klucza jest wyłączony.

  • Po skonfigurowaniu zasobu możesz wypróbować różne modele oferowane przez narzędzie Document Intelligence Studio. Na pierwszej stronie wybierz dowolny model analizy dokumentów, aby spróbować użyć metody bez kodu.

  • Aby przetestować dowolną analizę dokumentu lub wstępnie utworzone modele, wybierz model i użyj jednego z przykładowych dokumentów lub przekaż własny dokument do analizy. Wynik analizy jest wyświetlany po prawej stronie w oknie content-result-code.

  • Modele niestandardowe należy wytrenować w dokumentach. Zobacz Omówienie modeli niestandardowych, aby zapoznać się z omówieniem modeli niestandardowych.

Uwierzytelnianie

Przejdź do programu Document Intelligence Studio. Jeśli po raz pierwszy się zalogujesz, zostanie wyświetlone okno podręczne z monitem o skonfigurowanie zasobu usługi. Zgodnie z zasadami organizacji masz jedną lub dwie opcje:

  • Uwierzytelnianie Firmy Microsoft Entra: dostęp za pomocą zasobu (zalecane).

    • Wybierz istniejącą subskrypcję.

    • Wybierz istniejącą grupę zasobów w ramach subskrypcji lub utwórz nową.

    • Wybierz istniejący zasób analizy dokumentów lub usług Azure AI.

      Zrzut ekranu przedstawiający formularz konfigurowania zasobu usługi z programu Document Intelligence Studio.

  • Uwierzytelnianie lokalne: dostęp za pomocą punktu końcowego i klucza interfejsu API.

    • Pobierz punkt końcowy i klucz z witryny Azure Portal.

    • Przejdź do strony przeglądu zasobu i wybierz pozycję Klucze i punkt końcowy na lewym pasku nawigacyjnym.

    • Wprowadź wartości w odpowiednich polach.

      Zrzut ekranu przedstawiający stronę kluczy i punktu końcowego w witrynie Azure Portal.

  • Po zweryfikowaniu scenariusza w narzędziu Document Intelligence Studio użyj bibliotek klienckich języka C#, Java, JavaScript lub Python albo interfejsu API REST, aby rozpocząć dołączanie modeli analizy dokumentów do własnych aplikacji.

Aby dowiedzieć się więcej na temat każdego modelu, zobacz nasze strony koncepcji.

Wyświetlanie szczegółów zasobu

Aby wyświetlić szczegóły zasobów, takie jak nazwa i warstwa cenowa, wybierz ikonę Ustawienia w prawym górnym rogu strony głównej usługi Document Intelligence Studio i wybierz kartę Zasób . Jeśli masz dostęp do innych zasobów, możesz również przełączyć zasoby.

Modele

Wstępnie utworzone modele ułatwiają dodawanie funkcji analizy dokumentów do aplikacji bez konieczności kompilowania, trenowania i publikowania własnych modeli. Możesz wybrać spośród kilku wstępnie utworzonych modeli, z których każdy ma własny zestaw obsługiwanych pól danych. Wybór modelu do użycia dla analyze operacji zależy od typu dokumentu do przeanalizowania. Analiza dokumentów obsługuje obecnie następujące wstępnie utworzone modele:

Analiza dokumentów

  • Układ: wyodrębnianie tekstu, tabel, znaczników zaznaczenia i informacji o strukturze z dokumentów (PDF, TIFF) i obrazów (JPG, PNG, BMP).
  • Odczyt: wyodrębnianie wierszy tekstu, wyrazów, ich lokalizacji, wykrytych języków i stylu odręcznego w przypadku wykrycia z dokumentów (PDF, TIFF) i obrazów (JPG, PNG, BMP).

Wstępnie utworzona

  • Faktura: wyodrębnij tekst, znaczniki wyboru, tabele, pary klucz-wartość i informacje o kluczu z faktur.
  • Potwierdzenie: wyodrębnianie tekstu i kluczowych informacji z paragonów.
  • Karta ubezpieczenia zdrowotnego: wyodrębnić ubezpieczyciela, członka, receptę, numer grupy i inne kluczowe informacje z amerykańskich kart ubezpieczenia zdrowotnego.
  • W-2: wyodrębnianie tekstu i kluczowych informacji z formularzy podatkowych W-2.
  • Dokument identyfikacyjny: wyodrębnianie tekstu i kluczowych informacji z licencji kierowców i międzynarodowych paszportów.

Niestandardowy

  • Niestandardowe modele wyodrębniania: wyodrębnianie informacji z formularzy i dokumentów przy użyciu niestandardowych modeli wyodrębniania. Szybkie trenowanie modelu przez etykietowanie nawet pięciu przykładowych dokumentów.
  • Niestandardowy model klasyfikacji: wytrenuj niestandardowy klasyfikator, aby odróżnić różne typy dokumentów w aplikacjach. Szybko wytrenuj model z co najmniej dwiema klasami i pięcioma próbkami na klasę.

Po ukończeniu wymagań wstępnych przejdź do programu Document Intelligence Studio.

  1. Wybierz funkcję usługi Analizy dokumentów na stronie głównej programu Studio. Ten krok jest jednorazowym procesem, chyba że wybrano już zasób usługi z wcześniejszego użycia. Wybierz subskrypcję platformy Azure, grupę zasobów i zasób. (Zasoby można zmienić w dowolnym momencie w obszarze "Ustawienia" w górnym menu). Przejrzyj i potwierdź wybrane opcje.

  2. Wybierz przycisk Analizuj, aby uruchomić analizę w przykładowym dokumencie lub spróbuj użyć polecenia Dodaj.

  3. Pomniejszanie i zmniejszanie widoku dokumentu i używanie kontrolek w dolnej części ekranu.

  4. Zwróć uwagę na wyróżnioną wyodrębnianą zawartość w widoku dokumentu. Aby wyświetlić szczegóły, umieść wskaźnik myszy na i wartościach.

  5. Sformatuj kartę wyników sekcji danych wyjściowych i przejrzyj dane wyjściowe JSON, aby lepiej zrozumieć odpowiedź usługi.

  6. Wybierz kartę Kod i przejrzyj przykładowy kod na potrzeby integracji. Skopiuj i pobierz, aby rozpocząć pracę.

Dodano wymagania wstępne dotyczące projektów niestandardowych

Oprócz konta platformy Azure i zasobu analizy dokumentów lub usług Azure AI potrzebne są następujące elementy:

Kontener usługi Azure Blob Storage

Konto usługi Azure Blob Storage o standardowej wydajności. Kontenery są tworzone do przechowywania i organizowania dokumentów szkoleniowych na koncie magazynu. Jeśli nie wiesz, jak utworzyć konto usługi Azure Storage przy użyciu kontenera, wykonaj następujące przewodniki Szybki start:

  • Create a storage account (Tworzenie konta magazynu). Podczas tworzenia konta magazynu wybierz pozycję Wydajność w warstwie Standardowa w polu Szczegóły wystąpienia → Wydajność.
  • Tworzenie kontenera. Podczas tworzenia kontenera ustaw pole Poziom dostępu publicznego na Kontener (anonimowy dostęp do odczytu dla kontenerów i obiektów blob) w oknie Nowy kontener .

Przypisania ról platformy Azure

W przypadku projektów niestandardowych następujące przypisania ról są wymagane w różnych scenariuszach.

  • Podstawowy

    • Użytkownik usług Cognitive Services: ta rola jest potrzebna dla zasobu usługi Document Intelligence lub Azure AI, aby wytrenować model niestandardowy lub przeprowadzić analizę za pomocą wytrenowanych modeli.
    • Współautor danych obiektu blob usługi Storage: ta rola jest potrzebna dla konta magazynu w celu utworzenia projektu i etykiet danych.
  • Zaawansowani

    • Współautor konta magazynu: ta rola jest potrzebna dla konta magazynu w celu skonfigurowania ustawień mechanizmu CORS (ta akcja jest jednorazowa, jeśli to samo konto magazynu jest używane ponownie).
    • Współautor: ta rola jest potrzebna do utworzenia grupy zasobów i zasobów.

    Uwaga

    Jeśli uwierzytelnianie lokalne (oparte na kluczach) jest wyłączone dla zasobu usługi Analizy dokumentów i konta magazynu, upewnij się, że masz odpowiednio role Współautor danych użytkownika i magazynu usług Cognitive Services, więc masz wystarczające uprawnienia do korzystania z usługi Document Intelligence Studio. Role Współautor i Współautor konta magazynu umożliwiają wyświetlanie listy kluczy, ale nie zezwalają na korzystanie z zasobów, gdy dostęp do klucza jest wyłączony.

Konfigurowanie mechanizmu CORS

Mechanizm CORS (współużytkowanie zasobów między źródłami) musi być skonfigurowany na koncie usługi Azure Storage, aby był dostępny z poziomu programu Document Intelligence Studio. Aby skonfigurować mechanizm CORS w witrynie Azure Portal, musisz mieć dostęp do karty CORS konta magazynu.

  1. Wybierz kartę CORS dla konta magazynu.

    Zrzut ekranu przedstawiający menu ustawień mechanizmu CORS w witrynie Azure Portal.

  2. Zacznij od utworzenia nowego wpisu CORS w usłudze Blob Service.

  3. Ustaw wartość Dozwolone źródła na https://documentintelligence.ai.azure.com.

    Zrzut ekranu przedstawiający konfigurację mechanizmu CORS dla konta magazynu.

    Napiwek

    Można użyć symbolu wieloznakowego "*", a nie określonej domeny, aby umożliwić wszystkim domenom pochodzenia wykonywanie żądań za pośrednictwem mechanizmu CORS.

  4. Wybierz wszystkie dostępne 8 opcji dla dozwolonych metod.

  5. Zatwierdź wszystkie dozwolone nagłówki i uwidocznione nagłówki, wprowadzając element * w każdym polu.

  6. Ustaw maksymalny wiek na 120 sekund lub dowolną akceptowalną wartość.

  7. Aby zapisać zmiany, wybierz przycisk Zapisz w górnej części strony.

Mechanizm CORS powinien być teraz skonfigurowany do używania konta magazynu z programu Document Intelligence Studio.

Zestaw przykładowych dokumentów

  1. Zaloguj się do witryny Azure Portal i przejdź do obszaru Kontenery magazynu konta magazynu>>.

    Zrzut ekranu przedstawiający menu Magazyn danych w witrynie Azure Portal.

  2. Wybierz kontener z listy.

  3. Wybierz pozycję Przekaż z menu w górnej części strony.

    Zrzut ekranu przedstawiający przycisk przekazywania kontenera w witrynie Azure Portal.

  4. Zostanie wyświetlone okno Przekazywanie obiektu blob .

  5. Wybierz pliki do przekazania.

    Zrzut ekranu przedstawiający okno przekazywania obiektu blob w witrynie Azure Portal.

Uwaga

Domyślnie program Studio będzie używać dokumentów znajdujących się w katalogu głównym kontenera. Można jednak używać danych zorganizowanych w folderach, określając ścieżkę folderu w krokach tworzenia projektu formularzy niestandardowych. Zobacz Organizowanie danych w podfolderach

Modele niestandardowe

Aby utworzyć modele niestandardowe, zacznij od skonfigurowania projektu:

  1. Wybierz kartę Model niestandardowy z strony głównej programu Studio i otwórz stronę Modele niestandardowe.

  2. Użyj polecenia "Utwórz projekt" i uruchom kreatora konfiguracji nowego projektu.

  3. Wprowadź szczegóły projektu, wybierz subskrypcję i zasób platformy Azure oraz kontener usługi Azure Blob Storage zawierający dane.

  4. Przejrzyj ustawienia, prześlij i utwórz projekt.

  5. Użyj funkcji automatycznej etykiety, aby oznaczyć etykietę przy użyciu już wytrenowanego modelu lub jednego z naszych wstępnie utworzonych modeli.

  6. Zdefiniuj etykiety i ich typy do wyodrębniania przy użyciu ręcznego etykietowania.

  7. Wybierz tekst w dokumencie i wybierz etykietę z listy rozwijanej lub okienka etykiet.

  8. Etykietuj cztery kolejne dokumenty, aby uzyskać co najmniej pięć dokumentów oznaczonych etykietą.

  9. Wybierz polecenie Train (Trenowanie) i wprowadź nazwę modelu, wybierz, czy chcesz, aby model neuronowy (zalecany) lub model szablonu rozpoczął trenowanie modelu niestandardowego.

  10. Użyj polecenia Test, gdy model będzie gotowy i zweryfikuj je przy użyciu dokumentów testowych i obserwuj wyniki.

Pokaz modelu niestandardowego analizy dokumentów

Etykietowanie jako tabel

Uwaga

  • Wraz z wydaniem interfejsu API w wersji 2022-06-30-preview i nowszych niestandardowe modele szablonów będą dodawać obsługę pól tabelarycznych (tabel) między stronami.
  • Wraz z wydaniem interfejsu API w wersji 2022-06-30-preview i nowszych niestandardowe modele neuronowe będą obsługiwać pola tabelaryczne (tabele) i modele trenowane przy użyciu interfejsu API w wersji 2022-08-31 lub nowszej będą akceptować etykiety pól tabelarycznych.
  1. Użyj polecenia Usuń, aby usunąć modele, które nie są wymagane.

  2. Pobierz szczegóły modelu na potrzeby wyświetlania w trybie offline.

  3. Wybierz wiele modeli i utwórz je w nowym modelu, który ma być używany w aplikacjach.

Używanie tabel jako wzorca wizualizacji:

W przypadku niestandardowych modeli formularzy podczas tworzenia modeli niestandardowych może być konieczne wyodrębnienie kolekcji danych z dokumentów. Kolekcje danych mogą być wyświetlane w kilku formatach. Używanie tabel jako wzorca wizualizacji:

  • Dynamiczna lub zmienna liczba wartości (wierszy) dla danego zestawu pól (kolumn)

  • Określona kolekcja wartości dla danego zestawu pól (kolumn i/lub wierszy)

Etykieta jako tabela dynamiczna

Użyj tabel dynamicznych, aby wyodrębnić zmienną liczbę wartości (wierszy) dla danego zestawu pól (kolumn):

  1. Dodaj nową etykietę typu "Tabela", wybierz typ "Tabela dynamiczna" i nadaj etykiecie nazwę.

  2. Dodaj liczbę kolumn (pól) i wierszy (dla potrzebnych danych).

  3. Zaznacz tekst na stronie, a następnie wybierz komórkę i przypisz ją do tekstu. Powtórz wszystkie wiersze i kolumny we wszystkich stronach we wszystkich dokumentach.

Przykład etykietowania analizy dokumentów jako dynamicznej tabeli

Etykieta jako stała tabela

Użyj stałych tabel, aby wyodrębnić konkretną kolekcję wartości dla danego zestawu pól (kolumn i/lub wierszy):

  1. Utwórz nową etykietę typu "Tabela", wybierz typ "Stała tabela" i nadaj mu nazwę.

  2. Dodaj liczbę kolumn i wierszy odpowiadających dwóm zestawom pól.

  3. Zaznacz tekst na stronie, a następnie wybierz komórkę i przypisz ją do tekstu. Powtórz dla innych dokumentów.

Etykietowanie analizy dokumentów jako przykład tabeli stałej

Wykrywanie podpisów

Uwaga

Pola podpisów są obecnie obsługiwane tylko w przypadku niestandardowych modeli szablonów. Podczas trenowania niestandardowego modelu neuronowego pola podpisów z etykietami są ignorowane.

Aby oznaczyć etykietę na potrzeby wykrywania podpisów: (tylko formularz niestandardowy)

  1. Utwórz nową etykietę typu "Podpis" i nadaj jej nazwę przy użyciu widoku etykietowania.

  2. Użyj polecenia Region, aby utworzyć prostokątny region w oczekiwanej lokalizacji podpisu.

  3. Wybierz region narysowany i wybierz etykietę Typ podpisu i przypisz ją do narysowanego regionu. Powtórz dla innych dokumentów.

Przykład etykietowania analizy dokumentów na potrzeby wykrywania podpisów

Następne kroki

  • Postępuj zgodnie z naszym przewodnikiem migracji analizy dokumentów w wersji 3.1, aby poznać różnice w stosunku do poprzedniej wersji interfejsu API REST.
  • Zapoznaj się z naszymi przewodnikami Szybki start zestawu SDK w wersji 3.0, aby wypróbować funkcje w wersji 3.0 w aplikacjach przy użyciu nowych bibliotek klienckich.
  • Zapoznaj się z naszymi przewodnikami Szybki start interfejsu API REST w wersji 3.0, aby wypróbować funkcje w wersji 3.0 przy użyciu nowego interfejsu API REST.

Rozpocznij pracę z programem Document Intelligence Studio.