Document Intelligence Studio

Ważne

  • Publiczne wersje zapoznawcze analizy dokumentów zapewniają wczesny dostęp do funkcji, które są aktywnie opracowywane.
  • Funkcje, podejścia i procesy mogą ulec zmianie przed ogólną dostępnością na podstawie opinii użytkowników.
  • Publiczna wersja zapoznawcza bibliotek klienckich usługi Document Intelligence jest domyślna dla interfejsu API REST w wersji 2024-02-29-preview.
  • Publiczna wersja zapoznawcza 2024-02-29-preview jest obecnie dostępna tylko w następujących regionach świadczenia usługi Azure:
  • Wschodnie stany USA
  • Zachodnie stany USA 2
  • Europa Zachodnia

Ta zawartość dotyczy:Znacznikv4.0 (wersja zapoznawcza) | Poprzednie wersje:niebieski znacznik wyboruv3.1 (GA)niebieski znacznik wyboruv3.0 (GA)

Ta zawartość dotyczy:v3.1 (GA)Najnowsza wersja:Znacznikpurpurowy znacznik wyboruv4.0 (wersja zapoznawcza) | | Poprzednie wersje:niebieski znacznik wyboruv3.0

Ta zawartość dotyczy:Znacznikv3.0 (GA) | Najnowsze wersje:purpurowy znacznik wyboruv4.0 (wersja zapoznawcza)purpurowy znacznik wyboruv3.1

Document Intelligence Studio to narzędzie online umożliwiające wizualne eksplorowanie, zrozumienie i integrowanie funkcji z usługi Analizy dokumentów w aplikacjach. Użyj programu Document Intelligence Studio, aby:

  • Dowiedz się więcej o różnych możliwościach analizy dokumentów.
  • Użyj zasobu analizy dokumentów, aby przetestować modele na przykładowych dokumentach lub przekazać własne dokumenty.
  • Poeksperymentuj z różnymi funkcjami dodatków i wersji zapoznawczej, aby dostosować dane wyjściowe do Twoich potrzeb.
  • Trenowanie niestandardowych modeli klasyfikacji w celu klasyfikowania dokumentów.
  • Trenowanie niestandardowych modeli wyodrębniania w celu wyodrębniania pól z dokumentów.
  • Pobierz przykładowy kod specyficzny dla SDKs języka, aby zintegrować je z aplikacjami.

Skorzystaj z przewodnika Szybki start dotyczącego usługi Document Intelligence Studio, aby rozpocząć analizowanie dokumentów za pomocą analizy dokumentów lub wstępnie utworzonych modeli. Twórz modele niestandardowe i odwołuj się do modeli w aplikacjach przy użyciu jednego z języków specyficznych SDKs dla języka i innych przewodników Szybki start.

Wprowadzenie

Jeśli po raz pierwszy odwiedzasz program Studio, postępuj zgodnie z przewodnikiem wprowadzającym, aby skonfigurować program Studio do użycia.

Opcje analizowania

  • Analiza dokumentów obsługuje zaawansowane możliwości analizy. Program Studio umożliwia łatwe konfigurowanie funkcji dodatku w jednym punkcie wejścia (przycisk Analizuj opcje).

  • W zależności od scenariusza wyodrębniania dokumentów skonfiguruj zakres analiz, zakres stron dokumentów, opcjonalne wykrywanie i funkcje wykrywania w warstwie Premium.

    Zrzut ekranu przedstawiający okno dialogowe analizowania opcji.

    Uwaga

    Wyodrębnianie czcionek nie jest wizualizowane w programie Document Intelligence Studio. Można jednak sprawdzić sekcję stylów danych wyjściowych JSON pod kątem wyników wykrywania czcionek.

✔️ Automatyczne etykietowanie dokumentów przy użyciu wstępnie utworzonych modeli lub jednego z własnych modeli

  • Na niestandardowej stronie etykietowania modelu wyodrębniania można teraz automatycznie oznaczać dokumenty przy użyciu jednego ze wstępnie utworzonych modeli usługi Document Intelligent Service lub wytrenowanych modeli.

    Animowany zrzut ekranu przedstawiający automatyczne etykietowanie w programie Studio.

  • W przypadku niektórych dokumentów możliwe są zduplikowane etykiety po uruchomieniu automatycznego etykietowania. Pamiętaj, aby zmodyfikować etykiety, aby nie było zduplikowanych etykiet na stronie etykietowania.

    Zrzut ekranu przedstawiający ostrzeżenie o zduplikowanych etykietach po automatycznym etykietowaniu.

✔️ Automatyczne etykietowanie tabel

  • Na niestandardowej stronie etykietowania modelu wyodrębniania można teraz automatycznie etykietować tabele w dokumencie bez konieczności ręcznego etykietowania tabel.

    Animowany zrzut ekranu przedstawiający automatyczne etykietowanie tabeli w programie Studio.

✔️ Dodawanie plików testowych bezpośrednio do zestawu danych treningowych

  • Po wytrenowaniu niestandardowego modelu wyodrębniania użyj strony testowej, aby poprawić jakość modelu, przekazując dokumenty testowe do zestawu danych trenowania w razie potrzeby.

  • Jeśli dla niektórych etykiet zostanie zwrócony niski współczynnik ufności, upewnij się, że są one poprawnie oznaczone etykietami. Jeśli nie, dodaj je do zestawu danych szkoleniowych i ponownie określ, aby poprawić jakość modelu.

Animowany zrzut ekranu przedstawiający sposób dodawania plików testowych do zestawu danych szkoleniowych.

✔️ Korzystanie z opcji listy dokumentów i filtrów w projektach niestandardowych

  • Użyj niestandardowej strony etykietowania modelu wyodrębniania, aby łatwo przechodzić przez dokumenty szkoleniowe, korzystając z funkcji wyszukiwania, filtrowania i sortowania.

  • Użyj widoku siatki, aby wyświetlić podgląd dokumentów lub użyć widoku listy, aby łatwiej przewijać dokumenty.

    Zrzut ekranu przedstawiający opcje i filtry widoku listy dokumentów.

✔️ Udostępnianie projektu

Obsługa modelu analizy dokumentów

  • Przeczytaj: Wypróbuj funkcję odczytu analizy dokumentów, aby wyodrębnić wiersze tekstu, wyrazy, wykryte języki i styl odręczny, jeśli zostanie wykryty. Zacznij od funkcji Odczyt w programie Studio. Eksploruj za pomocą przykładowych dokumentów i dokumentów. Użyj interaktywnej wizualizacji i danych wyjściowych JSON, aby zrozumieć, jak działa funkcja. Zobacz Omówienie odczytu, aby dowiedzieć się więcej i rozpocząć pracę z przewodnikiem Szybki start dla zestawu SDK języka Python, aby zapoznać się z artykułem Layout (Układ).

  • Układ: Wypróbuj funkcję układu analizy dokumentów, aby wyodrębnić tekst, tabele, znaczniki zaznaczenia i informacje o strukturze. Zacznij od funkcji Układ programu Studio. Eksploruj za pomocą przykładowych dokumentów i dokumentów. Użyj interaktywnej wizualizacji i danych wyjściowych JSON, aby zrozumieć, jak działa funkcja. Zapoznaj się z omówieniem układu, aby dowiedzieć się więcej i rozpocząć pracę z przewodnikiem Szybki start dla zestawu SDK języka Python w artykule Layout (Układ).

  • Wstępnie utworzone modele: wstępnie utworzone modele analizy dokumentów umożliwiają dodawanie inteligentnego przetwarzania dokumentów do aplikacji i przepływów bez konieczności trenowania i tworzenia własnych modeli. Na przykład zacznij od funkcji Faktura w programie Studio. Eksploruj za pomocą przykładowych dokumentów i dokumentów. Użyj interaktywnej wizualizacji, listy wyodrębnionych pól i danych wyjściowych JSON, aby zrozumieć, jak działa funkcja. Zobacz Omówienie modeli, aby dowiedzieć się więcej i rozpocząć pracę z przewodnikiem Szybki start zestawu SDK języka Python dla wstępnie utworzonej faktury.

  • Niestandardowe modele wyodrębniania: niestandardowe modele analizy dokumentów umożliwiają wyodrębnianie pól i wartości z modeli wytrenowanych przy użyciu danych dostosowanych do formularzy i dokumentów. Aby wyodrębnić dane z wielu typów formularzy, utwórz autonomiczne modele niestandardowe lub połącz dwa lub więcej modeli niestandardowych i utwórz utworzony model. Zacznij od funkcji Modele niestandardowe programu Studio. Użyj kreatora pomocy, interfejsu etykietowania, kroku trenowania i wizualizacji, aby zrozumieć, jak działa funkcja. Przetestuj model niestandardowy przy użyciu przykładowych dokumentów i iteruj, aby ulepszyć model. Aby dowiedzieć się więcej, zobaczOmówienie modeli niestandardowych, aby dowiedzieć się więcej.

  • Niestandardowe modele klasyfikacji: klasyfikacja dokumentów to nowy scenariusz obsługiwany przez analizę dokumentów. interfejs API klasyfikatora dokumentów obsługuje scenariusze klasyfikacji i dzielenia. Trenowanie modelu klasyfikacji w celu zidentyfikowania różnych typów dokumentów, które obsługuje aplikacja. Plik wejściowy modelu klasyfikacji może zawierać wiele dokumentów i klasyfikuje każdy dokument w skojarzonym zakresie stron. Aby dowiedzieć się więcej, zobaczniestandardowe modele klasyfikacji.

  • Możliwości dodatku: analiza dokumentów obsługuje teraz bardziej zaawansowane możliwości analizy. Te opcjonalne możliwości można włączyć i wyłączyć w studio przy użyciu Analze Options przycisku na każdej stronie modelu. Dostępne są cztery funkcje dodatku: funkcje highResolution, formula, font i wyodrębniania kodów kreskowych. Aby dowiedzieć się więcej, zobaczMożliwości dodatków.

Następne kroki

  • Odwiedź program Document Intelligence Studio, aby rozpocząć korzystanie z modeli i funkcji.

  • Rozpocznij pracę z naszym przewodnikiem Szybki start dla programu Document Intelligence Studio.