Analiza dokumentów składa się z modeli niestandardowych

Artykuł
10/16/2024

Ważne

Publiczne wersje zapoznawcze analizy dokumentów zapewniają wczesny dostęp do funkcji, które są aktywnie opracowywane. Funkcje, podejścia i procesy mogą ulec zmianie przed ogólną dostępnością na podstawie opinii użytkowników.
Publiczna wersja zapoznawcza bibliotek klienckich analizy dokumentów jest domyślna dla interfejsu API REST w wersji 2024-07-31-preview.
Publiczna wersja zapoznawcza 2024-07-31-preview jest obecnie dostępna tylko w następujących regionach świadczenia usługi Azure. Należy pamiętać, że niestandardowy model generowania (wyodrębniania pól dokumentów) w programie AI Studio jest dostępny tylko w regionie Północno-środkowe stany USA:
- Wschodnie stany USA
- Zachodnie stany USA 2
- Europa Zachodnia
- Północno-środkowe stany USA

Ta zawartość dotyczy: v4.0 (wersja zapoznawcza) | Poprzednie wersje: v3.1 (GA) v3.0 (GA) v2.1 (GA)

Ta zawartość dotyczy: wersja 3.1 (GA)Najnowsza wersja: v4.0 (wersja zapoznawcza) | | Poprzednie wersje: v3.0 v2.1

Ta zawartość dotyczy: wersja 3.0 (GA) | Najnowsze wersje: wersja 4.0 (wersja zapoznawcza) 3.1 | Poprzednia wersja: wersja 2.1

Ta zawartość dotyczy: wersja 2.1 | Najnowsza wersja: wersja 4.0 (wersja zapoznawcza)

Ważne

Zachowanie model compose operacji zmienia się z api-version=2024-07-31-preview. Operacja model compose w wersji 4.0 lub nowszej dodaje jawnie wytrenowany klasyfikator zamiast niejawnego klasyfikatora do analizy. Aby zapoznać się z poprzednią wersją modelu skomponowanego, zobacz Komponowanie modeli niestandardowych w wersji 3.1. Jeśli obecnie używasz modeli złożonych, rozważ uaktualnienie do najnowszej implementacji.

Co to jest model złożony?

W przypadku modeli skomponowanych można grupować wiele modeli niestandardowych w złożony model o nazwie z jednym identyfikatorem modelu. Na przykład skomponowany model może obejmować niestandardowe modele przeszkolone do analizowania zamówień zakupu dostaw, sprzętu i mebli. Zamiast ręcznie próbować wybrać odpowiedni model, możesz użyć złożonego modelu do określenia odpowiedniego modelu niestandardowego dla każdej analizy i wyodrębniania.

Niektóre scenariusze wymagają najpierw sklasyfikowania dokumentu, a następnie przeanalizowanie dokumentu przy użyciu modelu najlepiej dopasowanego do wyodrębnienia pól z modelu. Takie scenariusze mogą obejmować te, w których użytkownik przekazuje dokument, ale typ dokumentu nie jest jawnie znany. Innym scenariuszem może być to, że wiele dokumentów jest skanowanych razem w jednym pliku, a plik jest przesyłany do przetwarzania. Następnie aplikacja musi zidentyfikować dokumenty składników i wybrać najlepszy model dla każdego dokumentu.

W poprzednich wersjach operacja wykonała niejawną klasyfikację, aby zdecydować, model compose który model niestandardowy najlepiej reprezentuje przesłany dokument. Implementacja 2024-07-31-preview model compose operacji zastępuje niejawną klasyfikację z wcześniejszych wersji jawnym krokiem klasyfikacji i dodaje routing warunkowy.

Zalety nowej operacji tworzenia modelu

Nowa model compose operacja wymaga wytrenowania jawnego klasyfikatora i zapewnia kilka korzyści.

Ciągła poprawa przyrostowa. Można konsekwentnie poprawić jakość klasyfikatora, dodając więcej próbek i przyrostowo poprawiając klasyfikację. To precyzyjne dostrajanie gwarantuje, że dokumenty są zawsze kierowane do odpowiedniego modelu wyodrębniania.
Pełna kontrola nad routingiem. Dodając routing oparty na ufności, należy podać próg ufności dla typu dokumentu i odpowiedzi klasyfikacji.
Ignoruj typy dokumentów specyficznych dla dokumentu podczas operacji. Wcześniejsze implementacje model compose operacji wybrały najlepszy model analizy do wyodrębniania na podstawie wskaźnika ufności, nawet jeśli najwyższe oceny ufności były stosunkowo niskie. Podając próg ufności lub jawnie nie mapując znanego typu dokumentu z klasyfikacji na model wyodrębniania, można zignorować określone typy dokumentów.
Analizowanie wielu wystąpień tego samego typu dokumentu. Po połączeniu splitMode z opcją klasyfikatora model compose operacja może wykryć wiele wystąpień tego samego dokumentu w pliku i podzielić plik, aby przetworzyć każdy dokument niezależnie. Użycie splitMode umożliwia przetwarzanie wielu wystąpień dokumentu w jednym żądaniu.
Obsługa dodawania funkcji. Dodawanie funkcji , takich jak pola zapytania lub kody kreskowe, można również określić jako część parametrów modelu analizy.
Przypisano maksymalny model niestandardowy rozszerzony do 500. Nowa implementacja model compose operacji umożliwia przypisanie do 500 wytrenowanych modeli niestandardowych do pojedynczego modelu złożonego.

Jak używać redagowania modelu

Zacznij od zebrania przykładów wszystkich potrzebnych dokumentów, w tym przykładów z informacjami, które powinny zostać wyodrębnione lub zignorowane.
Wytrenuj klasyfikator, organizując dokumenty w folderach, w których nazwy folderów są typem dokumentu, który ma być używany w definicji modelu skomponowanego.
Na koniec wytrenuj model wyodrębniania dla każdego z typów dokumentów, których zamierzasz użyć.
Gdy modele klasyfikacji i wyodrębniania zostaną wytrenowane, użyj narzędzia Document Intelligence Studio, bibliotek klienckich lub interfejsu API REST, aby utworzyć modele klasyfikacji i wyodrębniania w skomponowany model.

Użyj parametru , splitMode aby kontrolować zachowanie dzielenia plików:

Brak. Cały plik jest traktowany jako pojedynczy dokument.
perPage. Każda strona w pliku jest traktowana jako oddzielny dokument.
auto. Plik jest automatycznie podzielony na dokumenty.

Rozliczenia i ceny

Modele złożone są rozliczane tak samo jak poszczególne modele niestandardowe. Ceny są oparte na liczbie stron analizowanych przez model analizy podrzędnej. Rozliczenia są oparte na cenie wyodrębniania stron kierowanych do modelu wyodrębniania. Po dodaniu jawnych opłat za klasyfikację wszystkich stron w pliku wejściowym są naliczane opłaty za jawne klasyfikacje. Aby uzyskać więcej informacji, zobacz stronę cennika analizy dokumentów.

Korzystanie z operacji redagowania modelu

Zacznij od utworzenia listy wszystkich identyfikatorów modeli, które chcesz utworzyć w jednym modelu.
Utwórz modele w jednym identyfikatorze modelu przy użyciu programu Studio, interfejsu API REST lub bibliotek klienckich.
Użyj skomponowanego identyfikatora modelu do analizowania dokumentów.

Rozliczenia

Modele złożone są rozliczane tak samo jak poszczególne modele niestandardowe. Ceny są oparte na liczbie analizowanych stron. Rozliczenia są oparte na cenie wyodrębniania stron kierowanych do modelu wyodrębniania. Aby uzyskać więcej informacji, zobacz stronę cennika analizy dokumentów.

Nie ma żadnych zmian w cenach analizowania dokumentu przy użyciu pojedynczego modelu niestandardowego lub złożonego modelu niestandardowego.

Funkcje modeli złożonych

Custom template modele i custom neural mogą składać się ze sobą w jeden złożony model w wielu wersjach interfejsu API.
Odpowiedź zawiera właściwość wskazującą docType , która z złożonych modeli została użyta do przeanalizowania dokumentu.
W przypadku custom template modeli skomponowany model można utworzyć przy użyciu odmian szablonu niestandardowego lub różnych typów formularzy. Ta operacja jest przydatna, gdy formularze przychodzące należą do jednego z kilku szablonów.
W przypadku custom neural modeli najlepszym rozwiązaniem jest dodanie wszystkich różnych odmian pojedynczego typu dokumentu do pojedynczego zestawu danych trenowania i trenowanie w niestandardowym modelu neuronowym. Operacja model compose jest najbardziej odpowiednia w przypadku scenariuszy, w których dokumenty różnych typów są przesyłane do analizy.

Tworzenie limitów modelu

Za pomocą model compose operacji można przypisać maksymalnie 500 modeli do jednego identyfikatora modelu. Jeśli liczba modeli, które chcę utworzyć, przekracza górny limit złożonego modelu, możesz użyć jednej z następujących alternatyw:
- Klasyfikuj dokumenty przed wywołaniem modelu niestandardowego. Możesz użyć modelu Odczyt i utworzyć klasyfikację na podstawie wyodrębnionego tekstu z dokumentów i określonych fraz przy użyciu źródeł, takich jak kod, wyrażenia regularne lub wyszukiwanie.
- Jeśli chcesz wyodrębnić te same pola z różnych dokumentów ustrukturyzowanych, częściowo ustrukturyzowanych i nieustrukturyzowanych, rozważ użycie niestandardowego modelu neuronowego uczenia głębokiego. Dowiedz się więcej o różnicach między niestandardowym modelem szablonu a niestandardowym modelem neuronowym.
Analizowanie dokumentu przy użyciu modeli złożonych jest identyczne z analizowaniem dokumentu przy użyciu jednego modelu. Wynik Analyze Document zwraca właściwość wskazującą docType , które z modeli składników wybranych do analizowania dokumentu.
Operacja model compose jest obecnie dostępna tylko dla modeli niestandardowych wytrenowanych za pomocą etykiet.

Zgodność modelu złożonego

Niestandardowy typ modelu	Modele trenowane przy użyciu wersji 2.1 i 2.0	Szablon niestandardowy i modele neuronowe w wersji 3.1 i 3.0	Szablon niestandardowy i modele neuronowe w wersji 4.0 (wersja zapoznawcza)	Niestandardowe modele generowania w wersji 4.0 (wersja zapoznawcza)
Modele trenowane przy użyciu wersji 2.1 i 2.0	Nieobsługiwany	Nieobsługiwany	Nieobsługiwany	Nieobsługiwany
Szablon niestandardowy i modele neuronowe w wersji 3.0 i 3.1	Nieobsługiwany	Obsługiwane	Obsługiwane	Nieobsługiwany
Szablon niestandardowy i modele neuronowe w wersji 4.0 (wersja zapoznawcza)	Nieobsługiwany	Obsługiwane	Obsługiwane	Nieobsługiwany
Niestandardowe modele generowania w wersji 4.0 (wersja zapoznawcza)	Nieobsługiwany	Nieobsługiwany	Nieobsługiwany	Nieobsługiwany

Aby utworzyć model wytrenowany przy użyciu wcześniejszej wersji interfejsu API (wersja 2.1 lub starsza), wytrenuj model przy użyciu interfejsu API w wersji 3.0 przy użyciu tego samego oznaczonego zestawu danych. Ten dodatek gwarantuje, że model w wersji 2.1 może składać się z innych modeli.
W przypadku modeli skomponowanych przy użyciu wersji 2.1 interfejsu API nadal są obsługiwane, nie wymagając aktualizacji.

Opcje programowania

Analiza dokumentów w wersji 4.0:2024-07-31-preview obsługuje następujące narzędzia, aplikacje i biblioteki:

Funkcja	Zasoby
Model niestandardowy	• Document Intelligence Studio• REST API • C# SDK• Java SDK • JavaScript SDK • Python SDK
Skomponowany model	• Document Intelligence Studio• REST API • C# SDK• Java SDK • JavaScript SDK • Python SDK

Analiza dokumentów w wersji 3.1:2023-07-31 (GA) obsługuje następujące narzędzia, aplikacje i biblioteki:

Funkcja	Zasoby
Model niestandardowy	• Document Intelligence Studio• REST API • C# SDK• Java SDK • JavaScript SDK • Python SDK
Skomponowany model	• Document Intelligence Studio• REST API • C# SDK• Java SDK • JavaScript SDK • Python SDK

Analiza dokumentów w wersji 3.0:2022-08-31 (GA) obsługuje następujące narzędzia, aplikacje i biblioteki:

Funkcja	Zasoby
Model niestandardowy	• Document Intelligence Studio• REST API • C# SDK• Java SDK • JavaScript SDK • Python SDK
Skomponowany model	• Document Intelligence Studio• REST API • C# SDK• Java SDK • JavaScript SDK • Python SDK

Analiza dokumentów w wersji 2.1 obsługuje następujące zasoby:

Funkcja	Zasoby
Model niestandardowy	• Narzędzie do etykietowania analizy dokumentów• Interfejs API REST• Zestaw SDK biblioteki klienta• Kontener docker analizy dokumentów
Skomponowany model	• Narzędzie do etykietowania analizy dokumentów• Interfejs API REST• Zestaw SDK języka C#• Zestaw Java SDK • Zestaw SDK języka JavaScript • Zestaw SDK języka Python

Następne kroki

Dowiedz się, jak tworzyć i tworzyć modele niestandardowe:

Tworzenie niestandardowego modelu Tworzenie modeliniestandardowych

Udostępnij za pośrednictwem