Analiza dokumentów składa się z modeli niestandardowych
Ważne
- Publiczne wersje zapoznawcze analizy dokumentów zapewniają wczesny dostęp do funkcji, które są aktywnie opracowywane. Funkcje, podejścia i procesy mogą ulec zmianie przed ogólną dostępnością na podstawie opinii użytkowników.
- Publiczna wersja zapoznawcza bibliotek klienckich analizy dokumentów jest domyślna dla interfejsu API REST w wersji 2024-07-31-preview.
- Publiczna wersja zapoznawcza 2024-07-31-preview jest obecnie dostępna tylko w następujących regionach świadczenia usługi Azure. Należy pamiętać, że niestandardowy model generowania (wyodrębniania pól dokumentów) w programie AI Studio jest dostępny tylko w regionie Północno-środkowe stany USA:
- Wschodnie stany USA
- Zachodnie stany USA 2
- Europa Zachodnia
- Północno-środkowe stany USA
Ta zawartość dotyczy: v4.0 (wersja zapoznawcza) | Poprzednie wersje: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Ta zawartość dotyczy: wersja 3.1 (GA)Najnowsza wersja: v4.0 (wersja zapoznawcza) | | Poprzednie wersje: v3.0 v2.1
Ta zawartość dotyczy: wersja 3.0 (GA) | Najnowsze wersje: wersja 4.0 (wersja zapoznawcza) 3.1 | Poprzednia wersja: wersja 2.1
Ta zawartość dotyczy: wersja 2.1 | Najnowsza wersja: wersja 4.0 (wersja zapoznawcza)
Ważne
Zachowanie model compose
operacji zmienia się z api-version=2024-07-31-preview. Operacja model compose
w wersji 4.0 lub nowszej dodaje jawnie wytrenowany klasyfikator zamiast niejawnego klasyfikatora do analizy. Aby zapoznać się z poprzednią wersją modelu skomponowanego, zobacz Komponowanie modeli niestandardowych w wersji 3.1. Jeśli obecnie używasz modeli złożonych, rozważ uaktualnienie do najnowszej implementacji.
Co to jest model złożony?
W przypadku modeli skomponowanych można grupować wiele modeli niestandardowych w złożony model o nazwie z jednym identyfikatorem modelu. Na przykład skomponowany model może obejmować niestandardowe modele przeszkolone do analizowania zamówień zakupu dostaw, sprzętu i mebli. Zamiast ręcznie próbować wybrać odpowiedni model, możesz użyć złożonego modelu do określenia odpowiedniego modelu niestandardowego dla każdej analizy i wyodrębniania.
Niektóre scenariusze wymagają najpierw sklasyfikowania dokumentu, a następnie przeanalizowanie dokumentu przy użyciu modelu najlepiej dopasowanego do wyodrębnienia pól z modelu. Takie scenariusze mogą obejmować te, w których użytkownik przekazuje dokument, ale typ dokumentu nie jest jawnie znany. Innym scenariuszem może być to, że wiele dokumentów jest skanowanych razem w jednym pliku, a plik jest przesyłany do przetwarzania. Następnie aplikacja musi zidentyfikować dokumenty składników i wybrać najlepszy model dla każdego dokumentu.
W poprzednich wersjach operacja wykonała niejawną klasyfikację, aby zdecydować, model compose
który model niestandardowy najlepiej reprezentuje przesłany dokument. Implementacja 2024-07-31-preview
model compose
operacji zastępuje niejawną klasyfikację z wcześniejszych wersji jawnym krokiem klasyfikacji i dodaje routing warunkowy.
Zalety nowej operacji tworzenia modelu
Nowa model compose
operacja wymaga wytrenowania jawnego klasyfikatora i zapewnia kilka korzyści.
Ciągła poprawa przyrostowa. Można konsekwentnie poprawić jakość klasyfikatora, dodając więcej próbek i przyrostowo poprawiając klasyfikację. To precyzyjne dostrajanie gwarantuje, że dokumenty są zawsze kierowane do odpowiedniego modelu wyodrębniania.
Pełna kontrola nad routingiem. Dodając routing oparty na ufności, należy podać próg ufności dla typu dokumentu i odpowiedzi klasyfikacji.
Ignoruj typy dokumentów specyficznych dla dokumentu podczas operacji. Wcześniejsze implementacje
model compose
operacji wybrały najlepszy model analizy do wyodrębniania na podstawie wskaźnika ufności, nawet jeśli najwyższe oceny ufności były stosunkowo niskie. Podając próg ufności lub jawnie nie mapując znanego typu dokumentu z klasyfikacji na model wyodrębniania, można zignorować określone typy dokumentów.Analizowanie wielu wystąpień tego samego typu dokumentu. Po połączeniu
splitMode
z opcją klasyfikatoramodel compose
operacja może wykryć wiele wystąpień tego samego dokumentu w pliku i podzielić plik, aby przetworzyć każdy dokument niezależnie. UżyciesplitMode
umożliwia przetwarzanie wielu wystąpień dokumentu w jednym żądaniu.Obsługa dodawania funkcji. Dodawanie funkcji , takich jak pola zapytania lub kody kreskowe, można również określić jako część parametrów modelu analizy.
Przypisano maksymalny model niestandardowy rozszerzony do 500. Nowa implementacja
model compose
operacji umożliwia przypisanie do 500 wytrenowanych modeli niestandardowych do pojedynczego modelu złożonego.
Jak używać redagowania modelu
Zacznij od zebrania przykładów wszystkich potrzebnych dokumentów, w tym przykładów z informacjami, które powinny zostać wyodrębnione lub zignorowane.
Wytrenuj klasyfikator, organizując dokumenty w folderach, w których nazwy folderów są typem dokumentu, który ma być używany w definicji modelu skomponowanego.
Na koniec wytrenuj model wyodrębniania dla każdego z typów dokumentów, których zamierzasz użyć.
Gdy modele klasyfikacji i wyodrębniania zostaną wytrenowane, użyj narzędzia Document Intelligence Studio, bibliotek klienckich lub interfejsu API REST, aby utworzyć modele klasyfikacji i wyodrębniania w skomponowany model.
Użyj parametru , splitMode
aby kontrolować zachowanie dzielenia plików:
- Brak. Cały plik jest traktowany jako pojedynczy dokument.
- perPage. Każda strona w pliku jest traktowana jako oddzielny dokument.
- auto. Plik jest automatycznie podzielony na dokumenty.
Rozliczenia i ceny
Modele złożone są rozliczane tak samo jak poszczególne modele niestandardowe. Ceny są oparte na liczbie stron analizowanych przez model analizy podrzędnej. Rozliczenia są oparte na cenie wyodrębniania stron kierowanych do modelu wyodrębniania. Po dodaniu jawnych opłat za klasyfikację wszystkich stron w pliku wejściowym są naliczane opłaty za jawne klasyfikacje. Aby uzyskać więcej informacji, zobacz stronę cennika analizy dokumentów.
Korzystanie z operacji redagowania modelu
Zacznij od utworzenia listy wszystkich identyfikatorów modeli, które chcesz utworzyć w jednym modelu.
Utwórz modele w jednym identyfikatorze modelu przy użyciu programu Studio, interfejsu API REST lub bibliotek klienckich.
Użyj skomponowanego identyfikatora modelu do analizowania dokumentów.
Rozliczenia
Modele złożone są rozliczane tak samo jak poszczególne modele niestandardowe. Ceny są oparte na liczbie analizowanych stron. Rozliczenia są oparte na cenie wyodrębniania stron kierowanych do modelu wyodrębniania. Aby uzyskać więcej informacji, zobacz stronę cennika analizy dokumentów.
- Nie ma żadnych zmian w cenach analizowania dokumentu przy użyciu pojedynczego modelu niestandardowego lub złożonego modelu niestandardowego.
Funkcje modeli złożonych
Custom template
modele icustom neural
mogą składać się ze sobą w jeden złożony model w wielu wersjach interfejsu API.Odpowiedź zawiera właściwość wskazującą
docType
, która z złożonych modeli została użyta do przeanalizowania dokumentu.W przypadku
custom template
modeli skomponowany model można utworzyć przy użyciu odmian szablonu niestandardowego lub różnych typów formularzy. Ta operacja jest przydatna, gdy formularze przychodzące należą do jednego z kilku szablonów.W przypadku
custom neural
modeli najlepszym rozwiązaniem jest dodanie wszystkich różnych odmian pojedynczego typu dokumentu do pojedynczego zestawu danych trenowania i trenowanie w niestandardowym modelu neuronowym. Operacjamodel compose
jest najbardziej odpowiednia w przypadku scenariuszy, w których dokumenty różnych typów są przesyłane do analizy.
Tworzenie limitów modelu
Za pomocą
model compose
operacji można przypisać maksymalnie 500 modeli do jednego identyfikatora modelu. Jeśli liczba modeli, które chcę utworzyć, przekracza górny limit złożonego modelu, możesz użyć jednej z następujących alternatyw:Klasyfikuj dokumenty przed wywołaniem modelu niestandardowego. Możesz użyć modelu Odczyt i utworzyć klasyfikację na podstawie wyodrębnionego tekstu z dokumentów i określonych fraz przy użyciu źródeł, takich jak kod, wyrażenia regularne lub wyszukiwanie.
Jeśli chcesz wyodrębnić te same pola z różnych dokumentów ustrukturyzowanych, częściowo ustrukturyzowanych i nieustrukturyzowanych, rozważ użycie niestandardowego modelu neuronowego uczenia głębokiego. Dowiedz się więcej o różnicach między niestandardowym modelem szablonu a niestandardowym modelem neuronowym.
Analizowanie dokumentu przy użyciu modeli złożonych jest identyczne z analizowaniem dokumentu przy użyciu jednego modelu. Wynik
Analyze Document
zwraca właściwość wskazującądocType
, które z modeli składników wybranych do analizowania dokumentu.Operacja
model compose
jest obecnie dostępna tylko dla modeli niestandardowych wytrenowanych za pomocą etykiet.
Zgodność modelu złożonego
Niestandardowy typ modelu | Modele trenowane przy użyciu wersji 2.1 i 2.0 | Szablon niestandardowy i modele neuronowe w wersji 3.1 i 3.0 | Szablon niestandardowy i modele neuronowe w wersji 4.0 (wersja zapoznawcza) | Niestandardowe modele generowania w wersji 4.0 (wersja zapoznawcza) |
---|---|---|---|---|
Modele trenowane przy użyciu wersji 2.1 i 2.0 | Nieobsługiwany | Nieobsługiwany | Nieobsługiwany | Nieobsługiwany |
Szablon niestandardowy i modele neuronowe w wersji 3.0 i 3.1 | Nieobsługiwany | Obsługiwane | Obsługiwane | Nieobsługiwany |
Szablon niestandardowy i modele neuronowe w wersji 4.0 (wersja zapoznawcza) | Nieobsługiwany | Obsługiwane | Obsługiwane | Nieobsługiwany |
Niestandardowe modele generowania w wersji 4.0 (wersja zapoznawcza) | Nieobsługiwany | Nieobsługiwany | Nieobsługiwany | Nieobsługiwany |
Aby utworzyć model wytrenowany przy użyciu wcześniejszej wersji interfejsu API (wersja 2.1 lub starsza), wytrenuj model przy użyciu interfejsu API w wersji 3.0 przy użyciu tego samego oznaczonego zestawu danych. Ten dodatek gwarantuje, że model w wersji 2.1 może składać się z innych modeli.
W przypadku modeli skomponowanych przy użyciu wersji 2.1 interfejsu API nadal są obsługiwane, nie wymagając aktualizacji.
Opcje programowania
Analiza dokumentów w wersji 4.0:2024-07-31-preview obsługuje następujące narzędzia, aplikacje i biblioteki:
Funkcja | Zasoby |
---|---|
Model niestandardowy | • Document Intelligence Studio• REST API • C# SDK• Java SDK • JavaScript SDK • Python SDK |
Skomponowany model | • Document Intelligence Studio• REST API • C# SDK• Java SDK • JavaScript SDK • Python SDK |
Analiza dokumentów w wersji 3.1:2023-07-31 (GA) obsługuje następujące narzędzia, aplikacje i biblioteki:
Funkcja | Zasoby |
---|---|
Model niestandardowy | • Document Intelligence Studio• REST API • C# SDK• Java SDK • JavaScript SDK • Python SDK |
Skomponowany model | • Document Intelligence Studio• REST API • C# SDK• Java SDK • JavaScript SDK • Python SDK |
Analiza dokumentów w wersji 3.0:2022-08-31 (GA) obsługuje następujące narzędzia, aplikacje i biblioteki:
Funkcja | Zasoby |
---|---|
Model niestandardowy | • Document Intelligence Studio• REST API • C# SDK• Java SDK • JavaScript SDK • Python SDK |
Skomponowany model | • Document Intelligence Studio• REST API • C# SDK• Java SDK • JavaScript SDK • Python SDK |
Analiza dokumentów w wersji 2.1 obsługuje następujące zasoby:
Funkcja | Zasoby |
---|---|
Model niestandardowy | • Narzędzie do etykietowania analizy dokumentów• Interfejs API REST• Zestaw SDK biblioteki klienta• Kontener docker analizy dokumentów |
Skomponowany model | • Narzędzie do etykietowania analizy dokumentów• Interfejs API REST• Zestaw SDK języka C#• Zestaw Java SDK • Zestaw SDK języka JavaScript • Zestaw SDK języka Python |
Następne kroki
Dowiedz się, jak tworzyć i tworzyć modele niestandardowe: