Niestandardowy model szablonu analizy dokumentów

Artykuł
10/16/2024

Ważne

Publiczne wersje zapoznawcze analizy dokumentów zapewniają wczesny dostęp do funkcji, które są aktywnie opracowywane. Funkcje, podejścia i procesy mogą ulec zmianie przed ogólną dostępnością na podstawie opinii użytkowników.
Publiczna wersja zapoznawcza bibliotek klienckich analizy dokumentów jest domyślna dla interfejsu API REST w wersji 2024-07-31-preview.
Publiczna wersja zapoznawcza 2024-07-31-preview jest obecnie dostępna tylko w następujących regionach świadczenia usługi Azure. Należy pamiętać, że niestandardowy model generowania (wyodrębniania pól dokumentów) w programie AI Studio jest dostępny tylko w regionie Północno-środkowe stany USA:
- Wschodnie stany USA
- Zachodnie stany USA 2
- Europa Zachodnia
- Północno-środkowe stany USA

Ta zawartość dotyczy: v4.0 (wersja zapoznawcza) | Poprzednie wersje: v3.1 (GA) v3.0 (GA) v2.1 (GA)

Ta zawartość dotyczy: wersja 3.1 (GA)Najnowsza wersja: v4.0 (wersja zapoznawcza) | | Poprzednie wersje: v3.0 v2.1

Ta zawartość dotyczy: wersja 3.0 (GA) | Najnowsze wersje: wersja 4.0 (wersja zapoznawcza) 3.1 | Poprzednia wersja: wersja 2.1

Ta zawartość dotyczy: wersja 2.1 | Najnowsza wersja: wersja 4.0 (wersja zapoznawcza)

Szablon niestandardowy (dawniej formularz niestandardowy) to łatwy do wytrenowania model dokumentu, który dokładnie wyodrębnia pary klucz-wartość, znaczniki wyboru, tabele, regiony i podpisy z dokumentów. Modele szablonów używają wskazówek układu do wyodrębniania wartości z dokumentów i są odpowiednie do wyodrębniania pól z dokumentów o wysokiej strukturze za pomocą zdefiniowanych szablonów wizualizacji.

Niestandardowe modele szablonów mają taki sam format i strategię etykietowania, jak niestandardowe modele neuronowe, z obsługą większej liczby typów pól i języków.

Możliwości modelu

Niestandardowe modele szablonów obsługują pary klucz-wartość, znaczniki wyboru, tabele, pola podpisu i wybrane regiony.

Pola formularza	Znaczniki zaznaczenia	Pola tabelaryczne (tabele)	Podpis	Wybrane regiony	Nakładające się pola
Obsługiwane	Obsługiwane	Obsługiwane	Obsługiwane	Obsługiwane	Nieobsługiwane

Pola tabelaryczne

Wraz z wydaniem wersji interfejsu API w wersji 3.0 lub nowszej niestandardowe modele szablonów dodają obsługę pól tabelarycznych (tabel) między stronami :

Aby oznaczyć tabelę obejmującą wiele stron, należy oznaczyć każdy wiersz tabeli na różnych stronach w jednej tabeli.
Najlepszym rozwiązaniem jest upewnienie się, że zestaw danych zawiera kilka przykładów oczekiwanych odmian. Na przykład uwzględnij przykłady, w których cała tabela znajduje się na jednej stronie i gdzie tabele obejmują co najmniej dwie strony, jeśli spodziewasz się zobaczyć te odmiany w dokumentach.

Pola tabelaryczne są również przydatne podczas wyodrębniania powtarzających się informacji w dokumencie, który nie jest rozpoznawany jako tabela. Na przykład powtarzające się sekcje środowisk roboczych w wznowieniu można oznaczyć i wyodrębnić jako pole tabelaryczne.

Obsługa odmian

Modele szablonów opierają się na zdefiniowanym szablonie wizualnym, a zmiany w szablonie skutkuje niższą dokładnością. W tych przypadkach podziel zestaw danych trenowania, aby uwzględnić co najmniej pięć próbek każdego szablonu i wytrenować model dla każdej odmiany. Następnie możesz utworzyć modele w jednym punkcie końcowym. W przypadku subtelnych odmian, takich jak cyfrowe dokumenty PDF i obrazy, najlepiej uwzględnić co najmniej pięć przykładów każdego typu w tym samym zestawie danych treningowych.

Wymagania dotyczące danych wejściowych

Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.

Obsługiwane formaty plików:

Model	PDF	Obraz: J`PEG/JPG`, `PNG`, `BMP`, , `TIFFHEIF`	Microsoft Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX) i HTML
Przeczytaj	✔	✔	✔
Układ	✔	✔	✔ (2024-02-29-preview, 2023-10-31-preview lub nowszy)
Dokument ogólny	✔	✔
Wstępnie utworzona	✔	✔
Niestandardowy	✔	✔

✱ Pliki pakietu Microsoft Office nie są obecnie obsługiwane w przypadku innych modeli lub wersji.

W przypadku plików PDF i TIFF można przetworzyć maksymalnie 2000 stron (w przypadku subskrypcji warstwy Bezpłatna przetwarzane są tylko pierwsze dwie strony).
Rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i 4 MB za bezpłatną (F0).
Wymiary obrazu muszą mieć od 50 x 50 pikseli do 10 000 pikseli x 10 000 pikseli.
Jeśli pliki PDF są zablokowane hasłem, przed ich przesłaniem usuń blokadę.
Minimalna wysokość tekstu do wyodrębnienia to 12 pikseli dla obrazu o rozmiarze 1024 x 768 pikseli. Ten wymiar odpowiada około 8-point text na 150 kropek na cal (DPI).
W przypadku trenowania modelu niestandardowego maksymalna liczba stron dla danych szkoleniowych wynosi 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.
W przypadku trenowania niestandardowego modelu wyodrębniania łączny rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i 1G-MB dla modelu neuronowego.
W przypadku trenowania niestandardowego modelu klasyfikacji całkowity rozmiar danych treningowych wynosi 1GB maksymalnie 10 000 stron.

Trenowanie modelu

Modele szablonów niestandardowych są ogólnie dostępne, począwszy od interfejsu API w wersji 2.0 i nowszych wersji. Jeśli zaczynasz od nowego projektu lub masz istniejący zestaw danych z etykietą, użyj interfejsu API w wersji 3.1 lub 3.0 z programem Document Intelligence Studio, aby wytrenować niestandardowy model szablonu.

Model	Interfejs API REST	SDK	Etykietowanie i testowanie modeli
Szablon niestandardowy	Interfejs API w wersji 3.1	Zestaw SDK analizy dokumentów	Document Intelligence Studio

W przypadku interfejsów API w wersji 3.0 lub nowszej operacja kompilacji do trenowania modelu obsługuje nową buildMode właściwość, aby wytrenować niestandardowy model szablonu, ustaw wartość buildMode templatena .

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-07-31-preview


{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Niestandardowe modele szablonów są ogólnie dostępne za pomocą interfejsu API w wersji 3.1. Jeśli zaczynasz od nowego projektu lub masz istniejący zestaw danych z etykietą, użyj interfejsu API w wersji 3.1 lub 3.0 z programem Document Intelligence Studio, aby wytrenować niestandardowy model szablonu.

Model	Interfejs API REST	SDK	Etykietowanie i testowanie modeli
Szablon niestandardowy	Interfejs API w wersji 3.1	Zestaw SDK analizy dokumentów	Document Intelligence Studio

https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Obsługiwane języki i ustawienia regionalne

Zobacz naszą stronę Obsługa języków — modele niestandardowe, aby uzyskać pełną listę obsługiwanych języków.

Niestandardowe (szablon) modele są ogólnie dostępne za pomocą interfejsu API w wersji 2.1.

Model	Interfejs API REST	SDK	Etykietowanie i testowanie modeli
Model niestandardowy (szablon)	Analiza dokumentów 2.1	Zestaw SDK analizy dokumentów	Narzędzie do etykietowania przykładu analizy dokumentów

Następne kroki

Dowiedz się, jak tworzyć i tworzyć modele niestandardowe:

Tworzenie niestandardowego modelu Tworzenie modeliniestandardowych

Udostępnij za pośrednictwem