Niestandardowy model szablonu analizy dokumentów
Ważne
- Publiczne wersje zapoznawcze analizy dokumentów zapewniają wczesny dostęp do funkcji, które są aktywnie opracowywane. Funkcje, podejścia i procesy mogą ulec zmianie przed ogólną dostępnością na podstawie opinii użytkowników.
- Publiczna wersja zapoznawcza bibliotek klienckich analizy dokumentów jest domyślna dla interfejsu API REST w wersji 2024-07-31-preview.
- Publiczna wersja zapoznawcza 2024-07-31-preview jest obecnie dostępna tylko w następujących regionach świadczenia usługi Azure. Należy pamiętać, że niestandardowy model generowania (wyodrębniania pól dokumentów) w programie AI Studio jest dostępny tylko w regionie Północno-środkowe stany USA:
- Wschodnie stany USA
- Zachodnie stany USA 2
- Europa Zachodnia
- Północno-środkowe stany USA
Ta zawartość dotyczy: v4.0 (wersja zapoznawcza) | Poprzednie wersje: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Ta zawartość dotyczy: wersja 3.1 (GA)Najnowsza wersja: v4.0 (wersja zapoznawcza) | | Poprzednie wersje: v3.0 v2.1
Ta zawartość dotyczy: wersja 3.0 (GA) | Najnowsze wersje: wersja 4.0 (wersja zapoznawcza) 3.1 | Poprzednia wersja: wersja 2.1
Ta zawartość dotyczy: wersja 2.1 | Najnowsza wersja: wersja 4.0 (wersja zapoznawcza)
Szablon niestandardowy (dawniej formularz niestandardowy) to łatwy do wytrenowania model dokumentu, który dokładnie wyodrębnia pary klucz-wartość, znaczniki wyboru, tabele, regiony i podpisy z dokumentów. Modele szablonów używają wskazówek układu do wyodrębniania wartości z dokumentów i są odpowiednie do wyodrębniania pól z dokumentów o wysokiej strukturze za pomocą zdefiniowanych szablonów wizualizacji.
Niestandardowe modele szablonów mają taki sam format i strategię etykietowania, jak niestandardowe modele neuronowe, z obsługą większej liczby typów pól i języków.
Możliwości modelu
Niestandardowe modele szablonów obsługują pary klucz-wartość, znaczniki wyboru, tabele, pola podpisu i wybrane regiony.
Pola formularza | Znaczniki zaznaczenia | Pola tabelaryczne (tabele) | Podpis | Wybrane regiony | Nakładające się pola |
---|---|---|---|---|---|
Obsługiwane | Obsługiwane | Obsługiwane | Obsługiwane | Obsługiwane | Nieobsługiwane |
Pola tabelaryczne
Wraz z wydaniem wersji interfejsu API w wersji 3.0 lub nowszej niestandardowe modele szablonów dodają obsługę pól tabelarycznych (tabel) między stronami :
- Aby oznaczyć tabelę obejmującą wiele stron, należy oznaczyć każdy wiersz tabeli na różnych stronach w jednej tabeli.
- Najlepszym rozwiązaniem jest upewnienie się, że zestaw danych zawiera kilka przykładów oczekiwanych odmian. Na przykład uwzględnij przykłady, w których cała tabela znajduje się na jednej stronie i gdzie tabele obejmują co najmniej dwie strony, jeśli spodziewasz się zobaczyć te odmiany w dokumentach.
Pola tabelaryczne są również przydatne podczas wyodrębniania powtarzających się informacji w dokumencie, który nie jest rozpoznawany jako tabela. Na przykład powtarzające się sekcje środowisk roboczych w wznowieniu można oznaczyć i wyodrębnić jako pole tabelaryczne.
Obsługa odmian
Modele szablonów opierają się na zdefiniowanym szablonie wizualnym, a zmiany w szablonie skutkuje niższą dokładnością. W tych przypadkach podziel zestaw danych trenowania, aby uwzględnić co najmniej pięć próbek każdego szablonu i wytrenować model dla każdej odmiany. Następnie możesz utworzyć modele w jednym punkcie końcowym. W przypadku subtelnych odmian, takich jak cyfrowe dokumenty PDF i obrazy, najlepiej uwzględnić co najmniej pięć przykładów każdego typu w tym samym zestawie danych treningowych.
Wymagania dotyczące danych wejściowych
Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.
Obsługiwane formaty plików:
Model PDF Obraz:
JPEG/JPG
,PNG
,BMP
, ,TIFF
HEIF
Microsoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) i HTMLPrzeczytaj ✔ ✔ ✔ Układ ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview lub nowszy) Dokument ogólny ✔ ✔ Wstępnie utworzona ✔ ✔ Niestandardowy ✔ ✔ ✱ Pliki pakietu Microsoft Office nie są obecnie obsługiwane w przypadku innych modeli lub wersji.
W przypadku plików PDF i TIFF można przetworzyć maksymalnie 2000 stron (w przypadku subskrypcji warstwy Bezpłatna przetwarzane są tylko pierwsze dwie strony).
Rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i 4 MB za bezpłatną (F0).
Wymiary obrazu muszą mieć od 50 x 50 pikseli do 10 000 pikseli x 10 000 pikseli.
Jeśli pliki PDF są zablokowane hasłem, przed ich przesłaniem usuń blokadę.
Minimalna wysokość tekstu do wyodrębnienia to 12 pikseli dla obrazu o rozmiarze 1024 x 768 pikseli. Ten wymiar odpowiada około
8
-point text na 150 kropek na cal (DPI
).W przypadku trenowania modelu niestandardowego maksymalna liczba stron dla danych szkoleniowych wynosi 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.
W przypadku trenowania niestandardowego modelu wyodrębniania łączny rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i 1G-MB dla modelu neuronowego.
W przypadku trenowania niestandardowego modelu klasyfikacji całkowity rozmiar danych treningowych wynosi
1GB
maksymalnie 10 000 stron.
Trenowanie modelu
Modele szablonów niestandardowych są ogólnie dostępne, począwszy od interfejsu API w wersji 2.0 i nowszych wersji. Jeśli zaczynasz od nowego projektu lub masz istniejący zestaw danych z etykietą, użyj interfejsu API w wersji 3.1 lub 3.0 z programem Document Intelligence Studio, aby wytrenować niestandardowy model szablonu.
Model | Interfejs API REST | SDK | Etykietowanie i testowanie modeli |
---|---|---|---|
Szablon niestandardowy | Interfejs API w wersji 3.1 | Zestaw SDK analizy dokumentów | Document Intelligence Studio |
W przypadku interfejsów API w wersji 3.0 lub nowszej operacja kompilacji do trenowania modelu obsługuje nową buildMode
właściwość, aby wytrenować niestandardowy model szablonu, ustaw wartość buildMode
template
na .
https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-07-31-preview
{
"modelId": "string",
"description": "string",
"buildMode": "template",
"azureBlobSource":
{
"containerUrl": "string",
"prefix": "string"
}
}
Niestandardowe modele szablonów są ogólnie dostępne za pomocą interfejsu API w wersji 3.1. Jeśli zaczynasz od nowego projektu lub masz istniejący zestaw danych z etykietą, użyj interfejsu API w wersji 3.1 lub 3.0 z programem Document Intelligence Studio, aby wytrenować niestandardowy model szablonu.
Model | Interfejs API REST | SDK | Etykietowanie i testowanie modeli |
---|---|---|---|
Szablon niestandardowy | Interfejs API w wersji 3.1 | Zestaw SDK analizy dokumentów | Document Intelligence Studio |
W przypadku interfejsów API w wersji 3.0 lub nowszej operacja kompilacji do trenowania modelu obsługuje nową buildMode
właściwość, aby wytrenować niestandardowy model szablonu, ustaw wartość buildMode
template
na .
https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31
{
"modelId": "string",
"description": "string",
"buildMode": "template",
"azureBlobSource":
{
"containerUrl": "string",
"prefix": "string"
}
}
Obsługiwane języki i ustawienia regionalne
Zobacz naszą stronę Obsługa języków — modele niestandardowe, aby uzyskać pełną listę obsługiwanych języków.
Niestandardowe (szablon) modele są ogólnie dostępne za pomocą interfejsu API w wersji 2.1.
Model | Interfejs API REST | SDK | Etykietowanie i testowanie modeli |
---|---|---|---|
Model niestandardowy (szablon) | Analiza dokumentów 2.1 | Zestaw SDK analizy dokumentów | Narzędzie do etykietowania przykładu analizy dokumentów |
Następne kroki
Dowiedz się, jak tworzyć i tworzyć modele niestandardowe: