Udostępnij za pośrednictwem


Niestandardowy model szablonu analizy dokumentów

Ważne

  • Publiczne wersje zapoznawcze analizy dokumentów zapewniają wczesny dostęp do funkcji, które są aktywnie opracowywane. Funkcje, podejścia i procesy mogą ulec zmianie przed ogólną dostępnością na podstawie opinii użytkowników.
  • Publiczna wersja zapoznawcza bibliotek klienckich analizy dokumentów jest domyślna dla interfejsu API REST w wersji 2024-07-31-preview.
  • Publiczna wersja zapoznawcza 2024-07-31-preview jest obecnie dostępna tylko w następujących regionach świadczenia usługi Azure. Należy pamiętać, że niestandardowy model generowania (wyodrębniania pól dokumentów) w programie AI Studio jest dostępny tylko w regionie Północno-środkowe stany USA:
    • Wschodnie stany USA
    • Zachodnie stany USA 2
    • Europa Zachodnia
    • Północno-środkowe stany USA

Ta zawartość dotyczy:Znacznik v4.0 (wersja zapoznawcza) | Poprzednie wersje: niebieski znacznik wyboru v3.1 (GA) v3.0 (GA) niebieski znacznik wyboru v2.1 (GA) niebieski znacznik wyboru

Ta zawartość dotyczy: wersja 3.1 (GA)Najnowsza wersja:Znacznik purpurowy znacznik wyboru v4.0 (wersja zapoznawcza) | | Poprzednie wersje: niebieski znacznik wyboru v3.0niebieski znacznik wyboru v2.1

Ta zawartość dotyczy: Znacznik wersja 3.0 (GA) | Najnowsze wersje: purpurowy znacznik wyboru wersja 4.0 (wersja zapoznawcza) purpurowy znacznik wyboru 3.1 | Poprzednia wersja: niebieski znacznik wyboru wersja 2.1

Ta zawartość dotyczy: Znacznik wersja 2.1 | Najnowsza wersja: niebieski znacznik wyboru wersja 4.0 (wersja zapoznawcza)

Szablon niestandardowy (dawniej formularz niestandardowy) to łatwy do wytrenowania model dokumentu, który dokładnie wyodrębnia pary klucz-wartość, znaczniki wyboru, tabele, regiony i podpisy z dokumentów. Modele szablonów używają wskazówek układu do wyodrębniania wartości z dokumentów i są odpowiednie do wyodrębniania pól z dokumentów o wysokiej strukturze za pomocą zdefiniowanych szablonów wizualizacji.

Niestandardowe modele szablonów mają taki sam format i strategię etykietowania, jak niestandardowe modele neuronowe, z obsługą większej liczby typów pól i języków.

Możliwości modelu

Niestandardowe modele szablonów obsługują pary klucz-wartość, znaczniki wyboru, tabele, pola podpisu i wybrane regiony.

Pola formularza Znaczniki zaznaczenia Pola tabelaryczne (tabele) Podpis Wybrane regiony Nakładające się pola
Obsługiwane Obsługiwane Obsługiwane Obsługiwane Obsługiwane Nieobsługiwane

Pola tabelaryczne

Wraz z wydaniem wersji interfejsu API w wersji 3.0 lub nowszej niestandardowe modele szablonów dodają obsługę pól tabelarycznych (tabel) między stronami :

  • Aby oznaczyć tabelę obejmującą wiele stron, należy oznaczyć każdy wiersz tabeli na różnych stronach w jednej tabeli.
  • Najlepszym rozwiązaniem jest upewnienie się, że zestaw danych zawiera kilka przykładów oczekiwanych odmian. Na przykład uwzględnij przykłady, w których cała tabela znajduje się na jednej stronie i gdzie tabele obejmują co najmniej dwie strony, jeśli spodziewasz się zobaczyć te odmiany w dokumentach.

Pola tabelaryczne są również przydatne podczas wyodrębniania powtarzających się informacji w dokumencie, który nie jest rozpoznawany jako tabela. Na przykład powtarzające się sekcje środowisk roboczych w wznowieniu można oznaczyć i wyodrębnić jako pole tabelaryczne.

Obsługa odmian

Modele szablonów opierają się na zdefiniowanym szablonie wizualnym, a zmiany w szablonie skutkuje niższą dokładnością. W tych przypadkach podziel zestaw danych trenowania, aby uwzględnić co najmniej pięć próbek każdego szablonu i wytrenować model dla każdej odmiany. Następnie możesz utworzyć modele w jednym punkcie końcowym. W przypadku subtelnych odmian, takich jak cyfrowe dokumenty PDF i obrazy, najlepiej uwzględnić co najmniej pięć przykładów każdego typu w tym samym zestawie danych treningowych.

Wymagania dotyczące danych wejściowych

  • Aby uzyskać najlepsze wyniki, podaj jedno jasne zdjęcie lub wysokiej jakości skanowanie na dokument.

  • Obsługiwane formaty plików:

    Model PDF Obraz:
    JPEG/JPG, PNG, BMP, , TIFFHEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) i HTML
    Przeczytaj
    Układ ✔ (2024-02-29-preview, 2023-10-31-preview lub nowszy)
    Dokument ogólny
    Wstępnie utworzona
    Niestandardowy

    ✱ Pliki pakietu Microsoft Office nie są obecnie obsługiwane w przypadku innych modeli lub wersji.

  • W przypadku plików PDF i TIFF można przetworzyć maksymalnie 2000 stron (w przypadku subskrypcji warstwy Bezpłatna przetwarzane są tylko pierwsze dwie strony).

  • Rozmiar pliku do analizowania dokumentów wynosi 500 MB dla warstwy płatnej (S0) i 4 MB za bezpłatną (F0).

  • Wymiary obrazu muszą mieć od 50 x 50 pikseli do 10 000 pikseli x 10 000 pikseli.

  • Jeśli pliki PDF są zablokowane hasłem, przed ich przesłaniem usuń blokadę.

  • Minimalna wysokość tekstu do wyodrębnienia to 12 pikseli dla obrazu o rozmiarze 1024 x 768 pikseli. Ten wymiar odpowiada około 8-point text na 150 kropek na cal (DPI).

  • W przypadku trenowania modelu niestandardowego maksymalna liczba stron dla danych szkoleniowych wynosi 500 dla niestandardowego modelu szablonu i 50 000 dla niestandardowego modelu neuronowego.

  • W przypadku trenowania niestandardowego modelu wyodrębniania łączny rozmiar danych treningowych wynosi 50 MB dla modelu szablonu i 1G-MB dla modelu neuronowego.

  • W przypadku trenowania niestandardowego modelu klasyfikacji całkowity rozmiar danych treningowych wynosi 1GB maksymalnie 10 000 stron.

Trenowanie modelu

Modele szablonów niestandardowych są ogólnie dostępne, począwszy od interfejsu API w wersji 2.0 i nowszych wersji. Jeśli zaczynasz od nowego projektu lub masz istniejący zestaw danych z etykietą, użyj interfejsu API w wersji 3.1 lub 3.0 z programem Document Intelligence Studio, aby wytrenować niestandardowy model szablonu.

Model Interfejs API REST SDK Etykietowanie i testowanie modeli
Szablon niestandardowy Interfejs API w wersji 3.1 Zestaw SDK analizy dokumentów Document Intelligence Studio

W przypadku interfejsów API w wersji 3.0 lub nowszej operacja kompilacji do trenowania modelu obsługuje nową buildMode właściwość, aby wytrenować niestandardowy model szablonu, ustaw wartość buildMode templatena .

https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-07-31-preview


{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Niestandardowe modele szablonów są ogólnie dostępne za pomocą interfejsu API w wersji 3.1. Jeśli zaczynasz od nowego projektu lub masz istniejący zestaw danych z etykietą, użyj interfejsu API w wersji 3.1 lub 3.0 z programem Document Intelligence Studio, aby wytrenować niestandardowy model szablonu.

Model Interfejs API REST SDK Etykietowanie i testowanie modeli
Szablon niestandardowy Interfejs API w wersji 3.1 Zestaw SDK analizy dokumentów Document Intelligence Studio

W przypadku interfejsów API w wersji 3.0 lub nowszej operacja kompilacji do trenowania modelu obsługuje nową buildMode właściwość, aby wytrenować niestandardowy model szablonu, ustaw wartość buildMode templatena .

https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31

{
  "modelId": "string",
  "description": "string",
  "buildMode": "template",
  "azureBlobSource":
  {
    "containerUrl": "string",
    "prefix": "string"
  }
}

Obsługiwane języki i ustawienia regionalne

Zobacz naszą stronę Obsługa języków — modele niestandardowe, aby uzyskać pełną listę obsługiwanych języków.

Niestandardowe (szablon) modele są ogólnie dostępne za pomocą interfejsu API w wersji 2.1.

Model Interfejs API REST SDK Etykietowanie i testowanie modeli
Model niestandardowy (szablon) Analiza dokumentów 2.1 Zestaw SDK analizy dokumentów Narzędzie do etykietowania przykładu analizy dokumentów

Następne kroki

Dowiedz się, jak tworzyć i tworzyć modele niestandardowe: