Anpassad mallmodell för Dokumentinformation
Viktigt!
- Versioner av den offentliga förhandsversionen av Document Intelligence ger tidig åtkomst till funktioner som är i aktiv utveckling. Funktioner, metoder och processer kan ändras, före allmän tillgänglighet (GA), baserat på användarfeedback.
- Den offentliga förhandsversionen av Dokumentinformationsklientbiblioteken är som standard REST API version 2024-07-31-preview.
- Den offentliga förhandsversionen 2024-07-31-preview är för närvarande endast tillgänglig i följande Azure-regioner. Observera att modellen för anpassad generativ (extrahering av dokumentfält) i AI Studio endast är tillgänglig i regionen USA, norra centrala:
- USA, östra
- USA, västra 2
- Europa, västra
- USA, norra centrala
Det här innehållet gäller för: v4.0 (förhandsversion) | Tidigare versioner: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Det här innehållet gäller för: v3.1 (GA) | Senaste version: v4.0 (förhandsversion) | Tidigare versioner: v3.0 v2.1
Det här innehållet gäller för: v3.0 (GA) | Senaste versioner: v4.0 (förhandsversion) v3.1 | Tidigare version: v2.1
Det här innehållet gäller för: v2.1 | Senaste version: v4.0 (förhandsversion)
Anpassad mall (tidigare anpassat formulär) är en lätttränad dokumentmodell som korrekt extraherar etiketterade nyckel/värde-par, urvalsmarkeringar, tabeller, regioner och signaturer från dokument. Mallmodeller använder layouttips för att extrahera värden från dokument och är lämpliga för att extrahera fält från mycket strukturerade dokument med definierade visuella mallar.
Anpassade mallmodeller har samma etikettformat och strategi som anpassade neurala modeller, med stöd för fler fälttyper och språk.
Modellfunktioner
Anpassade mallmodeller stöder nyckel/värde-par, markeringsmarkeringar, tabeller, signaturfält och valda regioner.
Formulärfält | Markeringsmarkeringar | Tabellfält (tabeller) | Signatur | Valda regioner | Överlappande fält |
---|---|---|---|---|---|
Stöds | Stöds | Stöds | Stöds | Stöds | Stöds inte |
Tabellfält
Med versionen av API-versionerna v3.0 och senare lägger anpassade mallmodeller till stöd för tabellfält mellan sidor (tabeller):
- Om du vill märka en tabell som sträcker sig över flera sidor etiketterar du varje rad i tabellen på de olika sidorna i en enda tabell.
- Vi rekommenderar att du ser till att datamängden innehåller några exempel på de förväntade variationerna. Ta till exempel med exempel där hela tabellen finns på en enda sida och där tabeller sträcker sig över två eller flera sidor om du förväntar dig att se dessa variationer i dokument.
Tabellfält är också användbara när du extraherar upprepad information i ett dokument som inte känns igen som en tabell. Till exempel kan ett upprepat avsnitt av arbetsupplevelser i ett CV märkas och extraheras som ett tabellfält.
Hantera variationer
Mallmodeller förlitar sig på en definierad mall för visuellt objekt, ändringar i mallen resulterar i lägre noggrannhet. I dessa fall delar du upp din träningsdatauppsättning så att den innehåller minst fem exempel på varje mall och tränar en modell för var och en av varianterna. Du kan sedan skapa modellerna i en enda slutpunkt. För subtila variationer, till exempel digitala PDF-dokument och bilder, är det bäst att inkludera minst fem exempel av varje typ i samma träningsdatauppsättning.
Indatakrav
För bästa resultat anger du ett tydligt foto eller en genomsökning av hög kvalitet per dokument.
Filformat som stöds:
Modell PDF Bild:
JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
Microsoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) och HTMLLästa ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview eller senare) Allmänt dokument ✔ ✔ Inbyggda ✔ ✔ Anpassat ✔ ✔ ✱ Microsoft Office-filer stöds för närvarande inte för andra modeller eller versioner.
För PDF och TIFF kan upp till 2 000 sidor bearbetas (med en prenumeration på den kostnadsfria nivån bearbetas endast de två första sidorna).
Filstorleken för att analysera dokument är 500 MB för den betalda nivån (S0) och 4 MB för den kostnadsfria nivån (F0).
Bilddimensionerna måste vara mellan 50 x 50 bildpunkter och 10 000 px x 10 000 bildpunkter.
Om dina PDF-filer är låsta med lösenord måste du ta bort låset innan du skickar filerna.
Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar ungefär
8
-punkttext vid 150 punkter per tum (DPI
).För anpassad modellträning är det maximala antalet sidor för träningsdata 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.
För anpassad extraheringsmodellträning är den totala storleken på träningsdata 50 MB för mallmodellen och 1G-MB för den neurala modellen.
För anpassad klassificeringsmodellträning är
1GB
den totala storleken på träningsdata med högst 10 000 sidor.
Träna en modell
Anpassade mallmodeller är allmänt tillgängliga från och med v2.0 API och senare versioner. Om du börjar med ett nytt projekt eller har en befintlig etiketterad datauppsättning använder du API:et v3.1 eller v3.0 med Document Intelligence Studio för att träna en anpassad mallmodell.
Modell | REST API | SDK | Etikett- och testmodeller |
---|---|---|---|
Anpassad mall | v3.1 API | SDK för dokumentinformation | Document Intelligence Studio |
Med api:erna v3.0 och senare stöder byggåtgärden för att träna modellen en ny buildMode
egenskap. Om du vill träna en anpassad mallmodell anger du buildMode
till template
.
https://{endpoint}/documentintelligence/documentModels:build?api-version=2024-07-31-preview
{
"modelId": "string",
"description": "string",
"buildMode": "template",
"azureBlobSource":
{
"containerUrl": "string",
"prefix": "string"
}
}
Anpassade mallmodeller är allmänt tillgängliga med v3.1-API:et. Om du börjar med ett nytt projekt eller har en befintlig etiketterad datauppsättning använder du API:et v3.1 eller v3.0 med Document Intelligence Studio för att träna en anpassad mallmodell.
Modell | REST API | SDK | Etikett- och testmodeller |
---|---|---|---|
Anpassad mall | v3.1 API | SDK för dokumentinformation | Document Intelligence Studio |
Med api:erna v3.0 och senare stöder byggåtgärden för att träna modellen en ny buildMode
egenskap. Om du vill träna en anpassad mallmodell anger du buildMode
till template
.
https://{endpoint}/formrecognizer/documentModels:build?api-version=2023-07-31
{
"modelId": "string",
"description": "string",
"buildMode": "template",
"azureBlobSource":
{
"containerUrl": "string",
"prefix": "string"
}
}
Språk och nationella inställningar som stöds
Se sidan Språkstöd – anpassade modeller för en fullständig lista över språk som stöds.
Anpassade modeller (mall) är allmänt tillgängliga med v2.1-API:et.
Modell | REST API | SDK | Etikett- och testmodeller |
---|---|---|---|
Anpassad modell (mall) | Dokumentinformation 2.1 | SDK för dokumentinformation | Exempeletikettverktyg för dokumentinformation |
Nästa steg
Lär dig hur du skapar och skapar anpassade modeller: