Dokumentinformationskontraktmodell
Viktigt!
- Versioner av den offentliga förhandsversionen av Document Intelligence ger tidig åtkomst till funktioner som är i aktiv utveckling.
- Funktioner, metoder och processer kan ändras, före allmän tillgänglighet (GA), baserat på användarfeedback.
- Den offentliga förhandsversionen av Dokumentinformationsklientbiblioteken är som standard REST API version 2024-02-29-preview.
- Förhandsversion 2024-02-29-preview är för närvarande endast tillgänglig i följande Azure-regioner:
- USA, östra
- USA, västra 2
- Europa, västra
Det här innehållet gäller för:v4.0 (förhandsversion) | Tidigare version:v3.1 (GA)
Det här innehållet gäller för:v3.1 (GA) | Senaste version:v4.0 (förhandsversion)
Kontraktsmodellen för dokumentinformation använder kraftfulla OCR-funktioner (Optisk teckenigenkänning) för att analysera och extrahera nyckelfält och radobjekt från en utvald grupp med viktiga kontraktentiteter. Kontrakt kan ha olika format och kvalitet, inklusive telefonbilder, skannade dokument och digitala PDF-filer. API:et analyserar dokumenttext; extraherar viktig information såsom parter, jurisdiktioner, kontrakts-ID och titel; och returnerar en strukturerad JSON-datarepresentation. Modellen stöder för närvarande engelskspråkiga dokumentformat.
Automatiserad kontraktsbearbetning
Automatiserad kontraktsbearbetning är processen för att extrahera viktiga kontraktfält från dokument. Tidigare har kontraktanalysprocessen uppnåtts manuellt och därmed mycket tidskrävande. Korrekt extrahering av viktiga data från kontrakt är vanligtvis det första och ett av de mest kritiska stegen i kontraktautomatiseringsprocessen.
Utvecklingsalternativ
Document Intelligence v4.0 (2024-02-29-preview) stöder följande verktyg, program och bibliotek:
Funktion | Resurser | Model ID |
---|---|---|
Kontraktsmodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-contract |
Document Intelligence v3.1 stöder följande verktyg, program och bibliotek:
Funktion | Resurser | Model ID |
---|---|---|
Kontraktsmodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-contract |
Document Intelligence v3.0 stöder följande verktyg, program och bibliotek:
Funktion | Resurser | Model ID |
---|---|---|
Kontraktsmodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-contract |
Indatakrav
För bästa resultat anger du ett tydligt foto eller en genomsökning av hög kvalitet per dokument.
Filformat som stöds:
Modell PDF Bild:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) och HTMLLäsa ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Allmänt dokument ✔ ✔ Inbyggda ✔ ✔ Anpassad extrahering ✔ ✔ Anpassad klassificering ✔ ✔ ✔ (2024-02-29-preview) För PDF och TIFF kan upp till 2 000 sidor bearbetas (med en kostnadsfri nivåprenumeration bearbetas endast de två första sidorna).
Filstorleken för att analysera dokument är 500 MB för den betalda nivån (S0) och 4 MB för den kostnadsfria nivån (F0).
Bilddimensionerna måste vara mellan 50 x 50 bildpunkter och 10 000 px x 10 000 bildpunkter.
Om dina PDF-filer är låsta med lösenord måste du ta bort låset innan du skickar filerna.
Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar ungefär
8
-punkttext vid 150 punkter per tum (DPI).För anpassad modellträning är det maximala antalet sidor för träningsdata 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.
För anpassad extraheringsmodellträning är den totala storleken på träningsdata 50 MB för mallmodellen och 1G-MB för den neurala modellen.
För anpassad klassificeringsmodellträning är
1GB
den totala storleken på träningsdata med högst 10 000 sidor.
Prova extrahering av kontraktsdokumentdata
Se hur data, inklusive kundinformation, leverantörsinformation och radobjekt, extraheras från kontrakt. Du behöver följande resurser:
En Azure-prenumeration – du kan skapa en kostnadsfritt.
En instans av dokumentinformation i Azure-portalen. Du kan använda den kostnadsfria prisnivån (
F0
) för att prova tjänsten. När resursen har distribuerats väljer du Gå till resurs för att hämta din nyckel och slutpunkt.
Document Intelligence Studio
På startsidan för Document Intelligence Studio väljer du Skattedokument.
Du kan analysera exempelskattedokumenten eller ladda upp dina egna filer.
Välj knappen Kör analys och konfigurera vid behov alternativen Analysera:
Språk och nationella inställningar som stöds
Se sidan Språkstöd – fördefinierade modeller för en fullständig lista över språk som stöds.
Fältextrahering
Följande är fälten som extraheras från ett kontrakt i JSON-utdatasvaret.
Namn | Type | Beskrivning | Exempel på utdata |
---|---|---|---|
Rubrik | String | Kontraktstitel | Serviceavtal |
ContractId | String | Kontraktstitel | AB12956 |
Parterna | Matris | Lista över juridiska parter | |
ExecutionDate | Datum | Datum då avtalet undertecknades fullständigt och avtalades av alla parter | On this twenty-third day of February two thousand and twenty two |
ExpirationDate | Datum | Datum då kontraktet upphör att gälla | Ett år |
RenewalDate | Datum | Datum då kontraktet måste förnyas | On this twenty-third day of February two thousand and twenty two |
Jurisdiktioner | Matris | Lista över jurisdiktioner |
Kontraktnyckel/värde-par och radobjekt som extraheras finns i documentResults
avsnittet i JSON-utdata.
Nästa steg
Prova att bearbeta dina egna formulär och dokument med Document Intelligence Studio.
Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.