Kvittomodell för dokumentinformation
Viktigt!
- Versioner av den offentliga förhandsversionen av Document Intelligence ger tidig åtkomst till funktioner som är i aktiv utveckling. Funktioner, metoder och processer kan ändras, före allmän tillgänglighet (GA), baserat på användarfeedback.
- Den offentliga förhandsversionen av Dokumentinformationsklientbiblioteken är som standard REST API version 2024-07-31-preview.
- Den offentliga förhandsversionen 2024-07-31-preview är för närvarande endast tillgänglig i följande Azure-regioner. Observera att modellen för anpassad generativ (extrahering av dokumentfält) i AI Studio endast är tillgänglig i regionen USA, norra centrala:
- USA, östra
- USA, västra 2
- Europa, västra
- USA, norra centrala
Det här innehållet gäller för: v4.0 (förhandsversion) | Tidigare versioner: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Det här innehållet gäller för: v3.1 (GA) | Senaste version: v4.0 (förhandsversion) | Tidigare versioner: v3.0 v2.1
Det här innehållet gäller för: v3.0 (GA) | Senaste versioner: v4.0 (förhandsversion) v3.1 | Tidigare version: v2.1
Det här innehållet gäller för: v2.1 | Senaste version: v4.0 (förhandsversion)
Kvittomodellen för dokumentinformation kombinerar kraftfulla OCR-funktioner (Optisk teckenigenkänning) med djupinlärningsmodeller för att analysera och extrahera viktig information från försäljningskvitton. Kvitton kan vara av olika format och kvalitet, inklusive tryckta och handskrivna kvitton. API:et extraherar viktig information som handelsnamn, handelstelefonnummer, transaktionsdatum, skatt och transaktionssumma och returnerar strukturerade JSON-data.
Kvittotyper som stöds:
- Termisk
- Kreditkort
- Bensin
- Parkering
- Hotell
- Transport
- Kommunikation
- Underhållning
- Flyg
- Utbildning
- Apotek/Medicinsk
Extrahering av kvittodata
Kvitto digitalisering omfattar omvandlingen av olika typer av kvitton, inklusive skannade, fotograferade och tryckta kopior, till ett digitalt format för strömlinjeformad nedströmsbearbetning. Exempel är kostnadshantering, analys av konsumentbeteende, skatteautomation osv. Med hjälp av teknik för dokumentinformation med OCR (optisk teckenigenkänning) kan du extrahera och tolka data från dessa olika kvittoformat. Dokumentinformationsbearbetning förenklar konverteringsprocessen men minskar också avsevärt den tid och det arbete som krävs, vilket underlättar effektiv datahantering och hämtning.
Exempelkvitto som bearbetas med Document Intelligence Studio:
Exempelkvitto som bearbetas med exempeletikettverktyget för dokumentinformation:
Utvecklingsalternativ
Document Intelligence v4.0 (2024-07-31-preview) stöder följande verktyg, program och bibliotek:
Funktion | Resurser | Model ID |
---|---|---|
Kvittomodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
fördefinierad kvitto |
Document Intelligence v3.1 stöder följande verktyg, program och bibliotek:
Funktion | Resurser | Model ID |
---|---|---|
Kvittomodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
fördefinierad kvitto |
Document Intelligence v3.0 stöder följande verktyg, program och bibliotek:
Funktion | Resurser | Model ID |
---|---|---|
Kvittomodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
fördefinierad kvitto |
Document Intelligence v2.1 stöder följande verktyg, program och bibliotek:
Funktion | Resurser |
---|---|
Kvittomodell | • Etikettverktyg för dokumentinformation• REST API • Klientbiblioteks-SDK • Docker-container för dokumentinformation |
Indatakrav
Filformat som stöds:
Modell PDF Bild: JPEG/JPG
,PNG
,BMP
, ,TIFF
HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLLästa ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Allmänt dokument ✔ ✔ Inbyggda ✔ ✔ Anpassad extrahering ✔ ✔ Anpassad klassificering ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) För bästa resultat anger du ett tydligt foto eller en genomsökning av hög kvalitet per dokument.
För PDF och TIFF kan upp till 2 000 sidor bearbetas (med en prenumeration på den kostnadsfria nivån bearbetas endast de två första sidorna).
Filstorleken för att analysera dokument är 500 MB för betald (S0) nivå och
4
MB för den kostnadsfria nivån (F0).Bilddimensioner måste vara mellan 50 bildpunkter x 50 bildpunkter och 10 000 bildpunkter x 10 000 bildpunkter.
Om dina PDF-filer är låsta med lösenord måste du ta bort låset innan du skickar filerna.
Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar om
8
punkttext vid 150 punkter per tum (DPI).För anpassad modellträning är det maximala antalet sidor för träningsdata 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.
För anpassad extraheringsmodellträning är den totala storleken på träningsdata 50 MB för mallmodellen och
1
GB för den neurala modellen.För anpassad klassificeringsmodellträning är
1
den totala storleken på träningsdata GB med högst 10 000 sidor. För förhandsversionen 2024-07-31 och senare är2
den totala storleken på träningsdata GB med högst 10 000 sidor.
- Filformat som stöds: JPEG, PNG, PDF och TIFF.
- Sidtillägg som stöds för PDF och TIFF: Dokumentinformation kan bearbeta upp till 2 000 sidor för standardprenumeranter eller endast de två första sidorna för kostnadsfria prenumeranter.
- Filstorlek som stöds: mindre än 50 MB; minsta bildpunkter 50 x 50 px; maximalt antal bildpunkter 10 000 x 10 000 px.
Extrahering av kvittomodelldata
Se hur Dokumentinformation extraherar data, inklusive tid och datum för transaktioner, handelsinformation och beloppssummor från kvitton. Du behöver följande resurser:
En Azure-prenumeration – du kan skapa en kostnadsfritt.
En instans av dokumentinformation i Azure Portal. Du kan använda den kostnadsfria prisnivån (
F0
) för att prova tjänsten. När resursen har distribuerats väljer du Gå till resurs för att hämta din nyckel och slutpunkt.
Kommentar
Document Intelligence Studio är tillgängligt med v3.1- och v3.0-API:er och senare versioner.
På startsidan för Document Intelligence Studio väljer du Kvitton.
Du kan analysera exempelkvittot eller ladda upp dina egna filer.
Välj knappen Kör analys och konfigurera vid behov alternativen Analysera:
Exempeletikettverktyg för dokumentinformation
Gå till exempelverktyget för dokumentinformation.
På exempelverktygets startsida väljer du panelen Använd fördefinierad modell för att hämta data .
Välj den formulärtyp som ska analyseras från den nedrullningsbara menyn.
Välj en URL för filen som du vill analysera från alternativen nedan:
I fältet Källa väljer du URL på den nedrullningsbara menyn, klistrar in den valda URL:en och väljer knappen Hämta .
I fältet För dokumentinformationstjänstens slutpunkt klistrar du in slutpunkten som du fick med din Document Intelligence-prenumeration.
I nyckelfältet klistrar du in den nyckel som du fick från dokumentinformationsresursen.
Välj Kör analys. Verktyget Exempeletiketter för dokumentinformation anropar API:et Analysera fördefinierat och analyserar dokumentet.
Visa resultaten – se nyckel/värde-par extraherade, radobjekt, markerad text som extraherats och tabeller har identifierats.
Språk och nationella inställningar som stöds
En fullständig lista över språk som stöds finns på sidan för språkstöd för fördefinierade modeller.
Fältextrahering
Namn | Type | Beskrivning | Standardiserade utdata |
---|---|---|---|
ReceiptType | String | Typ av försäljningskvitto | Specificerad |
MerchantName | String | Namnet på den handlare som utfärdar kvittot | |
MerchantPhoneNumber | phoneNumber | Listat telefonnummer för säljare | +1 xxx xxx xxxx |
MerchantAddress | String | Angiven adress till handlaren | |
TransactionDate | Datum | Datum då kvittot utfärdades | åååå-mm-dd |
TransactionTime | Tid | Tid då kvittot utfärdades | hh-mm-ss (24-timmars) |
Totalt | Nummer (USD) | Fullständig transaktionssumma för kvitto | Flyttal med två decimaler |
Delsumma | Nummer (USD) | Delsumma av kvittot, ofta innan skatter tillämpas | Flyttal med två decimaler |
Moms | Nummer (USD) | Total skatt vid kvitto (ofta moms eller motsvarande). Har bytt namn till "TotalTax" i 2022-06-30-versionen. | Flyttal med två decimaler |
Dricks | Nummer (USD) | Tips som ingår av köparen | Flyttal med två decimaler |
Artiklar | Objektmatris | Extraherade radobjekt med namn, kvantitet, enhetspris och totalt pris extraherat | |
Name | String | Objektbeskrivning. Har bytt namn till "Description" i 2022-06-30-versionen. | |
Kvantitet | Antal | Kvantitet för varje objekt | Flyttal med två decimaler |
Pris | Antal | Individuellt pris för varje artikelenhet | Flyttal med två decimaler |
TotalPrice | Antal | Totalt pris för radartikel | Flyttal med två decimaler |
Information om vilka dokumentextraheringsfält som stöds finns på schemasidan för kvittomodellen i vår GitHub-exempellagringsplats.
Migreringsguide och REST API v3.1
Nästa steg
Prova att bearbeta dina egna formulär och dokument med Document Intelligence Studio.
Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.
Prova att bearbeta dina egna formulär och dokument med verktyget Exempeletiketter för dokumentinformation.
Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.