Fakturamodell för dokumentinformation

Viktigt!

  • Versioner av den offentliga förhandsversionen av Document Intelligence ger tidig åtkomst till funktioner som är i aktiv utveckling.
  • Funktioner, metoder och processer kan ändras, före allmän tillgänglighet (GA), baserat på användarfeedback.
  • Den offentliga förhandsversionen av Dokumentinformationsklientbiblioteken är som standard REST API version 2024-02-29-preview.
  • Förhandsversion 2024-02-29-preview är för närvarande endast tillgänglig i följande Azure-regioner:
  • USA, östra
  • USA, västra 2
  • Europa, västra

Det här innehållet gäller för:Bockmarkeringv4.0 (förhandsversion) | Tidigare versioner:blå bockmarkeringv3.1 (GA)blå bockmarkeringv3.0 (GA)blå bockmarkeringv2.1 (GA)

Det här innehållet gäller för:Bockmarkeringv3.1 (GA) | Senaste version:lila bockmarkeringv4.0 (förhandsversion) | Tidigare versioner:blå bockmarkeringv3.0blå bockmarkeringv2.1

Det här innehållet gäller för:Bockmarkeringv3.0 (GA) | Senaste versionerna:lila bockmarkeringv4.0 (förhandsversion)lila bockmarkeringv3.1 | Tidigare version:blå bockmarkeringv2.1

Det här innehållet gäller för:Bockmarkeringv2.1 | Senaste version:blå bockmarkeringv4.0 (förhandsversion)

Fakturamodellen för dokumentinformation använder kraftfulla OCR-funktioner (Optisk teckenigenkänning) för att analysera och extrahera nyckelfält och radobjekt från försäljningsfakturor, verktygsräkningar och inköpsorder. Fakturor kan ha olika format och kvalitet, inklusive telefonbilder, skannade dokument och digitala PDF-filer. API:et analyserar fakturatext; extraherar viktig information som kundnamn, faktureringsadress, förfallodatum och förfallodatum. och returnerar en strukturerad JSON-datarepresentation. Modellen stöder för närvarande fakturor på 27 språk.

Dokumenttyper som stöds:

  • Fakturor
  • Fakturor för verktyg
  • Försäljningsorder
  • Inköpsorder

Automatiserad fakturabearbetning

Automatiserad fakturabearbetning är processen för att extrahera nyckelkontons leverantörsreskontrafält från faktureringskontodokument. Extraherade data innehåller radobjekt från fakturor som är integrerade med dina arbetsflöden för leverantörsreskontra (AP) för granskningar och betalningar. Tidigare utförs leverantörsreskontraprocessen manuellt och därmed mycket tidskrävande. Korrekt extrahering av viktiga data från fakturor är vanligtvis det första och ett av de mest kritiska stegen i processen för fakturaautomatisering.

Exempelfaktura som bearbetas med Document Intelligence Studio:

Skärmbild av en exempelfaktura som analyserats i Document Intelligence Studio.

Exempelfaktura som bearbetas med exempeletikettverktyget för dokumentinformation:

Skärmbild av en exempelfaktura.

Utvecklingsalternativ

Document Intelligence v4.0 (2024-02-29-preview, 2023-10-31-preview) stöder följande verktyg, program och bibliotek:

Funktion Resurser Model ID
Fakturamodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
fördefinierad faktura

Document Intelligence v3.1 stöder följande verktyg, program och bibliotek:

Funktion Resurser Model ID
Fakturamodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
fördefinierad faktura

Document Intelligence v3.0 stöder följande verktyg, program och bibliotek:

Funktion Resurser Model ID
Fakturamodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
fördefinierad faktura

Document Intelligence v2.1 stöder följande verktyg, program och bibliotek:

Funktion Resurser
Fakturamodell Etikettverktyg
för dokumentinformation• REST API
Klientbiblioteks-SDK
Docker-container för dokumentinformation

Indatakrav

  • För bästa resultat anger du ett tydligt foto eller en genomsökning av hög kvalitet per dokument.

  • Filformat som stöds:

    Modell PDF Bild:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) och HTML
    Lästa
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Allmänt dokument
    Inbyggda
    Anpassad extrahering
    Anpassad klassificering ✔ (2024-02-29-preview)
  • För PDF och TIFF kan upp till 2 000 sidor bearbetas (med en kostnadsfri nivåprenumeration bearbetas endast de två första sidorna).

  • Filstorleken för att analysera dokument är 500 MB för den betalda nivån (S0) och 4 MB för den kostnadsfria nivån (F0).

  • Bilddimensionerna måste vara mellan 50 x 50 bildpunkter och 10 000 px x 10 000 bildpunkter.

  • Om dina PDF-filer är låsta med lösenord måste du ta bort låset innan du skickar filerna.

  • Den minsta höjden på texten som ska extraheras är 12 bildpunkter för en bild på 1 024 x 768 bildpunkter. Den här dimensionen motsvarar ungefär 8-punkttext vid 150 punkter per tum (DPI).

  • För anpassad modellträning är det maximala antalet sidor för träningsdata 500 för den anpassade mallmodellen och 50 000 för den anpassade neurala modellen.

    • För anpassad extraheringsmodellträning är den totala storleken på träningsdata 50 MB för mallmodellen och 1G-MB för den neurala modellen.

    • För anpassad klassificeringsmodellträning är 1GB den totala storleken på träningsdata med högst 10 000 sidor.

  • Filformat som stöds: JPEG, PNG, PDF och TIFF.
  • PDF och TIFF som stöds, upp till 2 000 sidor bearbetas. För prenumeranter på den kostnadsfria nivån bearbetas endast de två första sidorna.
  • Filstorleken som stöds måste vara mindre än 50 MB och dimensionerna minst 50 x 50 bildpunkter och högst 10 000 x 10 000 bildpunkter.

Extrahering av fakturamodelldata

Se hur data, inklusive kundinformation, leverantörsinformation och radobjekt, extraheras från fakturor. Du behöver följande resurser:

  • En Azure-prenumeration – du kan skapa en kostnadsfritt.

  • En instans av dokumentinformation i Azure-portalen. Du kan använda den kostnadsfria prisnivån (F0) för att prova tjänsten. När resursen har distribuerats väljer du Gå till resurs för att hämta din nyckel och slutpunkt.

Skärmbild av nycklar och slutpunktsplats i Azure-portalen.

  1. På startsidan för Document Intelligence Studio väljer du Fakturor.

  2. Du kan analysera exempelfakturan eller ladda upp dina egna filer.

  3. Välj knappen Kör analys och konfigurera vid behov alternativen Analysera :

    Skärmbild av knapparna Kör analys och Analysera alternativ i Document Intelligence Studio.

Exempeletikettverktyg för dokumentinformation

  1. Gå till exempelverktyget för dokumentinformation.

  2. På exempelverktygets startsida väljer du panelen Använd fördefinierad modell för att hämta data .

    Skärmbild av layoutmodellen analyserar resultatprocessen.

  3. Välj den formulärtyp som ska analyseras från den nedrullningsbara menyn.

  4. Välj en URL för filen som du vill analysera från alternativen nedan:

  5. I fältet Källa väljer du URL på den nedrullningsbara menyn, klistrar in den valda URL:en och väljer knappen Hämta .

    Skärmbild av listrutan källplats.

  6. I fältet För dokumentinformationstjänstens slutpunkt klistrar du in slutpunkten som du fick med din Document Intelligence-prenumeration.

  7. I nyckelfältet klistrar du in den nyckel som du fick från dokumentinformationsresursen.

    Skärmbild som visar listrutan välj formulärtyp.

  8. Välj Kör analys. Verktyget Exempeletiketter för dokumentinformation anropar API:et Analysera fördefinierat och analyserar dokumentet.

  9. Visa resultaten – se nyckel/värde-par extraherade, radobjekt, markerad text som extraherats och tabeller har identifierats.

    Skärmbild av hur layoutmodellen analyserar resultatåtgärden.

Kommentar

Verktyget Exempeletiketter stöder inte BMP-filformatet. Det här är en begränsning för verktyget, inte dokumentunderrättelsetjänsten.

Språk och nationella inställningar som stöds

Se sidan Språkstöd – fördefinierade modeller för en fullständig lista över språk som stöds.

Fältextrahering

Namn Type Beskrivning Standardiserade utdata
CustomerName sträng Fakturerad kund Microsoft Corp
CustomerId sträng Kundreferens-ID CID-12345
PurchaseOrder sträng Inköpsorderreferensnummer PO-3333
InvoiceId sträng ID för den här specifika fakturan (ofta fakturanummer) INV-100
InvoiceDate datum datum då fakturan utfärdades mm-dd-ååååå
DueDate datum datum då betalningen för den här fakturan förfaller mm-dd-ååååå
VendorName sträng Leverantör som skapade den här fakturan CONTOSO LTD.
VendorAddress Adress Leverantörsadress 123 456th St, New York, NY 10001
VendorAddressRecipient sträng Namn som är associerat med VendorAddress Contosos huvudkontor
CustomerAddress Adress E-postadress för kunden 123 Annan St, Redmond WA, 98052
CustomerAddressRecipient sträng Namn som är associerat med CustomerAddress Microsoft Corp
FaktureringAdress Adress Explicit faktureringsadress för kunden 123 Räkning St, Redmond WA, 98052
BillingAddressRecipient sträng Namn som är associerat med BillingAddress Microsoft Services
ShippingAddress Adress Explicit leveransadress för kunden 123 Ship St, Redmond WA, 98052
ShippingAddressRecipient sträng Namn som är associerat med ShippingAddress Microsoft Delivery
Delsumma currency Delsummafält som identifierats på den här fakturan 100,00 $
TotalDiscount currency Den totala rabatten som tillämpas på en faktura 5,00 USD
TotalTax currency Totalt skattefält som identifierats på den här fakturan 10,00 $
InvoiceTotal currency Totalt antal nya avgifter som är associerade med den här fakturan 10,00 $
AmountDue currency Totalt belopp som beror på leverantören $610
PreviousUnpaidBalance currency Explicit tidigare obetalt saldo 500,00 USD
RemittanceAddress Adress Explicit remittering eller betalningsadress för kunden 123 Remit St New York, NY, 10001
RemittanceAddressRecipient sträng Namn som är associerat med RemittanceAddress Contoso-fakturering
ServiceAddress Adress Explicit tjänstadress eller egenskapsadress för kunden 123 Service St, Redmond WA, 98052
ServiceAddressRecipient sträng Namn som är associerat med ServiceAddress Microsoft Services
ServiceStartDate datum Första datumet för tjänstperioden (till exempel en tjänstperiod för verktygsfakturering) mm-dd-ååååå
ServiceEndDate datum Slutdatum för tjänstperioden (till exempel en tjänstperiod för verktygsfakturering) mm-dd-ååååå
VendorTaxId sträng Det skattenummer som är associerat med leverantören 123456-7
CustomerTaxId sträng Det skattenummer som är kopplat till kunden 765432-1
PaymentTerm sträng Betalningsvillkoren för fakturan Net90
KVKNumber sträng En unik identifierare för företag som är registrerade i Nederländerna (endast NL) 12345678
CurrencyCode sträng Valutakoden som är associerad med det extraherade beloppet
PaymentDetails matris En matris som innehåller information om betalningsalternativ som IBAN,SWIFT, BPayBillerCode(AU), BPayReference(AU)
TaxDetails matris En matris som innehåller skatteinformation som belopp och skattesats
TaxDetails matris EN matris som innehåller tillagd skatteinformation som CGST, IGSToch SGST. Det här radobjektet är för närvarande endast tillgängligt för nationella inställningar för Tyskland (de), Spanien (es), Portugal (pt) och Engelska Kanada (en-CA)

Matris för radobjekt

Följande är de radobjekt som extraheras från en faktura i JSON-utdatasvaret (följande utdata använder den här exempelfakturan:

Namn Type Beskrivning Värde (standardiserade utdata)
Mängd currency Radobjektets mängd 60,00 USD
Datum datum Datum som motsvarar varje radobjekt. Ofta är det ett datum då radartikeln levererades 3/4/2021
beskrivning sträng Textbeskrivningen för fakturaradsobjektet Konsulttjänst
Kvantitet Nummer Kvantiteten för det här fakturaradsobjektet 2
ProductCode sträng Produktkod, produktnummer eller SKU som är associerad med det specifika radobjektet A123
Moms currency Skatt som är associerad med varje radobjekt. Möjliga värden inkluderar skattebelopp och skatt Y/N 6,00 USD
Taxrate sträng Skattesats som är associerad med varje radobjekt. 18 %
Enhet sträng Radobjektets enhet, t.ex. kg, lb osv. Tider
UnitPrice Nummer Netto- eller bruttopriset (beroende på fakturans bruttoinställning) för en enhet i det här objektet 30,00 $

De nyckel/värde-fakturapar och radobjekt som extraheras finns i documentResults avsnittet i JSON-utdata.

Nyckel/värde-par

Den fördefinierade fakturan 2022-06-30 och senare versioner stöder valfri retur av nyckel/värde-par. Som standard inaktiveras returen av nyckel/värde-par. Nyckel/värde-par är specifika intervall i fakturan som identifierar en etikett eller nyckel och dess associerade svar eller värde. På en faktura kan dessa par vara etiketten och värdet som användaren angav för fältet eller telefonnumret. AI-modellen tränas för att extrahera identifierbara nycklar och värden baserat på en mängd olika dokumenttyper, format och strukturer.

Nycklar kan också finnas isolerat när modellen upptäcker att en nyckel finns, utan associerat värde eller när valfria fält bearbetas. Ett mellannamnsfält kan till exempel lämnas tomt i ett formulär i vissa fall. Nyckel/värde-par är alltid textintervall som finns i dokumentet. För dokument där samma värde beskrivs på olika sätt, till exempel kund/användare, är den associerade nyckeln antingen kund eller användare (baserat på kontext).

Fält extraherade

Fakturatjänsten extraherar fälten text, tabeller och 26 faktura. Följande är fälten som extraheras från en faktura i JSON-utdatasvaret (följande utdata använder den här exempelfakturan).

Namn Type Beskrivning Text Värde (standardiserade utdata)
CustomerName sträng Kunden faktureras Microsoft Corp
CustomerId sträng Referens-ID för kunden CID-12345
PurchaseOrder sträng Ett inköpsorderreferensnummer PO-3333
InvoiceId sträng ID för den här specifika fakturan (ofta "Fakturanummer") INV-100
InvoiceDate datum Datum då fakturan utfärdades 11/15/2019 2019-11-15
DueDate datum Datum då betalningen för den här fakturan förfaller 2019-12-15 2019-12-15
VendorName sträng Leverantör som skapade fakturan CONTOSO
VendorAddress sträng E-postadress för leverantören 123 456th St New York, NY, 10001
VendorAddressRecipient sträng Namn som är associerat med VendorAddress Contosos huvudkontor
CustomerAddress sträng E-postadress för kunden 123 Annan gata, Redmond, Washington, 98052
CustomerAddressRecipient sträng Namn som är associerat med CustomerAddress Microsoft Corp
FaktureringAdress sträng Explicit faktureringsadress för kunden 123 Bill Street, Redmond, Washington, 98052
BillingAddressRecipient sträng Namn som är associerat med BillingAddress Microsoft Services
ShippingAddress sträng Explicit leveransadress för kunden 123 Ship Street, Redmond, Washington, 98052
ShippingAddressRecipient sträng Namn som är associerat med ShippingAddress Microsoft Delivery
Delsumma Nummer Delsummafält som identifierats på den här fakturan 100,00 $ 100
TotalTax Nummer Totalt skattefält som identifierats på den här fakturan 10,00 $ 10
InvoiceTotal Nummer Totalt antal nya avgifter som är associerade med den här fakturan 110,00 USD 110
AmountDue Nummer Totalt belopp som beror på leverantören 610,00 USD 610
ServiceAddress sträng Explicit tjänstadress eller egenskapsadress för kunden 123 Service Street, Redmond, Washington, 98052
ServiceAddressRecipient sträng Namn som är associerat med ServiceAddress Microsoft Services
RemittanceAddress sträng Explicit remittering eller betalningsadress för kunden 123 Remit St New York, NY, 10001
RemittanceAddressRecipient sträng Namn som är associerat med RemittanceAddress Contoso-fakturering
ServiceStartDate datum Första datumet för tjänstperioden (till exempel en tjänstperiod för verktygsfakturering) 10/14/2019 2019-10-14
ServiceEndDate datum Slutdatum för tjänstperioden (till exempel en tjänstperiod för verktygsfakturering) 11/14/2019 2019-11-14
PreviousUnpaidBalance Nummer Explicit tidigare obetalt saldo 500,00 USD 500

Följande är de radobjekt som extraheras från en faktura i JSON-utdatasvaret och använder den här exempelfakturan:

Namn Type Beskrivning Text (radobjekt nr 1) Värde (standardiserade utdata)
Artiklar sträng Radobjektets textrad med full sträng 3/4/2021 A123 Consulting Services 2 timmar $30,00 10% $60,00
Belopp Nummer Radobjektets mängd 60,00 USD 100
beskrivning sträng Textbeskrivningen för fakturaradsobjektet Konsulttjänst Konsulttjänst
Kvantitet Nummer Kvantiteten för det här fakturaradsobjektet 2 2
UnitPrice Nummer Netto- eller bruttopriset (beroende på fakturans bruttoinställning) för en enhet i det här objektet 30,00 $ 30
ProductCode sträng Produktkod, produktnummer eller SKU som är associerad med det specifika radobjektet A123
Enhet sträng Radobjektets enhet, t.ex. kg, lb osv. timmar
Datum datum Datum som motsvarar varje radobjekt. Ofta är det ett datum då radartikeln levererades 3/4/2021 2021-03-04
Moms Nummer Skatt som är associerad med varje radobjekt. Möjliga värden är skattebelopp, skatt %och skatt Y/N 10 %

Följande är komplexa fält som extraheras från en faktura i JSON-utdatasvaret:

TaxDetails

Skatteinformation syftar till att dela upp de olika skatter som tillämpas på fakturasumman.

Namn Type Beskrivning Text (radobjekt nr 1) Värde (standardiserade utdata)
Artiklar sträng Fullsträngstextrad i skatteobjektet V.A.T. 15% $60.00
Belopp Nummer Skattebeloppet för skatteposten 60.00 60
Taxa sträng Skattesatsen för skatteposten 15 %

PaymentDetails

Visa en lista över alla identifierade betalningsalternativ som har identifierats i fältet.

Namn Type Beskrivning Text (radobjekt nr 1) Värde (standardiserade utdata)
IBAN sträng Internt bankkontonummer GB33BUKB20201555555555
SWIFT sträng SWIFT-kod BUKBGB22
BPayBillerCode sträng Australian B-Pay Biller Code 12345
BPayReference sträng Referenskod för australiensisk B-betalning 98765432100

JSON-utdata

JSON-utdata har tre delar:

  • "readResults" noden innehåller alla identifierade text- och markeringsmarkeringar. Text ordnas via sida, sedan efter rad och sedan efter enskilda ord.
  • "pageResults" noden innehåller tabeller och celler som extraherats med sina avgränsningsrutor, konfidens och en referens till raderna och orden i readResults.
  • "documentResults" noden innehåller de fakturaspecifika värden och radobjekt som modellen identifierade. Det är här du hittar alla fält från fakturan, till exempel faktura-ID, leverans till, faktura till, kund, summa, radobjekt och mycket mer.

Migreringsguide

  • Följ migreringsguiden för Document Intelligence v3.1 för att lära dig hur du använder v3.0-versionen i dina program och arbetsflöden.

Nästa steg

  • Prova att bearbeta dina egna formulär och dokument med Document Intelligence Studio.

  • Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.

  • Prova att bearbeta dina egna formulär och dokument med verktyget Exempeletiketter för dokumentinformation.

  • Slutför en snabbstart för dokumentinformation och kom igång med att skapa en app för dokumentbearbetning på valfritt utvecklingsspråk.