Dokumentumintelligencia számlamodellje

Fontos

  • A Document Intelligence nyilvános előzetes verziójú kiadásai korai hozzáférést biztosítanak az aktív fejlesztés alatt lévő funkciókhoz.
  • A funkciók, a megközelítések és a folyamatok az általános rendelkezésre állás (GA) előtt változhatnak a felhasználói visszajelzések alapján.
  • A Document Intelligence ügyfélkódtárak nyilvános előzetes verziója alapértelmezés szerint a REST API 2024-02-29-preview verziója.
  • A nyilvános előzetes verzió 2024-02-29 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el:
  • USA keleti régiója
  • USA2 nyugati régiója
  • Nyugat-Európa

Ez a tartalom a következőre vonatkozik::Sakkv4.0 (előzetes verzió) | Korábbi verziók:kék pipav3.1 (GA)kék pipav3.0 (GA)kék pipav2.1 (GA)

Ez a tartalom a következőre vonatkozik::Sakkv3.1 (GA) | Legújabb verzió:lila pipav4.0 (előzetes verzió) | Korábbi verziók:kék pipav3.0kék pipav2.1

Ez a tartalom a következőre vonatkozik::Sakkv3.0 (GA) | Legújabb verziók:lila pipav4.0 (előzetes verzió)lila pipav3.1 | Korábbi verzió:kék pipav2.1

Ez a tartalom a következőre vonatkozik::Sakkv2.1 | Legújabb verzió:kék pipav4.0 (előzetes verzió)

A Dokumentumintelligencia számlamodell hatékony optikai karakterfelismerési (OCR) képességekkel elemzi és kinyeri a kulcsmezőket és sorelemeket az értékesítési számlákból, a közüzemi számlákból és a beszerzési rendelésekből. A számlák különböző formátumúak és minőségűek lehetnek, beleértve a telefonon rögzített képeket, a beolvasott dokumentumokat és a digitális PDF-eket. Az API elemzi a számla szövegét; kinyeri a legfontosabb információkat, például az ügyfél nevét, a számlázási címet, a határidőt és az esedékes összeget; és strukturált JSON-adatábrázolást ad vissza. A modell jelenleg 27 nyelven támogatja a számlákat.

Támogatott dokumentumtípusok:

  • Számlák
  • Közüzemi számlák
  • Értékesítési rendelések
  • Beszerzési rendelések

Automatizált számlafeldolgozás

Az automatizált számlafeldolgozás a számlázási számla dokumentumaiból a fizetendő kulcsfiókok mezőinek kinyerése. A kinyert adatok közé tartoznak azok a sorok, amelyek a számlákhoz tartozó, a számlákhoz tartozó (AP) munkafolyamatokkal integrálva jelennek meg felülvizsgálatok és kifizetések céljából. Korábban a fizetendő számlákat manuálisan hajtják végre, és így nagyon időigényesek. A kulcsadatok pontos kinyerése a számlákból általában az első és az egyik legkritikusabb lépés a számlaautomatizálási folyamat során.

A Document Intelligence Studióval feldolgozott minta számla:

Képernyőkép a Document Intelligence Studióban elemzett számlamintáról.

Dokumentumintelligencia-mintacímkéző eszközzel feldolgozott minta számla:

Képernyőkép egy számlamintáról.

Fejlesztési lehetőségek

A Document Intelligence v4.0 (2024-02-29-preview, 2023-10-31-preview) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Számlamodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
előre összeállított számla

A Document Intelligence v3.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Számlamodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
előre összeállított számla

A Document Intelligence 3.0-s verzió a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Számlamodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
előre összeállított számla

A Document Intelligence v2.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források
Számlamodell Dokumentumintelligencia-címkézési eszköz
REST API
Ügyfélkódtár SDK
Dokumentumintelligencia Docker-tároló

Bemeneti követelmények

  • A legjobb eredmény érdekében dokumentumonként egy tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.

  • Támogatott fájlformátumok:

    Modell PDF Kép:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) és HTML
    Olvasás
    Elrendezés ✔ (2024-02-29-preview, 2023-10-31-preview)
    Általános dokumentum
    Előre összeállított
    Egyéni kinyerés
    Egyéni besorolás ✔ (2024-02-29-preview)
  • PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).

  • A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) és 4 MB az ingyenes (F0) szint esetén.

  • A képméreteknek 50 x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.

  • Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.

  • A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül 8150 pont/hüvelyk (DPI) pont szövegnek felel meg.

  • Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.

    • Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete sablonmodell esetén 50 MB, a neurális modell esetében pedig 1G-MB.

    • Egyéni besorolási modell betanítása esetén a betanítási adatok 1GB teljes mérete legfeljebb 10 000 oldal lehet.

  • Támogatott fájlformátumok: JPEG, PNG, PDF és TIFF.
  • A támogatott PDF- és TIFF-fájlok legfeljebb 2000 oldalt dolgoznak fel. Az ingyenes szintű előfizetők számára csak az első két oldal feldolgozása történik meg.
  • A támogatott fájlméretnek 50 MB-nál kisebbnek és legalább 50 x 50 képpont méretűnek és legfeljebb 10 000 x 10 000 képpontnak kell lennie.

Számlamodell adatainak kinyerése

Megtudhatja, hogyan nyerik ki az adatokat, beleértve az ügyféladatokat, a szállító adatait és a sorelemeket a számlákból. A következő erőforrásokra van szüksége:

  • Azure-előfizetés – ingyenesen létrehozhat egyet.

  • Dokumentumintelligencia-példány az Azure Portalon. A szolgáltatás kipróbálásához használhatja az ingyenes tarifacsomagot (F0). Az erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget a kulcs és a végpont lekéréséhez.

Képernyőkép a kulcsok és a végpontok helyéről az Azure Portalon.

  1. A Document Intelligence Studio kezdőlapján válassza a Számlák lehetőséget.

  2. Elemezheti a mintául szolgáló számlát, vagy feltöltheti saját fájljait.

  3. Válassza a Futtatás elemzés gombot, és szükség esetén konfigurálja az Elemzési beállításokat :

    Képernyőkép a Document Intelligence Studio Elemzés és elemzés beállításai gombjairól.

Dokumentumintelligencia-mintacímkéző eszköz

  1. Lépjen a dokumentumintelligencia-mintaeszközre.

  2. A mintaeszköz kezdőlapján válassza az Előre összeállított modell használata lehetőséget az adatcsempék lekéréséhez.

    Képernyőkép az elrendezésmodell eredményelemzési folyamatáról.

  3. Válassza ki az elemezni kívánt űrlaptípust a legördülő menüből.

  4. Válassza ki az elemezni kívánt fájl URL-címét az alábbi lehetőségek közül:

  5. A Forrás mezőben válassza az URL-címet a legördülő menüből, illessze be a kijelölt URL-címet, és válassza a Beolvasás gombot.

    Képernyőkép a forráshely legördülő menüről.

  6. A Dokumentumintelligencia szolgáltatás végpont mezőjébe illessze be a Dokumentumintelligencia-előfizetéssel beszerzett végpontot.

  7. A kulcsmezőbe illessze be a Dokumentumintelligencia-erőforrásból beszerzett kulcsot.

    Képernyőkép a select-form típusú legördülő menüről.

  8. Válassza a Futtatás elemzése lehetőséget. A dokumentumintelligencia-mintacímkézési eszköz meghívja az Elemzés előre összeállított API-t, és elemzi a dokumentumot.

  9. Az eredmények megtekintése – megtekintheti a kinyert kulcs-érték párokat, a sorelemeket, a kibontott kiemelt szöveget és a táblákat.

    Képernyőkép az elrendezésmodell eredményelemzési műveletéről.

Feljegyzés

A Mintacímke eszköz nem támogatja a BMP fájlformátumot. Ez nem a Dokumentumintelligencia-szolgáltatás, hanem az eszköz korlátozása.

Támogatott nyelvek és területi beállítások

A támogatott nyelvek teljes listájáért tekintse meg a Nyelvi támogatás – előre összeállított modellek lapját.

Mező kinyerése

Név Típus Leírás Szabványosított kimenet
CustomerName húr Számlázott ügyfél Microsoft Corp
Vevőkód húr Ügyfélhivatkozás azonosítója CID-12345
PurchaseOrder húr Beszerzési rendelés hivatkozási száma PO-3333
InvoiceId húr Az adott számla azonosítója (gyakran számlaszám) INV-100
InvoiceDate (Számla dátuma) dátum: a számla kiállításának dátuma mm-dd-yyyyy
DueDate dátum: a számla esedékességének dátuma mm-dd-yyyyy
Szállítónév húr A számlát létrehozó szállító CONTOSO LTD.
VendorAddress Cím Szállító levelezési címe 123 456th St, New York, NY 10001
VendorAddressRecipient húr A VendorAddresshez társított név Contoso központ
CustomerAddress Cím Az ügyfél levelezési címe 123 Egyéb St, Redmond WA, 98052
CustomerAddressRecipient húr A CustomerAddresshez társított név Microsoft Corp
BillingAddress Cím Explicit számlázási cím az ügyfél számára 123 Bill St, Redmond WA, 98052
BillingAddressRecipient húr A BillingAddresshez társított név Microsoft Services
ShippingAddress Cím Explicit szállítási cím az ügyfél számára 123 Ship St, Redmond WA, 98052
ShippingAddressRecipient húr A ShippingAddresshez társított név Microsoft Delivery
Részösszeg currency A számlán azonosított részösszeg mező 100,00 USD
TotalDiscount currency A számlára alkalmazott teljes kedvezmény 5,00 USD
TotalTax currency A számlán azonosított összes adómező 10,00 USD
InvoiceTotal currency A számlához társított összes új díj 10,00 USD
AmountDue currency A szállítónak fizetendő teljes összeg 610 USD
PreviousUnpaidBalance currency Explicit, korábban meg nem fizetett egyenleg 500,00 USD
RemittanceAddress Cím Az ügyfél kifejezett átutalása vagy fizetési címe 123 Remit St New York, NY, 10001
RemittanceAddressRecipient húr A RemittanceAddresshez társított név Contoso számlázás
ServiceAddress Cím Az ügyfél explicit szolgáltatáscíme vagy tulajdonságcíme 123 Service St, Redmond WA, 98052
ServiceAddressRecipient húr A ServiceAddresshez társított név Microsoft Services
ServiceStartDate dátum: A szolgáltatási időszak első dátuma (például egy közüzemi számla szolgáltatási időszaka) mm-dd-yyyyy
ServiceEndDate dátum: A szolgáltatási időszak záró dátuma (például egy közüzemi számla szolgáltatási időszaka) mm-dd-yyyyy
VendorTaxId húr A szállítóhoz társított adózói szám 123456-7
CustomerTaxId húr Az ügyfélhez társított adózói szám 765432-1
Fizetési idő húr A számla fizetési feltételei Net90
KVKNumber húr A Hollandiában regisztrált vállalkozások egyedi azonosítója (csak NL-ben) 12345678
CurrencyCode húr A kinyert összeghez társított pénznemkód
PaymentDetails array Olyan tömb, amely tartalmazza a Fizetési mód részleteit( például IBAN:SWIFT, , BPayBillerCode(AU)BPayReference(AU)
TaxDetails array Olyan tömb, amely olyan adóadatokat tartalmaz, mint az összeg és a ráta
TaxDetails array Olyan tömb, amely olyan hozzáadott adóadatokat tartalmaz, mint a CGST, IGSTés SGST. Ez a sorelem jelenleg csak Németország (), Spanyolország (dees), Portugália (pt) és Az Angol Kanada (en-CA) területi beállításaihoz érhető el

Sorelemek tömbje

A JSON-kimeneti válaszban egy számlából kinyert sorelemek a következők (a következő kimenet ezt a mintául szolgáló számlát használja:

Név Típus Leírás Érték (szabványosított kimenet)
Összeg currency A sorelem mennyisége 60,00 USD
Dátum dátum: Az egyes sorelemeknek megfelelő dátum. Gyakran ez a sorelem szállításának dátuma 3/4/2021
Leírás húr A számlasorelem szöveges leírása Tanácsadási szolgáltatás
Mennyiség szám Ennek a számlasorelemnek a mennyisége 2
ProductCode húr Az adott sorelemhez társított termékkód, termékszám vagy termékváltozat A123
Adó currency Az egyes sorelemekhez társított adó. A lehetséges értékek közé tartozik az adó összege és az Y/N adó $6.00
TaxRate húr Az egyes sorelemekhez társított adókulcs. 18%
Unit (Egység) húr A sorelem mértékegysége, pl. kg, lb stb. Óra
Egységár szám A tétel egy egységének nettó vagy bruttó ára (a számla bruttó számlabeállításától függően) 30,00 USD

A kicsomagolt számlakulcs-érték párok és sorelemek a documentResults JSON-kimenet szakaszában találhatók.

Kulcs-érték párok

Az előre összeállított 2022-06-30-s és újabb kiadások támogatják a kulcs-érték párok opcionális visszaadását. Alapértelmezés szerint a kulcs-érték párok visszatérése le van tiltva. A kulcs-érték párok a számlán belül meghatározott spanok, amelyek azonosítják a címkét vagy kulcsot, valamint a hozzá tartozó választ vagy értéket. A számlán ezek a párok lehetnek a címke és a felhasználó által megadott érték az adott mezőhöz vagy telefonszámhoz. Az AI-modell betanítása az azonosítható kulcsok és értékek kinyerésére a dokumentumtípusok, formátumok és struktúrák széles választéka alapján történik.

A kulcsok külön is létezhetnek, ha a modell észleli, hogy egy kulcs létezik, nincs hozzárendelt érték, vagy ha nem kötelező mezőket dolgoz fel. Előfordulhat például, hogy egy középső név mező üresen hagyható egy űrlapon egyes példányokban. A kulcs-érték párok mindig a dokumentumban található szövegekre terjednek ki. Azokban a dokumentumokban, ahol ugyanazt az értéket különböző módokon írják le, például ügyfél/felhasználó, a társított kulcs ügyfél vagy felhasználó (környezet alapján).

Kinyert mezők

A Számla szolgáltatás kinyeri a szöveget, a táblázatokat és a 26 számlamezőt. Az alábbiakban a JSON-kimeneti válaszban egy számlából kinyert mezők jelennek meg (az alábbi kimenet ezt a mintául szolgáló számlát használja).

Név Típus Leírás Szöveges Érték (szabványosított kimenet)
CustomerName húr Számlázott ügyfél Microsoft Corp
Vevőkód húr Az ügyfél referencia-azonosítója CID-12345
PurchaseOrder húr Beszerzési rendelés hivatkozási száma PO-3333
InvoiceId húr Az adott számla azonosítója (gyakran "Számlaszám") INV-100
InvoiceDate (Számla dátuma) dátum: A számla kiállításának dátuma 11/15/2019 2019-11-15
DueDate dátum: A számla kifizetésének dátuma 2019. 12. 15. 2019-12-15
Szállítónév húr A számlát létrehozó szállító CONTOSO
VendorAddress húr A szállító levelezési címe 123 456th St New York, NY, 10001
VendorAddressRecipient húr A VendorAddresshez társított név Contoso központ
CustomerAddress húr Az ügyfél levelezési címe 123 Other Street, Redmond, Washington, 98052
CustomerAddressRecipient húr A CustomerAddresshez társított név Microsoft Corp
BillingAddress húr Explicit számlázási cím az ügyfél számára 123 Bill Street, Redmond, Washington, 98052
BillingAddressRecipient húr A BillingAddresshez társított név Microsoft Services
ShippingAddress húr Explicit szállítási cím az ügyfél számára 123 Ship Street, Redmond, Washington, 98052
ShippingAddressRecipient húr A ShippingAddresshez társított név Microsoft Delivery
Részösszeg szám A számlán azonosított részösszeg mező 100,00 USD 100
TotalTax szám A számlán azonosított összes adómező 10,00 USD 10
InvoiceTotal szám A számlához társított összes új díj 110,00 USD 110
AmountDue szám A szállítónak fizetendő teljes összeg 610,00 USD 610
ServiceAddress húr Az ügyfél explicit szolgáltatáscíme vagy tulajdonságcíme 123 Service Street, Redmond, Washington, 98052
ServiceAddressRecipient húr A ServiceAddresshez társított név Microsoft Services
RemittanceAddress húr Az ügyfél kifejezett átutalása vagy fizetési címe 123 Remit St New York, NY, 10001
RemittanceAddressRecipient húr A RemittanceAddresshez társított név Contoso számlázás
ServiceStartDate dátum: A szolgáltatási időszak első dátuma (például egy közüzemi számla szolgáltatási időszaka) 10/14/2019 2019-10-14
ServiceEndDate dátum: A szolgáltatási időszak záró dátuma (például egy közüzemi számla szolgáltatási időszaka) 11/14/2019 2019-11-14
PreviousUnpaidBalance szám Explicit, korábban meg nem fizetett egyenleg 500,00 USD 500

A JSON kimeneti válaszában egy számlából kinyert sorelemek a következők:

Név Típus Leírás Szöveg (1. sorelem) Érték (szabványosított kimenet)
Elemek húr A sorelem teljes sztringszöveg-sora 2021.03.04. A123 Consulting Services 2 óra 30,00 $ 10% $60,00
Összeg szám A sorelem mennyisége 60,00 USD 100
Leírás húr A számlasorelem szöveges leírása Tanácsadási szolgáltatás Tanácsadási szolgáltatás
Mennyiség szám Ennek a számlasorelemnek a mennyisége 2 2
Egységár szám A tétel egy egységének nettó vagy bruttó ára (a számla bruttó számlabeállításától függően) 30,00 USD 30
ProductCode húr Az adott sorelemhez társított termékkód, termékszám vagy termékváltozat A123
Unit (Egység) húr A sorelem mértékegysége, pl. kg, lb stb. óra
Dátum dátum: Az egyes sorelemeknek megfelelő dátum. Gyakran ez a sorelem szállításának dátuma 3/4/2021 2021-03-04
Adó szám Az egyes sorelemekhez társított adó. A lehetséges értékek közé tartozik az adó összege, az adó %, valamint az Y/N adó 10%

A JSON-kimeneti válaszban egy számlából kinyert összetett mezők a következők:

TaxDetails

Az adóadatok célja a számlaösszegre alkalmazott különböző adók lebontása.

Név Típus Leírás Szöveg (1. sorelem) Érték (szabványosított kimenet)
Elemek húr Az adóelem teljes sztringszöveg-sora V.A.T. 15% 60,00 USD
Összeg szám Az adótétel adóösszege 60.00 60
Arány húr Az adótétel adókulcsa 15%

PaymentDetails

Sorolja fel a mezőben észlelt összes fizetési lehetőséget.

Név Típus Leírás Szöveg (1. sorelem) Érték (szabványosított kimenet)
IBAN húr Belső bankszámlaszám GB33BUKB20201555555555
SWIFT húr SWIFT-kód BUKBGB22
BPayBillerCode húr Ausztrál B-Pay Biller Code 12345
BPayReference húr Ausztrál B-Pay referenciakód 98765432100

JSON-kimenet

A JSON-kimenet három részből áll:

  • "readResults" a csomópont tartalmazza az összes felismert szöveget és kijelölési jelet. A szöveg elrendezése oldal, majd sor, majd egyéni szavak szerint történik.
  • "pageResults" a csomópont tartalmazza a határolókeretekkel, megbízhatósággal és a readResultsben lévő vonalakra és szavakra mutató hivatkozást tartalmazó táblákat és cellákat.
  • "documentResults" csomópont tartalmazza a modell által felderített számlaspecifikus értékeket és sorelemeket. Itt található a számla összes mezője, például a számlaazonosító, a szállítási cím, a számla, az ügyfél, az összeg, a sorelemek és még sok más.

Migrálási útmutató

  • Kövesse a Document Intelligence v3.1 migrálási útmutatóját, amelyből megtudhatja, hogyan használhatja a v3.0-s verziót az alkalmazásokban és munkafolyamatokban.

Következő lépések