Dokumentumintelligencia számlamodellje
Fontos
- A Document Intelligence nyilvános előzetes verziójú kiadásai korai hozzáférést biztosítanak az aktív fejlesztés alatt lévő funkciókhoz.
- A funkciók, a megközelítések és a folyamatok az általános rendelkezésre állás (GA) előtt változhatnak a felhasználói visszajelzések alapján.
- A Document Intelligence ügyfélkódtárak nyilvános előzetes verziója alapértelmezés szerint a REST API 2024-02-29-preview verziója.
- A nyilvános előzetes verzió 2024-02-29 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el:
- USA keleti régiója
- USA2 nyugati régiója
- Nyugat-Európa
Ez a tartalom a következőre vonatkozik::v4.0 (előzetes verzió) | Korábbi verziók:v3.1 (GA)v3.0 (GA)v2.1 (GA)
Ez a tartalom a következőre vonatkozik::v3.1 (GA) | Legújabb verzió:v4.0 (előzetes verzió) | Korábbi verziók:v3.0v2.1
Ez a tartalom a következőre vonatkozik::v3.0 (GA) | Legújabb verziók:v4.0 (előzetes verzió)v3.1 | Korábbi verzió:v2.1
Ez a tartalom a következőre vonatkozik::v2.1 | Legújabb verzió:v4.0 (előzetes verzió)
A Dokumentumintelligencia számlamodell hatékony optikai karakterfelismerési (OCR) képességekkel elemzi és kinyeri a kulcsmezőket és sorelemeket az értékesítési számlákból, a közüzemi számlákból és a beszerzési rendelésekből. A számlák különböző formátumúak és minőségűek lehetnek, beleértve a telefonon rögzített képeket, a beolvasott dokumentumokat és a digitális PDF-eket. Az API elemzi a számla szövegét; kinyeri a legfontosabb információkat, például az ügyfél nevét, a számlázási címet, a határidőt és az esedékes összeget; és strukturált JSON-adatábrázolást ad vissza. A modell jelenleg 27 nyelven támogatja a számlákat.
Támogatott dokumentumtípusok:
- Számlák
- Közüzemi számlák
- Értékesítési rendelések
- Beszerzési rendelések
Automatizált számlafeldolgozás
Az automatizált számlafeldolgozás a számlázási számla dokumentumaiból a fizetendő kulcsfiókok mezőinek kinyerése. A kinyert adatok közé tartoznak azok a sorok, amelyek a számlákhoz tartozó, a számlákhoz tartozó (AP) munkafolyamatokkal integrálva jelennek meg felülvizsgálatok és kifizetések céljából. Korábban a fizetendő számlákat manuálisan hajtják végre, és így nagyon időigényesek. A kulcsadatok pontos kinyerése a számlákból általában az első és az egyik legkritikusabb lépés a számlaautomatizálási folyamat során.
Dokumentumintelligencia-mintacímkéző eszközzel feldolgozott minta számla:
Fejlesztési lehetőségek
A Document Intelligence v4.0 (2024-02-29-preview, 2023-10-31-preview) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források | Modellazonosító |
---|---|---|
Számlamodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
előre összeállított számla |
A Document Intelligence v3.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források | Modellazonosító |
---|---|---|
Számlamodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
előre összeállított számla |
A Document Intelligence 3.0-s verzió a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források | Modellazonosító |
---|---|---|
Számlamodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
előre összeállított számla |
A Document Intelligence v2.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források |
---|---|
Számlamodell | • Dokumentumintelligencia-címkézési eszköz • REST API • Ügyfélkódtár SDK • Dokumentumintelligencia Docker-tároló |
Bemeneti követelmények
A legjobb eredmény érdekében dokumentumonként egy tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.
Támogatott fájlformátumok:
Modell PDF Kép:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) és HTMLOlvasás ✔ ✔ ✔ Elrendezés ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Általános dokumentum ✔ ✔ Előre összeállított ✔ ✔ Egyéni kinyerés ✔ ✔ Egyéni besorolás ✔ ✔ ✔ (2024-02-29-preview) PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).
A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) és 4 MB az ingyenes (F0) szint esetén.
A képméreteknek 50 x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.
Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.
A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül
8
150 pont/hüvelyk (DPI) pont szövegnek felel meg.Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.
Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete sablonmodell esetén 50 MB, a neurális modell esetében pedig 1G-MB.
Egyéni besorolási modell betanítása esetén a betanítási adatok
1GB
teljes mérete legfeljebb 10 000 oldal lehet.
- Támogatott fájlformátumok: JPEG, PNG, PDF és TIFF.
- A támogatott PDF- és TIFF-fájlok legfeljebb 2000 oldalt dolgoznak fel. Az ingyenes szintű előfizetők számára csak az első két oldal feldolgozása történik meg.
- A támogatott fájlméretnek 50 MB-nál kisebbnek és legalább 50 x 50 képpont méretűnek és legfeljebb 10 000 x 10 000 képpontnak kell lennie.
Számlamodell adatainak kinyerése
Megtudhatja, hogyan nyerik ki az adatokat, beleértve az ügyféladatokat, a szállító adatait és a sorelemeket a számlákból. A következő erőforrásokra van szüksége:
Azure-előfizetés – ingyenesen létrehozhat egyet.
Dokumentumintelligencia-példány az Azure Portalon. A szolgáltatás kipróbálásához használhatja az ingyenes tarifacsomagot (
F0
). Az erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget a kulcs és a végpont lekéréséhez.
A Document Intelligence Studio kezdőlapján válassza a Számlák lehetőséget.
Elemezheti a mintául szolgáló számlát, vagy feltöltheti saját fájljait.
Válassza a Futtatás elemzés gombot, és szükség esetén konfigurálja az Elemzési beállításokat :
Dokumentumintelligencia-mintacímkéző eszköz
Lépjen a dokumentumintelligencia-mintaeszközre.
A mintaeszköz kezdőlapján válassza az Előre összeállított modell használata lehetőséget az adatcsempék lekéréséhez.
Válassza ki az elemezni kívánt űrlaptípust a legördülő menüből.
Válassza ki az elemezni kívánt fájl URL-címét az alábbi lehetőségek közül:
A Forrás mezőben válassza az URL-címet a legördülő menüből, illessze be a kijelölt URL-címet, és válassza a Beolvasás gombot.
A Dokumentumintelligencia szolgáltatás végpont mezőjébe illessze be a Dokumentumintelligencia-előfizetéssel beszerzett végpontot.
A kulcsmezőbe illessze be a Dokumentumintelligencia-erőforrásból beszerzett kulcsot.
Válassza a Futtatás elemzése lehetőséget. A dokumentumintelligencia-mintacímkézési eszköz meghívja az Elemzés előre összeállított API-t, és elemzi a dokumentumot.
Az eredmények megtekintése – megtekintheti a kinyert kulcs-érték párokat, a sorelemeket, a kibontott kiemelt szöveget és a táblákat.
Feljegyzés
A Mintacímke eszköz nem támogatja a BMP fájlformátumot. Ez nem a Dokumentumintelligencia-szolgáltatás, hanem az eszköz korlátozása.
Támogatott nyelvek és területi beállítások
A támogatott nyelvek teljes listájáért tekintse meg a Nyelvi támogatás – előre összeállított modellek lapját.
Mező kinyerése
Név | Típus | Leírás | Szabványosított kimenet |
---|---|---|---|
CustomerName | húr | Számlázott ügyfél | Microsoft Corp |
Vevőkód | húr | Ügyfélhivatkozás azonosítója | CID-12345 |
PurchaseOrder | húr | Beszerzési rendelés hivatkozási száma | PO-3333 |
InvoiceId | húr | Az adott számla azonosítója (gyakran számlaszám) | INV-100 |
InvoiceDate (Számla dátuma) | dátum: | a számla kiállításának dátuma | mm-dd-yyyyy |
DueDate | dátum: | a számla esedékességének dátuma | mm-dd-yyyyy |
Szállítónév | húr | A számlát létrehozó szállító | CONTOSO LTD. |
VendorAddress | Cím | Szállító levelezési címe | 123 456th St, New York, NY 10001 |
VendorAddressRecipient | húr | A VendorAddresshez társított név | Contoso központ |
CustomerAddress | Cím | Az ügyfél levelezési címe | 123 Egyéb St, Redmond WA, 98052 |
CustomerAddressRecipient | húr | A CustomerAddresshez társított név | Microsoft Corp |
BillingAddress | Cím | Explicit számlázási cím az ügyfél számára | 123 Bill St, Redmond WA, 98052 |
BillingAddressRecipient | húr | A BillingAddresshez társított név | Microsoft Services |
ShippingAddress | Cím | Explicit szállítási cím az ügyfél számára | 123 Ship St, Redmond WA, 98052 |
ShippingAddressRecipient | húr | A ShippingAddresshez társított név | Microsoft Delivery |
Részösszeg | currency | A számlán azonosított részösszeg mező | 100,00 USD |
TotalDiscount | currency | A számlára alkalmazott teljes kedvezmény | 5,00 USD |
TotalTax | currency | A számlán azonosított összes adómező | 10,00 USD |
InvoiceTotal | currency | A számlához társított összes új díj | 10,00 USD |
AmountDue | currency | A szállítónak fizetendő teljes összeg | 610 USD |
PreviousUnpaidBalance | currency | Explicit, korábban meg nem fizetett egyenleg | 500,00 USD |
RemittanceAddress | Cím | Az ügyfél kifejezett átutalása vagy fizetési címe | 123 Remit St New York, NY, 10001 |
RemittanceAddressRecipient | húr | A RemittanceAddresshez társított név | Contoso számlázás |
ServiceAddress | Cím | Az ügyfél explicit szolgáltatáscíme vagy tulajdonságcíme | 123 Service St, Redmond WA, 98052 |
ServiceAddressRecipient | húr | A ServiceAddresshez társított név | Microsoft Services |
ServiceStartDate | dátum: | A szolgáltatási időszak első dátuma (például egy közüzemi számla szolgáltatási időszaka) | mm-dd-yyyyy |
ServiceEndDate | dátum: | A szolgáltatási időszak záró dátuma (például egy közüzemi számla szolgáltatási időszaka) | mm-dd-yyyyy |
VendorTaxId | húr | A szállítóhoz társított adózói szám | 123456-7 |
CustomerTaxId | húr | Az ügyfélhez társított adózói szám | 765432-1 |
Fizetési idő | húr | A számla fizetési feltételei | Net90 |
KVKNumber | húr | A Hollandiában regisztrált vállalkozások egyedi azonosítója (csak NL-ben) | 12345678 |
CurrencyCode | húr | A kinyert összeghez társított pénznemkód | |
PaymentDetails | array | Olyan tömb, amely tartalmazza a Fizetési mód részleteit( például IBAN :SWIFT , , BPayBillerCode(AU) BPayReference(AU) |
|
TaxDetails | array | Olyan tömb, amely olyan adóadatokat tartalmaz, mint az összeg és a ráta | |
TaxDetails | array | Olyan tömb, amely olyan hozzáadott adóadatokat tartalmaz, mint a CGST , IGST és SGST . Ez a sorelem jelenleg csak Németország (), Spanyolország (de es ), Portugália (pt ) és Az Angol Kanada (en-CA ) területi beállításaihoz érhető el |
Sorelemek tömbje
A JSON-kimeneti válaszban egy számlából kinyert sorelemek a következők (a következő kimenet ezt a mintául szolgáló számlát használja:
Név | Típus | Leírás | Érték (szabványosított kimenet) |
---|---|---|---|
Összeg | currency | A sorelem mennyisége | 60,00 USD |
Dátum | dátum: | Az egyes sorelemeknek megfelelő dátum. Gyakran ez a sorelem szállításának dátuma | 3/4/2021 |
Leírás | húr | A számlasorelem szöveges leírása | Tanácsadási szolgáltatás |
Mennyiség | szám | Ennek a számlasorelemnek a mennyisége | 2 |
ProductCode | húr | Az adott sorelemhez társított termékkód, termékszám vagy termékváltozat | A123 |
Adó | currency | Az egyes sorelemekhez társított adó. A lehetséges értékek közé tartozik az adó összege és az Y/N adó | $6.00 |
TaxRate | húr | Az egyes sorelemekhez társított adókulcs. | 18% |
Unit (Egység) | húr | A sorelem mértékegysége, pl. kg, lb stb. | Óra |
Egységár | szám | A tétel egy egységének nettó vagy bruttó ára (a számla bruttó számlabeállításától függően) | 30,00 USD |
A kicsomagolt számlakulcs-érték párok és sorelemek a documentResults
JSON-kimenet szakaszában találhatók.
Kulcs-érték párok
Az előre összeállított 2022-06-30-s és újabb kiadások támogatják a kulcs-érték párok opcionális visszaadását. Alapértelmezés szerint a kulcs-érték párok visszatérése le van tiltva. A kulcs-érték párok a számlán belül meghatározott spanok, amelyek azonosítják a címkét vagy kulcsot, valamint a hozzá tartozó választ vagy értéket. A számlán ezek a párok lehetnek a címke és a felhasználó által megadott érték az adott mezőhöz vagy telefonszámhoz. Az AI-modell betanítása az azonosítható kulcsok és értékek kinyerésére a dokumentumtípusok, formátumok és struktúrák széles választéka alapján történik.
A kulcsok külön is létezhetnek, ha a modell észleli, hogy egy kulcs létezik, nincs hozzárendelt érték, vagy ha nem kötelező mezőket dolgoz fel. Előfordulhat például, hogy egy középső név mező üresen hagyható egy űrlapon egyes példányokban. A kulcs-érték párok mindig a dokumentumban található szövegekre terjednek ki. Azokban a dokumentumokban, ahol ugyanazt az értéket különböző módokon írják le, például ügyfél/felhasználó, a társított kulcs ügyfél vagy felhasználó (környezet alapján).
Kinyert mezők
A Számla szolgáltatás kinyeri a szöveget, a táblázatokat és a 26 számlamezőt. Az alábbiakban a JSON-kimeneti válaszban egy számlából kinyert mezők jelennek meg (az alábbi kimenet ezt a mintául szolgáló számlát használja).
Név | Típus | Leírás | Szöveges | Érték (szabványosított kimenet) |
---|---|---|---|---|
CustomerName | húr | Számlázott ügyfél | Microsoft Corp | |
Vevőkód | húr | Az ügyfél referencia-azonosítója | CID-12345 | |
PurchaseOrder | húr | Beszerzési rendelés hivatkozási száma | PO-3333 | |
InvoiceId | húr | Az adott számla azonosítója (gyakran "Számlaszám") | INV-100 | |
InvoiceDate (Számla dátuma) | dátum: | A számla kiállításának dátuma | 11/15/2019 | 2019-11-15 |
DueDate | dátum: | A számla kifizetésének dátuma | 2019. 12. 15. | 2019-12-15 |
Szállítónév | húr | A számlát létrehozó szállító | CONTOSO | |
VendorAddress | húr | A szállító levelezési címe | 123 456th St New York, NY, 10001 | |
VendorAddressRecipient | húr | A VendorAddresshez társított név | Contoso központ | |
CustomerAddress | húr | Az ügyfél levelezési címe | 123 Other Street, Redmond, Washington, 98052 | |
CustomerAddressRecipient | húr | A CustomerAddresshez társított név | Microsoft Corp | |
BillingAddress | húr | Explicit számlázási cím az ügyfél számára | 123 Bill Street, Redmond, Washington, 98052 | |
BillingAddressRecipient | húr | A BillingAddresshez társított név | Microsoft Services | |
ShippingAddress | húr | Explicit szállítási cím az ügyfél számára | 123 Ship Street, Redmond, Washington, 98052 | |
ShippingAddressRecipient | húr | A ShippingAddresshez társított név | Microsoft Delivery | |
Részösszeg | szám | A számlán azonosított részösszeg mező | 100,00 USD | 100 |
TotalTax | szám | A számlán azonosított összes adómező | 10,00 USD | 10 |
InvoiceTotal | szám | A számlához társított összes új díj | 110,00 USD | 110 |
AmountDue | szám | A szállítónak fizetendő teljes összeg | 610,00 USD | 610 |
ServiceAddress | húr | Az ügyfél explicit szolgáltatáscíme vagy tulajdonságcíme | 123 Service Street, Redmond, Washington, 98052 | |
ServiceAddressRecipient | húr | A ServiceAddresshez társított név | Microsoft Services | |
RemittanceAddress | húr | Az ügyfél kifejezett átutalása vagy fizetési címe | 123 Remit St New York, NY, 10001 | |
RemittanceAddressRecipient | húr | A RemittanceAddresshez társított név | Contoso számlázás | |
ServiceStartDate | dátum: | A szolgáltatási időszak első dátuma (például egy közüzemi számla szolgáltatási időszaka) | 10/14/2019 | 2019-10-14 |
ServiceEndDate | dátum: | A szolgáltatási időszak záró dátuma (például egy közüzemi számla szolgáltatási időszaka) | 11/14/2019 | 2019-11-14 |
PreviousUnpaidBalance | szám | Explicit, korábban meg nem fizetett egyenleg | 500,00 USD | 500 |
A JSON kimeneti válaszában egy számlából kinyert sorelemek a következők:
Név | Típus | Leírás | Szöveg (1. sorelem) | Érték (szabványosított kimenet) |
---|---|---|---|---|
Elemek | húr | A sorelem teljes sztringszöveg-sora | 2021.03.04. A123 Consulting Services 2 óra 30,00 $ 10% $60,00 | |
Összeg | szám | A sorelem mennyisége | 60,00 USD | 100 |
Leírás | húr | A számlasorelem szöveges leírása | Tanácsadási szolgáltatás | Tanácsadási szolgáltatás |
Mennyiség | szám | Ennek a számlasorelemnek a mennyisége | 2 | 2 |
Egységár | szám | A tétel egy egységének nettó vagy bruttó ára (a számla bruttó számlabeállításától függően) | 30,00 USD | 30 |
ProductCode | húr | Az adott sorelemhez társított termékkód, termékszám vagy termékváltozat | A123 | |
Unit (Egység) | húr | A sorelem mértékegysége, pl. kg, lb stb. | óra | |
Dátum | dátum: | Az egyes sorelemeknek megfelelő dátum. Gyakran ez a sorelem szállításának dátuma | 3/4/2021 | 2021-03-04 |
Adó | szám | Az egyes sorelemekhez társított adó. A lehetséges értékek közé tartozik az adó összege, az adó %, valamint az Y/N adó | 10% |
A JSON-kimeneti válaszban egy számlából kinyert összetett mezők a következők:
TaxDetails
Az adóadatok célja a számlaösszegre alkalmazott különböző adók lebontása.
Név | Típus | Leírás | Szöveg (1. sorelem) | Érték (szabványosított kimenet) |
---|---|---|---|---|
Elemek | húr | Az adóelem teljes sztringszöveg-sora | V.A.T. 15% 60,00 USD | |
Összeg | szám | Az adótétel adóösszege | 60.00 | 60 |
Arány | húr | Az adótétel adókulcsa | 15% |
PaymentDetails
Sorolja fel a mezőben észlelt összes fizetési lehetőséget.
Név | Típus | Leírás | Szöveg (1. sorelem) | Érték (szabványosított kimenet) |
---|---|---|---|---|
IBAN | húr | Belső bankszámlaszám | GB33BUKB20201555555555 | |
SWIFT | húr | SWIFT-kód | BUKBGB22 | |
BPayBillerCode | húr | Ausztrál B-Pay Biller Code | 12345 | |
BPayReference | húr | Ausztrál B-Pay referenciakód | 98765432100 |
JSON-kimenet
A JSON-kimenet három részből áll:
"readResults"
a csomópont tartalmazza az összes felismert szöveget és kijelölési jelet. A szöveg elrendezése oldal, majd sor, majd egyéni szavak szerint történik."pageResults"
a csomópont tartalmazza a határolókeretekkel, megbízhatósággal és a readResultsben lévő vonalakra és szavakra mutató hivatkozást tartalmazó táblákat és cellákat."documentResults"
csomópont tartalmazza a modell által felderített számlaspecifikus értékeket és sorelemeket. Itt található a számla összes mezője, például a számlaazonosító, a szállítási cím, a számla, az ügyfél, az összeg, a sorelemek és még sok más.
Migrálási útmutató
Következő lépések
Próbálja meg feldolgozni saját űrlapjait és dokumentumait a Document Intelligence Studióval.
Végezze el a Dokumentumintelligencia rövid útmutatóját , és kezdje el létrehozni egy dokumentumfeldolgozó alkalmazást a választott fejlesztési nyelven.
Próbálja meg feldolgozni saját űrlapjait és dokumentumait a Dokumentumintelligencia mintacímkéző eszközzel.
Végezze el a Dokumentumintelligencia rövid útmutatóját , és kezdje el létrehozni egy dokumentumfeldolgozó alkalmazást a választott fejlesztési nyelven.