Dokumentumintelligencia számlamodellje
Fontos
- A Document Intelligence nyilvános előzetes verziójú kiadásai korai hozzáférést biztosítanak az aktív fejlesztés alatt lévő funkciókhoz. A funkciók, a megközelítések és a folyamatok az általános rendelkezésre állás (GA) előtt változhatnak a felhasználói visszajelzések alapján.
- A Document Intelligence ügyfélkódtárak nyilvános előzetes verziója alapértelmezés szerint a REST API 2024-07-31-preview verziója.
- A nyilvános előzetes verzió 2024-07-31 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el. Vegye figyelembe, hogy az AI Studio egyéni generatív (dokumentummező-kinyerési) modellje csak az USA északi középső régiójában érhető el:
- USA keleti régiója
- USA2 nyugati régiója
- Nyugat-Európa
- USA északi középső régiója
Ez a tartalom a következőre vonatkozik: v4.0 (előzetes verzió) | Korábbi verziók: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Ez a tartalom a következőre vonatkozik: v3.1 (GA) | Legújabb verzió: v4.0 (előzetes verzió) | Korábbi verziók: v3.0 v2.1
Ez a tartalom a következőre vonatkozik: v3.0 (GA) | Legújabb verziók: v4.0 (előzetes verzió) v3.1 | Korábbi verzió: 2.1-es verzió
Ez a tartalom a következőre vonatkozik: v2.1 | Legújabb verzió: 4.0-s verzió (előzetes verzió)
A Dokumentumintelligencia számlamodell hatékony optikai karakterfelismerési (OCR) képességekkel elemzi és kinyeri a kulcsmezőket és sorelemeket az értékesítési számlákból, a közüzemi számlákból és a beszerzési rendelésekből. A számlák különböző formátumúak és minőségűek lehetnek, beleértve a telefonon rögzített képeket, a beolvasott dokumentumokat és a digitális PDF-eket. Az API elemzi a számla szövegét; kinyeri a legfontosabb információkat, például az ügyfél nevét, a számlázási címet, a határidőt és az esedékes összeget; és strukturált JSON-adatábrázolást ad vissza. A modell jelenleg 27 nyelven támogatja a számlákat.
Támogatott dokumentumtípusok:
- Számlák
- Közüzemi számlák
- Értékesítési rendelések
- Beszerzési rendelések
Automatizált számlafeldolgozás
Az automatikus számlafeldolgozás a kulcsmezők accounts payable
számlázási fiókdokumentumokból való kinyerésének folyamata. A kinyert adatok közé tartoznak azok a sorok, amelyek a számlákhoz tartozó, a számlákhoz tartozó (AP) munkafolyamatokkal integrálva jelennek meg felülvizsgálatok és kifizetések céljából. Korábban a fizetendő számlákat manuálisan hajtják végre, és így nagyon időigényesek. A kulcsadatok pontos kinyerése a számlákból általában az első és az egyik legkritikusabb lépés a számlaautomatizálási folyamat során.
Dokumentumintelligencia-mintacímkéző eszközzel feldolgozott minta számla:
Fejlesztési lehetőségek
A Document Intelligence v4.0 (2024-07-31-preview) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források | Modellazonosító |
---|---|---|
Számlamodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
előre összeállított számla |
A Document Intelligence v3.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források | Modellazonosító |
---|---|---|
Számlamodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
előre összeállított számla |
A Document Intelligence 3.0-s verzió a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források | Modellazonosító |
---|---|---|
Számlamodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
előre összeállított számla |
A Document Intelligence v2.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források |
---|---|
Számlamodell | • Dokumentumintelligencia-címkézési eszköz • REST API • Ügyfélkódtár SDK • Dokumentumintelligencia Docker-tároló |
Bemeneti követelmények
Támogatott fájlformátumok:
Modell PDF Kép: JPEG/JPG
,PNG
,BMP
,TIFF
HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLOlvasás ✔ ✔ ✔ Elrendezés ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Általános dokumentum ✔ ✔ Előre összeállított ✔ ✔ Egyéni kinyerés ✔ ✔ Egyéni besorolás ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) A legjobb eredmény érdekében dokumentumonként egy tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.
PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).
A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) szint, az
4
ingyenes (F0) szint esetén pedig MB.A képméreteknek 50 képpont x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.
Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.
A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül
8
150 pont/hüvelyk (DPI) pontszövegnek felel meg.Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.
Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete 50 MB a sablonmodellhez, a neurális modellhez pedig
1
GB.Egyéni besorolási modell betanítása esetén a betanítási adatok
1
teljes mérete GB, legfeljebb 10 000 oldal. A 2024-07-31-es és újabb verziókban a betanítási adatok2
teljes mérete GB, legfeljebb 10 000 oldal.
- Támogatott fájlformátumok: JPEG, PNG, PDF és TIFF.
- A támogatott PDF- és TIFF-fájlok legfeljebb 2000 oldalt dolgoznak fel. Az ingyenes szintű előfizetők számára csak az első két oldal feldolgozása történik meg.
- A támogatott fájlméretnek 50 MB-nál kisebbnek és legalább 50 x 50 képpont méretűnek és legfeljebb 10 000 x 10 000 képpontnak kell lennie.
Számlamodell adatainak kinyerése
Megtudhatja, hogyan nyerik ki az adatokat, beleértve az ügyféladatokat, a szállító adatait és a sorelemeket a számlákból. A következő erőforrásokra van szüksége:
Azure-előfizetés – ingyenesen létrehozhat egyet.
Dokumentumintelligencia-példány az Azure Portalon. A szolgáltatás kipróbálásához használhatja az ingyenes tarifacsomagot (
F0
). Az erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget a kulcs és a végpont lekéréséhez.
A Document Intelligence Studio kezdőlapján válassza a Számlák lehetőséget.
Elemezheti a mintául szolgáló számlát, vagy feltöltheti saját fájljait.
Válassza a Futtatás elemzés gombot, és szükség esetén konfigurálja az Elemzési beállításokat :
Dokumentumintelligencia-mintacímkéző eszköz
Lépjen a dokumentumintelligencia-mintaeszközre.
A mintaeszköz kezdőlapján válassza az Előre összeállított modell használata lehetőséget az adatcsempék lekéréséhez.
Válassza ki az elemezni kívánt űrlaptípust a legördülő menüből.
Válassza ki az elemezni kívánt fájl URL-címét az alábbi lehetőségek közül:
A Forrás mezőben válassza az URL-címet a legördülő menüből, illessze be a kijelölt URL-címet, és válassza a Beolvasás gombot.
A Dokumentumintelligencia szolgáltatás végpont mezőjébe illessze be a Dokumentumintelligencia-előfizetéssel beszerzett végpontot.
A kulcsmezőbe illessze be a Dokumentumintelligencia-erőforrásból beszerzett kulcsot.
Válassza a Futtatás elemzése lehetőséget. A dokumentumintelligencia-mintacímkézési eszköz meghívja az Elemzés előre összeállított API-t, és elemzi a dokumentumot.
Az eredmények megtekintése – megtekintheti a kinyert kulcs-érték párokat, a sorelemeket, a kibontott kiemelt szöveget és a táblákat.
Feljegyzés
A Mintacímke eszköz nem támogatja a BMP fájlformátumot. Ez nem a Dokumentumintelligencia-szolgáltatás, hanem az eszköz korlátozása.
Támogatott nyelvek és területi beállítások
A támogatott nyelvek teljes listáját az előre összeállított modell nyelvtámogatási oldalán találja.
Mező kinyerése
A támogatott dokumentumkinyerési mezőkért tekintse meg a GitHub-mintaadattárban található számlamodell sémalapját .
A kicsomagolt számlakulcs-érték párok és sorelemek a
documentResults
JSON-kimenet szakaszában találhatók.
Kulcs-érték párok
Az előre összeállított 2022-06-30-s és újabb kiadások támogatják a kulcs-érték párok opcionális visszaadását. Alapértelmezés szerint a kulcs-érték párok visszatérése le van tiltva. A kulcs-érték párok a számlán belül meghatározott spanok, amelyek azonosítják a címkét vagy kulcsot, valamint a hozzá tartozó választ vagy értéket. A számlán ezek a párok lehetnek a címke és a felhasználó által megadott érték az adott mezőhöz vagy telefonszámhoz. Az AI-modell betanítása az azonosítható kulcsok és értékek kinyerésére a dokumentumtípusok, formátumok és struktúrák széles választéka alapján történik.
A kulcsok külön is létezhetnek, ha a modell észleli, hogy egy kulcs létezik, nincs hozzárendelt érték, vagy ha nem kötelező mezőket dolgoz fel. Előfordulhat például, hogy egy középső név mező üresen hagyható egy űrlapon egyes példányokban. A kulcs-érték párok mindig a dokumentumban található szövegekre terjednek ki. Azokban a dokumentumokban, ahol ugyanazt az értéket különböző módokon írják le, például ügyfél/felhasználó, a társított kulcs ügyfél vagy felhasználó (környezet alapján).
Kinyert mezők
A Számla szolgáltatás kinyeri a szöveget, a táblázatokat és a 26 számlamezőt. Az alábbiakban a JSON-kimeneti válaszban egy számlából kinyert mezők jelennek meg (az alábbi kimenet ezt a mintául szolgáló számlát használja).
Név | Típus | Leírás | Szöveges | Érték (szabványosított kimenet) |
---|---|---|---|---|
CustomerName | húr | Számlázott ügyfél | Microsoft Corp | |
Vevőkód | húr | Az ügyfél referencia-azonosítója | CID-12345 | |
PurchaseOrder | húr | Beszerzési rendelés hivatkozási száma | PO-3333 | |
InvoiceId | húr | Az adott számla azonosítója (gyakran "Számlaszám") | INV-100 | |
InvoiceDate (Számla dátuma) | dátum: | A számla kiállításának dátuma | 11/15/2019 | 2019-11-15 |
DueDate | dátum: | A számla kifizetésének dátuma | 2019. 12. 15. | 2019-12-15 |
VendorName | húr | A számlát létrehozó szállító | CONTOSO | |
VendorAddress | húr | A szállító levelezési címe | 123 456th St New York, NY, 10001 | |
VendorAddressRecipient | húr | A VendorAddresshez társított név | Contoso központ | |
CustomerAddress | húr | Az ügyfél levelezési címe | 123 Other Street, Redmond, Washington, 98052 | |
CustomerAddressRecipient | húr | A CustomerAddresshez társított név | Microsoft Corp | |
BillingAddress | húr | Explicit számlázási cím az ügyfél számára | 123 Bill Street, Redmond, Washington, 98052 | |
BillingAddressRecipient | húr | A BillingAddresshez társított név | Microsoft Services | |
ShippingAddress | húr | Explicit szállítási cím az ügyfél számára | 123 Ship Street, Redmond, Washington, 98052 | |
ShippingAddressRecipient | húr | A ShippingAddresshez társított név | Microsoft Delivery | |
Részösszeg | szám | A számlán azonosított részösszeg mező | 100,00 USD | 100 |
TotalTax | szám | A számlán azonosított összes adómező | 10,00 USD | 10 |
InvoiceTotal | szám | A számlához társított összes új díj | 110,00 USD | 110 |
AmountDue | szám | A szállítónak fizetendő teljes összeg | 610,00 USD | 610 |
ServiceAddress | húr | Az ügyfél explicit szolgáltatáscíme vagy tulajdonságcíme | 123 Service Street, Redmond, Washington, 98052 | |
ServiceAddressRecipient | húr | A ServiceAddresshez társított név | Microsoft Services | |
RemittanceAddress | húr | Az ügyfél kifejezett átutalása vagy fizetési címe | 123 Remit St New York, NY, 10001 | |
RemittanceAddressRecipient | húr | A RemittanceAddresshez társított név | Contoso számlázás | |
ServiceStartDate | dátum: | A szolgáltatási időszak első dátuma (például egy közüzemi számla szolgáltatási időszaka) | 10/14/2019 | 2019-10-14 |
ServiceEndDate | dátum: | A szolgáltatási időszak záró dátuma (például egy közüzemi számla szolgáltatási időszaka) | 11/14/2019 | 2019-11-14 |
PreviousUnpaidBalance | szám | Explicit, korábban meg nem fizetett egyenleg | 500,00 USD | 500 |
A JSON kimeneti válaszában egy számlából kinyert sorelemek a következők:
Név | Típus | Leírás | Szöveg (1. sorelem) | Érték (szabványosított kimenet) |
---|---|---|---|---|
Elemek | húr | A sorelem teljes sztringszöveg-sora | 2021.03.04. A123 Consulting Services 2 óra 30,00 $ 10% $60,00 | |
Összeg | szám | A sorelem mennyisége | 60,00 USD | 100 |
Leírás | húr | A számlasorelem szöveges leírása | Tanácsadói szolgáltatás | Tanácsadói szolgáltatás |
Mennyiség | szám | Ennek a számlasorelemnek a mennyisége | 2 | 2 |
Egységár | szám | A tétel egy egységének nettó vagy bruttó ára (a számla bruttó számlabeállításától függően) | 30,00 USD | 30 |
ProductCode | húr | Az adott sorelemhez társított termékkód, termékszám vagy termékváltozat | A123 | |
Unit (Egység) | húr | A sorelem mértékegysége, pl. kg, lb stb. | óra | |
Dátum | dátum: | Az egyes sorelemeknek megfelelő dátum. Gyakran ez a sorelem szállításának dátuma | 3/4/2021 | 2021-03-04 |
Adó | szám | Az egyes sorelemekhez társított adó. A lehetséges értékek közé tartozik az adó összege, az adó %, valamint az Y/N adó | 10% |
A JSON-kimeneti válaszban egy számlából kinyert összetett mezők a következők:
TaxDetails
Az adó részletei konkrét adókat határoznak meg a számla végösszegére alkalmazva.
Név | Típus | Leírás | Szöveg (1. sorelem) | Érték (szabványosított kimenet) |
---|---|---|---|---|
Elemek | húr | Az adóelem teljes sztringszöveg-sora | V.A.T. 15% 60,00 USD | |
Összeg | szám | Az adótétel adóösszege | 60.00 | 60 |
Arány | húr | Az adótétel adókulcsa | 15% |
PaymentDetails
Sorolja fel a mezőben észlelt összes fizetési lehetőséget.
Név | Típus | Leírás | Szöveg (1. sorelem) | Érték (szabványosított kimenet) |
---|---|---|---|---|
IBAN |
húr | Belső bankszámlaszám | GB33BUKB20201555555555 | |
SWIFT |
húr | SWIFT-kód | BUKBGB22 | |
BankAccountNumber | húr | Bankszámlaszám, bankszámla egyedi azonosítója | 123456 | |
BPayBillerCode | húr | Ausztrál B-Pay Biller Code | 12345 | |
BPayReference | húr | Ausztrál B-Pay referenciakód | 98765432100 |
JSON-kimenet
A JSON-kimenet három részből áll:
"readResults"
a csomópont tartalmazza az összes felismert szöveget és kijelölési jelet. A szöveg elrendezése oldal, majd sor, majd egyéni szavak szerint történik."pageResults"
a csomópont tartalmazza a határolókeretekkel, megbízhatósággal és a readResultsben lévő vonalakra és szavakra mutató hivatkozást tartalmazó táblákat és cellákat."documentResults"
csomópont tartalmazza a modell által felderített számlaspecifikus értékeket és sorelemeket. Itt található a számla összes mezője, például a számlaazonosító, a szállítási cím, a számla, az ügyfél, az összeg, a sorelemek és még sok más.
Migrálási útmutató
Következő lépések
Próbálja meg feldolgozni saját űrlapjait és dokumentumait a Document Intelligence Studióval.
Végezze el a Dokumentumintelligencia rövid útmutatóját , és kezdje el létrehozni egy dokumentumfeldolgozó alkalmazást a választott fejlesztési nyelven.
Próbálja meg feldolgozni saját űrlapjait és dokumentumait a Dokumentumintelligencia mintacímkéző eszközzel.
Végezze el a Dokumentumintelligencia rövid útmutatóját , és kezdje el létrehozni egy dokumentumfeldolgozó alkalmazást a választott fejlesztési nyelven.