Megosztás a következőn keresztül:


Dokumentumintelligencia számlamodellje

Fontos

  • A Document Intelligence nyilvános előzetes verziójú kiadásai korai hozzáférést biztosítanak az aktív fejlesztés alatt lévő funkciókhoz. A funkciók, a megközelítések és a folyamatok az általános rendelkezésre állás (GA) előtt változhatnak a felhasználói visszajelzések alapján.
  • A Document Intelligence ügyfélkódtárak nyilvános előzetes verziója alapértelmezés szerint a REST API 2024-07-31-preview verziója.
  • A nyilvános előzetes verzió 2024-07-31 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el. Vegye figyelembe, hogy az AI Studio egyéni generatív (dokumentummező-kinyerési) modellje csak az USA északi középső régiójában érhető el:
    • USA keleti régiója
    • USA2 nyugati régiója
    • Nyugat-Európa
    • USA északi középső régiója

Ez a tartalom a következőre vonatkozik:Sakk v4.0 (előzetes verzió) | Korábbi verziók: kék pipa v3.1 (GA) kék pipa v3.0 (GA) kék pipa v2.1 (GA)

Ez a tartalom a következőre vonatkozik: Sakk v3.1 (GA) | Legújabb verzió: lila pipa v4.0 (előzetes verzió) | Korábbi verziók: kék pipa v3.0 kék pipa v2.1

Ez a tartalom a következőre vonatkozik: Sakk v3.0 (GA) | Legújabb verziók:lila pipa v4.0 (előzetes verzió) lila pipa v3.1 | Korábbi verzió: kék pipa 2.1-es verzió

Ez a tartalom a következőre vonatkozik: Sakk v2.1 | Legújabb verzió: kék pipa 4.0-s verzió (előzetes verzió)

A Dokumentumintelligencia számlamodell hatékony optikai karakterfelismerési (OCR) képességekkel elemzi és kinyeri a kulcsmezőket és sorelemeket az értékesítési számlákból, a közüzemi számlákból és a beszerzési rendelésekből. A számlák különböző formátumúak és minőségűek lehetnek, beleértve a telefonon rögzített képeket, a beolvasott dokumentumokat és a digitális PDF-eket. Az API elemzi a számla szövegét; kinyeri a legfontosabb információkat, például az ügyfél nevét, a számlázási címet, a határidőt és az esedékes összeget; és strukturált JSON-adatábrázolást ad vissza. A modell jelenleg 27 nyelven támogatja a számlákat.

Támogatott dokumentumtípusok:

  • Számlák
  • Közüzemi számlák
  • Értékesítési rendelések
  • Beszerzési rendelések

Automatizált számlafeldolgozás

Az automatikus számlafeldolgozás a kulcsmezők accounts payable számlázási fiókdokumentumokból való kinyerésének folyamata. A kinyert adatok közé tartoznak azok a sorok, amelyek a számlákhoz tartozó, a számlákhoz tartozó (AP) munkafolyamatokkal integrálva jelennek meg felülvizsgálatok és kifizetések céljából. Korábban a fizetendő számlákat manuálisan hajtják végre, és így nagyon időigényesek. A kulcsadatok pontos kinyerése a számlákból általában az első és az egyik legkritikusabb lépés a számlaautomatizálási folyamat során.

A Document Intelligence Studióval feldolgozott minta számla:

Képernyőkép a Document Intelligence Studióban elemzett számlamintáról.

Dokumentumintelligencia-mintacímkéző eszközzel feldolgozott minta számla:

Képernyőkép egy számlamintáról.

Fejlesztési lehetőségek

A Document Intelligence v4.0 (2024-07-31-preview) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Számlamodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
előre összeállított számla

A Document Intelligence v3.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Számlamodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
előre összeállított számla

A Document Intelligence 3.0-s verzió a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Számlamodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
előre összeállított számla

A Document Intelligence v2.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források
Számlamodell Dokumentumintelligencia-címkézési eszköz
REST API
Ügyfélkódtár SDK
Dokumentumintelligencia Docker-tároló

Bemeneti követelmények

  • Támogatott fájlformátumok:

    Modell PDF Kép:
    JPEG/JPG, PNG, BMP, TIFFHEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Olvasás
    Elrendezés ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Általános dokumentum
    Előre összeállított
    Egyéni kinyerés
    Egyéni besorolás ✔ (2024-07-31-preview, 2024-02-29-preview)
  • A legjobb eredmény érdekében dokumentumonként egy tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.

  • PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).

  • A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) szint, az 4 ingyenes (F0) szint esetén pedig MB.

  • A képméreteknek 50 képpont x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.

  • Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.

  • A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül 8 150 pont/hüvelyk (DPI) pontszövegnek felel meg.

  • Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.

    • Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete 50 MB a sablonmodellhez, a neurális modellhez pedig 1 GB.

    • Egyéni besorolási modell betanítása esetén a betanítási adatok 1 teljes mérete GB, legfeljebb 10 000 oldal. A 2024-07-31-es és újabb verziókban a betanítási adatok 2 teljes mérete GB, legfeljebb 10 000 oldal.

  • Támogatott fájlformátumok: JPEG, PNG, PDF és TIFF.
  • A támogatott PDF- és TIFF-fájlok legfeljebb 2000 oldalt dolgoznak fel. Az ingyenes szintű előfizetők számára csak az első két oldal feldolgozása történik meg.
  • A támogatott fájlméretnek 50 MB-nál kisebbnek és legalább 50 x 50 képpont méretűnek és legfeljebb 10 000 x 10 000 képpontnak kell lennie.

Számlamodell adatainak kinyerése

Megtudhatja, hogyan nyerik ki az adatokat, beleértve az ügyféladatokat, a szállító adatait és a sorelemeket a számlákból. A következő erőforrásokra van szüksége:

  • Azure-előfizetés – ingyenesen létrehozhat egyet.

  • Dokumentumintelligencia-példány az Azure Portalon. A szolgáltatás kipróbálásához használhatja az ingyenes tarifacsomagot (F0). Az erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget a kulcs és a végpont lekéréséhez.

Képernyőkép a kulcsok és a végpontok helyéről az Azure Portalon.

  1. A Document Intelligence Studio kezdőlapján válassza a Számlák lehetőséget.

  2. Elemezheti a mintául szolgáló számlát, vagy feltöltheti saját fájljait.

  3. Válassza a Futtatás elemzés gombot, és szükség esetén konfigurálja az Elemzési beállításokat :

    Képernyőkép a Document Intelligence Studio Elemzés és elemzés beállításai gombjairól.

Dokumentumintelligencia-mintacímkéző eszköz

  1. Lépjen a dokumentumintelligencia-mintaeszközre.

  2. A mintaeszköz kezdőlapján válassza az Előre összeállított modell használata lehetőséget az adatcsempék lekéréséhez.

    Képernyőkép az elrendezésmodell eredményelemzési folyamatáról.

  3. Válassza ki az elemezni kívánt űrlaptípust a legördülő menüből.

  4. Válassza ki az elemezni kívánt fájl URL-címét az alábbi lehetőségek közül:

  5. A Forrás mezőben válassza az URL-címet a legördülő menüből, illessze be a kijelölt URL-címet, és válassza a Beolvasás gombot.

    Képernyőkép a forráshely legördülő menüről.

  6. A Dokumentumintelligencia szolgáltatás végpont mezőjébe illessze be a Dokumentumintelligencia-előfizetéssel beszerzett végpontot.

  7. A kulcsmezőbe illessze be a Dokumentumintelligencia-erőforrásból beszerzett kulcsot.

    Képernyőkép a select-form típusú legördülő menüről.

  8. Válassza a Futtatás elemzése lehetőséget. A dokumentumintelligencia-mintacímkézési eszköz meghívja az Elemzés előre összeállított API-t, és elemzi a dokumentumot.

  9. Az eredmények megtekintése – megtekintheti a kinyert kulcs-érték párokat, a sorelemeket, a kibontott kiemelt szöveget és a táblákat.

    Képernyőkép az elrendezésmodell eredményelemzési műveletéről.

Feljegyzés

A Mintacímke eszköz nem támogatja a BMP fájlformátumot. Ez nem a Dokumentumintelligencia-szolgáltatás, hanem az eszköz korlátozása.

Támogatott nyelvek és területi beállítások

A támogatott nyelvek teljes listáját az előre összeállított modell nyelvtámogatási oldalán találja.

Mező kinyerése

Kulcs-érték párok

Az előre összeállított 2022-06-30-s és újabb kiadások támogatják a kulcs-érték párok opcionális visszaadását. Alapértelmezés szerint a kulcs-érték párok visszatérése le van tiltva. A kulcs-érték párok a számlán belül meghatározott spanok, amelyek azonosítják a címkét vagy kulcsot, valamint a hozzá tartozó választ vagy értéket. A számlán ezek a párok lehetnek a címke és a felhasználó által megadott érték az adott mezőhöz vagy telefonszámhoz. Az AI-modell betanítása az azonosítható kulcsok és értékek kinyerésére a dokumentumtípusok, formátumok és struktúrák széles választéka alapján történik.

A kulcsok külön is létezhetnek, ha a modell észleli, hogy egy kulcs létezik, nincs hozzárendelt érték, vagy ha nem kötelező mezőket dolgoz fel. Előfordulhat például, hogy egy középső név mező üresen hagyható egy űrlapon egyes példányokban. A kulcs-érték párok mindig a dokumentumban található szövegekre terjednek ki. Azokban a dokumentumokban, ahol ugyanazt az értéket különböző módokon írják le, például ügyfél/felhasználó, a társított kulcs ügyfél vagy felhasználó (környezet alapján).

Kinyert mezők

A Számla szolgáltatás kinyeri a szöveget, a táblázatokat és a 26 számlamezőt. Az alábbiakban a JSON-kimeneti válaszban egy számlából kinyert mezők jelennek meg (az alábbi kimenet ezt a mintául szolgáló számlát használja).

Név Típus Leírás Szöveges Érték (szabványosított kimenet)
CustomerName húr Számlázott ügyfél Microsoft Corp
Vevőkód húr Az ügyfél referencia-azonosítója CID-12345
PurchaseOrder húr Beszerzési rendelés hivatkozási száma PO-3333
InvoiceId húr Az adott számla azonosítója (gyakran "Számlaszám") INV-100
InvoiceDate (Számla dátuma) dátum: A számla kiállításának dátuma 11/15/2019 2019-11-15
DueDate dátum: A számla kifizetésének dátuma 2019. 12. 15. 2019-12-15
VendorName húr A számlát létrehozó szállító CONTOSO
VendorAddress húr A szállító levelezési címe 123 456th St New York, NY, 10001
VendorAddressRecipient húr A VendorAddresshez társított név Contoso központ
CustomerAddress húr Az ügyfél levelezési címe 123 Other Street, Redmond, Washington, 98052
CustomerAddressRecipient húr A CustomerAddresshez társított név Microsoft Corp
BillingAddress húr Explicit számlázási cím az ügyfél számára 123 Bill Street, Redmond, Washington, 98052
BillingAddressRecipient húr A BillingAddresshez társított név Microsoft Services
ShippingAddress húr Explicit szállítási cím az ügyfél számára 123 Ship Street, Redmond, Washington, 98052
ShippingAddressRecipient húr A ShippingAddresshez társított név Microsoft Delivery
Részösszeg szám A számlán azonosított részösszeg mező 100,00 USD 100
TotalTax szám A számlán azonosított összes adómező 10,00 USD 10
InvoiceTotal szám A számlához társított összes új díj 110,00 USD 110
AmountDue szám A szállítónak fizetendő teljes összeg 610,00 USD 610
ServiceAddress húr Az ügyfél explicit szolgáltatáscíme vagy tulajdonságcíme 123 Service Street, Redmond, Washington, 98052
ServiceAddressRecipient húr A ServiceAddresshez társított név Microsoft Services
RemittanceAddress húr Az ügyfél kifejezett átutalása vagy fizetési címe 123 Remit St New York, NY, 10001
RemittanceAddressRecipient húr A RemittanceAddresshez társított név Contoso számlázás
ServiceStartDate dátum: A szolgáltatási időszak első dátuma (például egy közüzemi számla szolgáltatási időszaka) 10/14/2019 2019-10-14
ServiceEndDate dátum: A szolgáltatási időszak záró dátuma (például egy közüzemi számla szolgáltatási időszaka) 11/14/2019 2019-11-14
PreviousUnpaidBalance szám Explicit, korábban meg nem fizetett egyenleg 500,00 USD 500

A JSON kimeneti válaszában egy számlából kinyert sorelemek a következők:

Név Típus Leírás Szöveg (1. sorelem) Érték (szabványosított kimenet)
Elemek húr A sorelem teljes sztringszöveg-sora 2021.03.04. A123 Consulting Services 2 óra 30,00 $ 10% $60,00
Összeg szám A sorelem mennyisége 60,00 USD 100
Leírás húr A számlasorelem szöveges leírása Tanácsadói szolgáltatás Tanácsadói szolgáltatás
Mennyiség szám Ennek a számlasorelemnek a mennyisége 2 2
Egységár szám A tétel egy egységének nettó vagy bruttó ára (a számla bruttó számlabeállításától függően) 30,00 USD 30
ProductCode húr Az adott sorelemhez társított termékkód, termékszám vagy termékváltozat A123
Unit (Egység) húr A sorelem mértékegysége, pl. kg, lb stb. óra
Dátum dátum: Az egyes sorelemeknek megfelelő dátum. Gyakran ez a sorelem szállításának dátuma 3/4/2021 2021-03-04
Adó szám Az egyes sorelemekhez társított adó. A lehetséges értékek közé tartozik az adó összege, az adó %, valamint az Y/N adó 10%

A JSON-kimeneti válaszban egy számlából kinyert összetett mezők a következők:

TaxDetails

Az adó részletei konkrét adókat határoznak meg a számla végösszegére alkalmazva.

Név Típus Leírás Szöveg (1. sorelem) Érték (szabványosított kimenet)
Elemek húr Az adóelem teljes sztringszöveg-sora V.A.T. 15% 60,00 USD
Összeg szám Az adótétel adóösszege 60.00 60
Arány húr Az adótétel adókulcsa 15%

PaymentDetails

Sorolja fel a mezőben észlelt összes fizetési lehetőséget.

Név Típus Leírás Szöveg (1. sorelem) Érték (szabványosított kimenet)
IBAN húr Belső bankszámlaszám GB33BUKB20201555555555
SWIFT húr SWIFT-kód BUKBGB22
BankAccountNumber húr Bankszámlaszám, bankszámla egyedi azonosítója 123456
BPayBillerCode húr Ausztrál B-Pay Biller Code 12345
BPayReference húr Ausztrál B-Pay referenciakód 98765432100

JSON-kimenet

A JSON-kimenet három részből áll:

  • "readResults" a csomópont tartalmazza az összes felismert szöveget és kijelölési jelet. A szöveg elrendezése oldal, majd sor, majd egyéni szavak szerint történik.
  • "pageResults" a csomópont tartalmazza a határolókeretekkel, megbízhatósággal és a readResultsben lévő vonalakra és szavakra mutató hivatkozást tartalmazó táblákat és cellákat.
  • "documentResults" csomópont tartalmazza a modell által felderített számlaspecifikus értékeket és sorelemeket. Itt található a számla összes mezője, például a számlaazonosító, a szállítási cím, a számla, az ügyfél, az összeg, a sorelemek és még sok más.

Migrálási útmutató

  • Kövesse a Document Intelligence v3.1 migrálási útmutatóját, amelyből megtudhatja, hogyan használhatja a v3.0-s verziót az alkalmazásokban és munkafolyamatokban.

Következő lépések