Dokumentumintelligencia-visszaigazolási modell

Fontos

  • A Document Intelligence nyilvános előzetes verziójú kiadásai korai hozzáférést biztosítanak az aktív fejlesztés alatt lévő funkciókhoz.
  • A funkciók, a megközelítések és a folyamatok az általános rendelkezésre állás (GA) előtt változhatnak a felhasználói visszajelzések alapján.
  • A Document Intelligence ügyfélkódtárak nyilvános előzetes verziója alapértelmezés szerint a REST API 2024-02-29-preview verziója.
  • A nyilvános előzetes verzió 2024-02-29 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el:
  • USA keleti régiója
  • USA2 nyugati régiója
  • Nyugat-Európa

Ez a tartalom a következőre vonatkozik::Sakkv4.0 (előzetes verzió) | Korábbi verziók:kék pipav3.1 (GA)kék pipav3.0 (GA)kék pipav2.1 (GA)

Ez a tartalom a következőre vonatkozik::Sakkv3.1 (GA) | Legújabb verzió:lila pipav4.0 (előzetes verzió) | Korábbi verziók:kék pipav3.0kék pipav2.1

Ez a tartalom a következőre vonatkozik::Sakkv3.0 (GA) | Legújabb verziók:lila pipav4.0 (előzetes verzió)lila pipav3.1 | Korábbi verzió:kék pipav2.1

Ez a tartalom a következőre vonatkozik::Sakkv2.1 | Legújabb verzió:kék pipav4.0 (előzetes verzió)

A dokumentumintelligencia-nyugtamodell a hatékony optikai karakterfelismerési (OCR) képességeket mélytanulási modellekkel kombinálva elemzi és kinyeri a legfontosabb információkat az értékesítési bevételekből. A nyugták különböző formátumúak és minőségűek lehetnek, beleértve a nyomtatott és kézzel írt nyugtákat is. Az API kinyeri a főbb információkat, például a kereskedő nevét, a kereskedő telefonszámát, a tranzakció dátumát, az adót és a tranzakció összegét, és strukturált JSON-adatokat ad vissza.

Támogatott nyugtatípusok:

  • Termál
  • Hitelkártya
  • Gas
  • Parkolás
  • Szálloda
  • Szállítmányozás
  • Kommunikáció
  • Szórakozás
  • Repülőút
  • Képzés
  • Gyógyszertár/Orvosi

Nyugtaadatok kinyerése

A nyugta digitalizálása magában foglalja a különböző típusú nyugták, köztük a beolvasott, fényképezett és nyomtatott másolatok digitális formátumba történő átalakítását az egyszerűsített alsóbb rétegbeli feldolgozás érdekében. Ilyenek például a költségkezelés, a fogyasztói viselkedés elemzése, az adóautomatizálás stb. A Dokumentumintelligencia OCR (Optikai karakterfelismerés) technológiával történő használatával kinyerheti és értelmezheti az adatokat ezekből a különböző nyugtaformátumokból. A dokumentumintelligencia-feldolgozás leegyszerűsíti az átalakítás folyamatát, de jelentősen csökkenti a szükséges időt és erőfeszítést, ezáltal elősegíti a hatékony adatkezelést és a lekérést.

A Document Intelligence Studióval feldolgozott minta nyugta:

Képernyőkép a Document Intelligence Studióban feldolgozott minta nyugtáról.

A dokumentumintelligencia-mintacímkéző eszközzel feldolgozott mintabevételezés:

Képernyőkép az űrlapminta címkézési eszközével feldolgozott minta nyugtáról.

Fejlesztési lehetőségek

A Document Intelligence v4.0 (2024-02-29-preview, 2023-10-31-preview) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Nyugtamodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
előre összeállított nyugta

A Document Intelligence v3.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Nyugtamodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
előre összeállított nyugta

A Document Intelligence 3.0-s verzió a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Nyugtamodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
előre összeállított nyugta

A Document Intelligence v2.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források
Nyugtamodell Dokumentumintelligencia-címkézési eszköz
REST API
Ügyfélkódtár SDK
Dokumentumintelligencia Docker-tároló

Bemeneti követelmények

  • A legjobb eredmény érdekében dokumentumonként egy tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.

  • Támogatott fájlformátumok:

    Modell PDF Kép:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) és HTML
    Olvasás
    Elrendezés ✔ (2024-02-29-preview, 2023-10-31-preview)
    Általános dokumentum
    Előre összeállított
    Egyéni kinyerés
    Egyéni besorolás ✔ (2024-02-29-preview)
  • PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).

  • A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) és 4 MB az ingyenes (F0) szint esetén.

  • A képméreteknek 50 x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.

  • Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.

  • A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül 8150 pont/hüvelyk (DPI) pont szövegnek felel meg.

  • Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.

    • Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete sablonmodell esetén 50 MB, a neurális modell esetében pedig 1G-MB.

    • Egyéni besorolási modell betanítása esetén a betanítási adatok 1GB teljes mérete legfeljebb 10 000 oldal lehet.

  • Támogatott fájlformátumok: JPEG, PNG, PDF és TIFF.
  • A PDF és a TIFF támogatott oldalkerete: A dokumentumintelligencia legfeljebb 2000 oldalt képes feldolgozni a standard szintű előfizetők számára, vagy csak az első két oldalt az ingyenes szintű előfizetők számára.
  • Támogatott fájlméret: kisebb, mint 50 MB; minimális képpontok 50 x 50 px; maximális képpontméret 10 000 x 10 000 px.

Nyugtamodell adatkinyerése

Megtudhatja, hogyan nyeri ki a Dokumentumintelligencia az adatokat, beleértve a tranzakciók időpontját és dátumát, a kereskedő adatait és a bevételekből származó összegek összegét. A következő erőforrásokra van szüksége:

  • Azure-előfizetés – ingyenesen létrehozhat egyet.

  • Dokumentumintelligencia-példány az Azure Portalon. A szolgáltatás kipróbálásához használhatja az ingyenes tarifacsomagot (F0). Az erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget a kulcs és a végpont lekéréséhez.

Képernyőkép a kulcsok és a végpontok helyéről az Azure Portalon.

Feljegyzés

A Document Intelligence Studio 3.1-s és 3.0-s verziójú API-kkal és újabb verziókkal érhető el.

  1. A Document Intelligence Studio kezdőlapján válassza a Visszaigazolások lehetőséget.

  2. Elemezheti a minta nyugtát, vagy feltöltheti saját fájljait.

  3. Válassza az Elemzés futtatása gombot, és szükség esetén konfigurálja az Elemzési beállításokat:

    Képernyőkép a Document Intelligence Studio Elemzés és elemzés beállításai gombjairól.

Dokumentumintelligencia-mintacímkéző eszköz

  1. Lépjen a dokumentumintelligencia-mintaeszközre.

  2. A mintaeszköz kezdőlapján válassza az Előre összeállított modell használata lehetőséget az adatcsempék lekéréséhez.

    Képernyőkép az elrendezési modell eredményelemzési folyamatáról.

  3. Válassza ki az elemezni kívánt űrlaptípust a legördülő menüből.

  4. Válassza ki az elemezni kívánt fájl URL-címét az alábbi lehetőségek közül:

  5. A Forrás mezőben válassza az URL-címet a legördülő menüből, illessze be a kijelölt URL-címet, és válassza a Beolvasás gombot.

    Képernyőkép a forráshely legördülő menüről.

  6. A Dokumentumintelligencia szolgáltatás végpont mezőjébe illessze be a Dokumentumintelligencia-előfizetéssel beszerzett végpontot.

  7. A kulcsmezőbe illessze be a Dokumentumintelligencia-erőforrásból beszerzett kulcsot.

    Képernyőkép a select-form típusú legördülő menüről.

  8. Válassza a Futtatás elemzése lehetőséget. A dokumentumintelligencia-mintacímkézési eszköz meghívja az Elemzés előre összeállított API-t, és elemzi a dokumentumot.

  9. Az eredmények megtekintése – megtekintheti a kinyert kulcs-érték párokat, a sorelemeket, a kibontott kiemelt szöveget és a táblákat.

    Képernyőkép az elrendezési modell eredményelemzési műveletéről.

Feljegyzés

A Mintacímke eszköz nem támogatja a BMP fájlformátumot. Ez nem a Dokumentumintelligencia-szolgáltatás, hanem az eszköz korlátozása.

Támogatott nyelvek és területi beállítások

A támogatott nyelvek teljes listájáért tekintse meg a Nyelvi támogatás – előre összeállított modellek lapját.

Mező kinyerése

Név Típus Leírás Szabványosított kimenet
ReceiptType Sztring Értékesítési nyugta típusa Tételes
MerchantName Sztring A nyugtát kiállító kereskedő neve
Kereskedő Telefon Number phoneNumber A kereskedő telefonszáma +1 xxx xxx xxxx
MerchantAddress Sztring A kereskedő listázott címe
TransactionDate Dátum A nyugta kiállításának dátuma yyyy-mm-dd
TransactionTime Idő A nyugta kiállításának időpontja hh-mm-ss (24 órás)
Összesen Szám (USD) A nyugta teljes tranzakciós összege Két decimális lebegőpontos
Részösszeg Szám (USD) A bevétel részösszege, gyakran az adók alkalmazása előtt Két decimális lebegőpontos
Adó Szám (USD) Teljes bevételi adó (gyakran forgalmi adó vagy azzal egyenértékű). 2022-06-30-ban átnevezték a "TotalTax" névre. Két decimális lebegőpontos
Tipp. Szám (USD) A vevő által tartalmazott tipp Két decimális lebegőpontos
Elemek Objektumok tömbje Kinyert sorelemek névvel, mennyiséggel, egységárral és a kinyert teljes ármal
Név Sztring Elem leírása. 2022-06-30-ban átnevezték a "Leírás" névre.
Mennyiség Szám Az egyes cikkek mennyisége Két decimális lebegőpontos
Ár Szám Az egyes cikkegységek egyedi ára Két decimális lebegőpontos
Teljes ár Szám Sortétel teljes ára Két decimális lebegőpontos

A Document Intelligence 3.0-s és újabb verziói számos új funkciót és képességet tartalmaznak. A termikus nyugták mellett a nyugtamodell támogatja az egyoldalas szállodai nyugtafeldolgozást és az adórészletek kinyerését az összes nyugtatípushoz.

A Document Intelligence 4.0-s és újabb verziói a termál- és szállodai nyugták minden árával kapcsolatos mezőhöz támogatják a pénznemet.

Nyugta

Mező Típus Leírás Példa
MerchantName string A nyugtát kiállító kereskedő neve Contoso
MerchantPhoneNumber phoneNumber A kereskedő telefonszáma 987-654-3210
MerchantAddress address A kereskedő listázott címe 123 Main St. Redmond, Washington 98052
Total number A nyugta teljes tranzakciós összege 14,34 USD
TransactionDate date A nyugta kiállításának dátuma 2019. június 06.
TransactionTime time A nyugta kiállításának időpontja 16:49
Subtotal number A bevétel részösszege, gyakran az adók alkalmazása előtt 12,34 USD
TotalTax number Nyugtaadó, gyakran forgalmi adó vagy azzal egyenértékű 2,00 USD
Tip number A vevő által tartalmazott tipp 1,00 USD
Items array
Items.* object Kicsomagolt sorelem 0
Surface Pro 6
999,00 USD
999,00 USD
Items.*.TotalPrice number Sortétel teljes ára 999,00 USD
Items.*.Description string Elem leírása Surface Pro 6
Items.*.Quantity number Az egyes cikkek mennyisége 0
Items.*.Price number Az egyes cikkegységek egyedi ára 999,00 USD
Items.*.ProductCode string Az adott sorelemhez társított termékkód, termékszám vagy termékváltozat A123
Items.*.QuantityUnit string Az egyes cikkek mennyiségegysége
TaxDetails array
TaxDetails.* object Kicsomagolt sorelem 0
Surface Pro 6
999,00 USD
999,00 USD
TaxDetails.*.Amount currency Az adórészlet összege 999,00 USD

receipt.retailMeal

Mező Típus Leírás Példa
MerchantName string A nyugtát kiállító kereskedő neve Contoso
MerchantPhoneNumber phoneNumber A kereskedő telefonszáma 987-654-3210
MerchantAddress address A kereskedő listázott címe 123 Main St. Redmond, Washington 98052
Total number A nyugta teljes tranzakciós összege 14,34 USD
TransactionDate date A nyugta kiállításának dátuma 2019. június 06.
TransactionTime time A nyugta kiállításának időpontja 16:49
Subtotal number A bevétel részösszege, gyakran az adók alkalmazása előtt 12,34 USD
TotalTax number Nyugtaadó, gyakran forgalmi adó vagy azzal egyenértékű 2,00 USD
Tip number A vevő által tartalmazott tipp 1,00 USD
Items array
Items.* object Kicsomagolt sorelem 0
Surface Pro 6
999,00 USD
999,00 USD
Items.*.TotalPrice number Sortétel teljes ára 999,00 USD
Items.*.Description string Elem leírása Surface Pro 6
Items.*.Quantity number Az egyes cikkek mennyisége 0
Items.*.Price number Az egyes cikkegységek egyedi ára 999,00 USD
Items.*.ProductCode string Az adott sorelemhez társított termékkód, termékszám vagy termékváltozat A123
Items.*.QuantityUnit string Az egyes cikkek mennyiségegysége
TaxDetails array
TaxDetails.* object Kicsomagolt sorelem 0
Surface Pro 6
999,00 USD
999,00 USD
TaxDetails.*.Amount currency Az adórészlet összege 999,00 USD

receipt.creditCard

Mező Típus Leírás Példa
MerchantName string A nyugtát kiállító kereskedő neve Contoso
MerchantPhoneNumber phoneNumber A kereskedő telefonszáma 987-654-3210
MerchantAddress address A kereskedő listázott címe 123 Main St. Redmond, Washington 98052
Total number A nyugta teljes tranzakciós összege 14,34 USD
TransactionDate date A nyugta kiállításának dátuma 2019. június 06.
TransactionTime time A nyugta kiállításának időpontja 16:49
Subtotal number A bevétel részösszege, gyakran az adók alkalmazása előtt 12,34 USD
TotalTax number Nyugtaadó, gyakran forgalmi adó vagy azzal egyenértékű 2,00 USD
Tip number A vevő által tartalmazott tipp 1,00 USD
Items array
Items.* object Kicsomagolt sorelem 0
Surface Pro 6
999,00 USD
999,00 USD
Items.*.TotalPrice number Sortétel teljes ára 999,00 USD
Items.*.Description string Elem leírása Surface Pro 6
Items.*.Quantity number Az egyes cikkek mennyisége 0
Items.*.Price number Az egyes cikkegységek egyedi ára 999,00 USD
Items.*.ProductCode string Az adott sorelemhez társított termékkód, termékszám vagy termékváltozat A123
Items.*.QuantityUnit string Az egyes cikkek mennyiségegysége
TaxDetails array
TaxDetails.* object Kicsomagolt sorelem 0
Surface Pro 6
999,00 USD
999,00 USD
TaxDetails.*.Amount currency Az adórészlet összege 999,00 USD

receipt.gas

Mező Típus Leírás Példa
MerchantName string A nyugtát kiállító kereskedő neve Contoso
MerchantPhoneNumber phoneNumber A kereskedő telefonszáma 987-654-3210
MerchantAddress address A kereskedő listázott címe 123 Main St. Redmond, Washington 98052
Total number A nyugta teljes tranzakciós összege 14,34 USD
TransactionDate date A nyugta kiállításának dátuma 2019. június 06.
TransactionTime time A nyugta kiállításának időpontja 16:49
Subtotal number A bevétel részösszege, gyakran az adók alkalmazása előtt 12,34 USD
TotalTax number Nyugtaadó, gyakran forgalmi adó vagy azzal egyenértékű 2,00 USD
Tip number A vevő által tartalmazott tipp 1,00 USD
Items array
Items.* object Kicsomagolt sorelem 0
Surface Pro 6
999,00 USD
999,00 USD
Items.*.TotalPrice number Sortétel teljes ára 999,00 USD
Items.*.Description string Elem leírása Surface Pro 6
Items.*.Quantity number Az egyes cikkek mennyisége 0
Items.*.Price number Az egyes cikkegységek egyedi ára 999,00 USD
Items.*.ProductCode string Az adott sorelemhez társított termékkód, termékszám vagy termékváltozat A123
Items.*.QuantityUnit string Az egyes cikkek mennyiségegysége
TaxDetails array
TaxDetails.* object Kicsomagolt sorelem 0
Surface Pro 6
999,00 USD
999,00 USD
TaxDetails.*.Amount currency Az adórészlet összege 999,00 USD

receipt.parking

Mező Típus Leírás Példa
MerchantName string A nyugtát kiállító kereskedő neve Contoso
MerchantPhoneNumber phoneNumber A kereskedő telefonszáma 987-654-3210
MerchantAddress address A kereskedő listázott címe 123 Main St. Redmond, Washington 98052
Total number A nyugta teljes tranzakciós összege 14,34 USD
TransactionDate date A nyugta kiállításának dátuma 2019. június 06.
TransactionTime time A nyugta kiállításának időpontja 16:49
Subtotal number A bevétel részösszege, gyakran az adók alkalmazása előtt 12,34 USD
TotalTax number Nyugtaadó, gyakran forgalmi adó vagy azzal egyenértékű 2,00 USD
Tip number A vevő által tartalmazott tipp 1,00 USD
Items array
Items.* object Kicsomagolt sorelem 0
Surface Pro 6
999,00 USD
999,00 USD
Items.*.TotalPrice number Sortétel teljes ára 999,00 USD
Items.*.Description string Elem leírása Surface Pro 6
Items.*.Quantity number Az egyes cikkek mennyisége 0
Items.*.Price number Az egyes cikkegységek egyedi ára 999,00 USD
Items.*.ProductCode string Az adott sorelemhez társított termékkód, termékszám vagy termékváltozat A123
Items.*.QuantityUnit string Az egyes cikkek mennyiségegysége
TaxDetails array
TaxDetails.* object Kicsomagolt sorelem 0
Surface Pro 6
999,00 USD
999,00 USD
TaxDetails.*.Amount currency Az adórészlet összege 999,00 USD

receipt.hotel

Mező Típus Leírás Példa
MerchantName string A nyugtát kiállító kereskedő neve Contoso
MerchantPhoneNumber phoneNumber A kereskedő telefonszáma 987-654-310
MerchantAddress address A kereskedő listázott címe 123 Main St. Redmond, Washington 98052
Total number A nyugta teljes tranzakciós összege 14,34 USD
ArrivalDate date Érkezés dátuma 27Mar21
DepartureDate date Indulás dátuma 28Mar21
Currency string A nyugtaösszegek pénznemegysége (ISO 4217) vagy "VEGYES", ha több érték található USD
MerchantAliases array
MerchantAliases.* string A kereskedő alternatív neve Contoso (R)
Items array
Items.* object Kicsomagolt sorelem 0
Surface Pro 6
999,00 USD
999,00 USD
Items.*.TotalPrice number Sortétel teljes ára 999,00 USD
Items.*.Description string Elem leírása Szobadíj
Items.*.Date date Elem dátuma 27Mar21
Items.*.Category string Elemkategória Szoba

Migrálási útmutató és REST API 3.1-es verzió

  • Kövesse a Document Intelligence v3.1 migrálási útmutatóját, amelyből megtudhatja, hogyan használhatja a v3.1-es verziót az alkalmazásokban és munkafolyamatokban.

Következő lépések