Dokumentumintelligencia-visszaigazolási modell

Cikk
10/17/2024

Fontos

A Document Intelligence nyilvános előzetes verziójú kiadásai korai hozzáférést biztosítanak az aktív fejlesztés alatt lévő funkciókhoz. A funkciók, a megközelítések és a folyamatok az általános rendelkezésre állás (GA) előtt változhatnak a felhasználói visszajelzések alapján.
A Document Intelligence ügyfélkódtárak nyilvános előzetes verziója alapértelmezés szerint a REST API 2024-07-31-preview verziója.
A nyilvános előzetes verzió 2024-07-31 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el. Vegye figyelembe, hogy az AI Studio egyéni generatív (dokumentummező-kinyerési) modellje csak az USA északi középső régiójában érhető el:
- USA keleti régiója
- USA2 nyugati régiója
- Nyugat-Európa
- USA északi középső régiója

Ez a tartalom a következőre vonatkozik: v4.0 (előzetes verzió) | Korábbi verziók: v3.1 (GA) v3.0 (GA) v2.1 (GA)

Ez a tartalom a következőre vonatkozik: v3.1 (GA) | Legújabb verzió: v4.0 (előzetes verzió) | Korábbi verziók: v3.0 v2.1

Ez a tartalom a következőre vonatkozik: v3.0 (GA) | Legújabb verziók: v4.0 (előzetes verzió) v3.1 | Korábbi verzió: 2.1-es verzió

Ez a tartalom a következőre vonatkozik: v2.1 | Legújabb verzió: 4.0-s verzió (előzetes verzió)

A dokumentumintelligencia-nyugtamodell a hatékony optikai karakterfelismerési (OCR) képességeket mélytanulási modellekkel kombinálva elemzi és kinyeri a legfontosabb információkat az értékesítési bevételekből. A nyugták különböző formátumúak és minőségűek lehetnek, beleértve a nyomtatott és kézzel írt nyugtákat is. Az API kinyeri a főbb információkat, például a kereskedő nevét, a kereskedő telefonszámát, a tranzakció dátumát, az adót és a tranzakció összegét, és strukturált JSON-adatokat ad vissza.

Támogatott nyugtatípusok:

Termikus
Hitelkártya
Gas
Parkoló
Szálloda
Szállítmányozás
Kommunikáció
Szórakozás
Repülőút
Oktatás
Gyógyszertár/Orvosi

Nyugtaadatok kinyerése

A nyugta digitalizálása magában foglalja a különböző típusú nyugták, köztük a beolvasott, fényképezett és nyomtatott másolatok digitális formátumba történő átalakítását az egyszerűsített alsóbb rétegbeli feldolgozás érdekében. Ilyenek például a költségkezelés, a fogyasztói viselkedés elemzése, az adóautomatizálás stb. A Dokumentumintelligencia OCR (Optikai karakterfelismerés) technológiával történő használatával kinyerheti és értelmezheti az adatokat ezekből a különböző nyugtaformátumokból. A dokumentumintelligencia-feldolgozás leegyszerűsíti az átalakítás folyamatát, de jelentősen csökkenti a szükséges időt és erőfeszítést, ezáltal elősegíti a hatékony adatkezelést és a lekérést.

A Document Intelligence Studióval feldolgozott minta nyugta:

A dokumentumintelligencia-mintacímkéző eszközzel feldolgozott mintabevételezés:

Képernyőkép az űrlapminta címkézési eszközével feldolgozott minta nyugtáról.

Fejlesztési lehetőségek

A Document Intelligence v4.0 (2024-07-31-preview) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás	Források	Modellazonosító
Nyugtamodell	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	előre összeállított nyugta

A Document Intelligence v3.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás	Források	Modellazonosító
Nyugtamodell	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	előre összeállított nyugta

A Document Intelligence 3.0-s verzió a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás	Források	Modellazonosító
Nyugtamodell	• Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK	előre összeállított nyugta

A Document Intelligence v2.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás	Források
Nyugtamodell	• Dokumentumintelligencia-címkézési eszköz • REST API • Ügyfélkódtár SDK • Dokumentumintelligencia Docker-tároló

Bemeneti követelmények

Támogatott fájlformátumok:

Modell	PDF	Kép: `JPEG/JPG`, `PNG`, `BMP`, `TIFFHEIF`	Microsoft Office: Word (`DOCX`), Excel (`XLSX`), PowerPoint (`PPTX`), HTML
Olvasás	✔	✔	✔
Elrendezés	✔	✔	✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
Általános dokumentum	✔	✔
Előre összeállított	✔	✔
Egyéni kinyerés	✔	✔
Egyéni besorolás	✔	✔	✔ (2024-07-31-preview, 2024-02-29-preview)

A legjobb eredmény érdekében dokumentumonként egy tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.
PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).
A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) szint, az 4 ingyenes (F0) szint esetén pedig MB.
A képméreteknek 50 képpont x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.
Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.
A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül 8 150 pont/hüvelyk (DPI) pontszövegnek felel meg.
Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.
- Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete 50 MB a sablonmodellhez, a neurális modellhez pedig 1 GB.
- Egyéni besorolási modell betanítása esetén a betanítási adatok 1 teljes mérete GB, legfeljebb 10 000 oldal. A 2024-07-31-es és újabb verziókban a betanítási adatok 2 teljes mérete GB, legfeljebb 10 000 oldal.

Támogatott fájlformátumok: JPEG, PNG, PDF és TIFF.
A PDF és a TIFF támogatott oldalkerete: A dokumentumintelligencia legfeljebb 2000 oldalt képes feldolgozni a standard szintű előfizetők számára, vagy csak az első két oldalt az ingyenes szintű előfizetők számára.
Támogatott fájlméret: kisebb, mint 50 MB; minimális képpontok 50 x 50 px; maximális képpontméret 10 000 x 10 000 px.

Nyugtamodell adatkinyerése

Megtudhatja, hogyan nyeri ki a Dokumentumintelligencia az adatokat, beleértve a tranzakciók időpontját és dátumát, a kereskedő adatait és a bevételekből származó összegek összegét. A következő erőforrásokra van szüksége:

Azure-előfizetés – ingyenesen létrehozhat egyet.
Dokumentumintelligencia-példány az Azure Portalon. A szolgáltatás kipróbálásához használhatja az ingyenes tarifacsomagot (F0). Az erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget a kulcs és a végpont lekéréséhez.

Képernyőkép a kulcsok és a végpontok helyéről az Azure Portalon.

Feljegyzés

A Document Intelligence Studio 3.1-s és 3.0-s verziójú API-kkal és újabb verziókkal érhető el.

A Document Intelligence Studio kezdőlapján válassza a Visszaigazolások lehetőséget.
Elemezheti a minta nyugtát, vagy feltöltheti saját fájljait.
Válassza az Elemzés futtatása gombot, és szükség esetén konfigurálja az Elemzési beállításokat:

Próbálja ki a Document Intelligence Studiót.

Dokumentumintelligencia-mintacímkéző eszköz

Lépjen a dokumentumintelligencia-mintaeszközre.
A mintaeszköz kezdőlapján válassza az Előre összeállított modell használata lehetőséget az adatcsempék lekéréséhez.
Válassza ki az elemezni kívánt űrlaptípust a legördülő menüből.
Válassza ki az elemezni kívánt fájl URL-címét az alábbi lehetőségek közül:
A Forrás mezőben válassza az URL-címet a legördülő menüből, illessze be a kijelölt URL-címet, és válassza a Beolvasás gombot.
A Dokumentumintelligencia szolgáltatás végpont mezőjébe illessze be a Dokumentumintelligencia-előfizetéssel beszerzett végpontot.
A kulcsmezőbe illessze be a Dokumentumintelligencia-erőforrásból beszerzett kulcsot.
Válassza a Futtatás elemzése lehetőséget. A dokumentumintelligencia-mintacímkézési eszköz meghívja az Elemzés előre összeállított API-t, és elemzi a dokumentumot.
Az eredmények megtekintése – megtekintheti a kinyert kulcs-érték párokat, a sorelemeket, a kibontott kiemelt szöveget és a táblákat.

Feljegyzés

A Mintacímke eszköz nem támogatja a BMP fájlformátumot. Ez nem a Dokumentumintelligencia-szolgáltatás, hanem az eszköz korlátozása.

Támogatott nyelvek és területi beállítások

A támogatott nyelvek teljes listáját az előre összeállított modellek nyelvtámogatási oldalán találja.

Mező kinyerése

Név	Típus	Leírás	Szabványosított kimenet
ReceiptType	Sztring	Értékesítési nyugta típusa	Tételes
MerchantName	Sztring	A nyugtát kiállító kereskedő neve
MerchantPhoneNumber	phoneNumber	A kereskedő telefonszáma	+1 xxx xxx xxxx
MerchantAddress	Sztring	A kereskedő listázott címe
TransactionDate	Dátum	A nyugta kiállításának dátuma	yyyy-mm-dd
TransactionTime	Idő	A nyugta kiállításának időpontja	hh-mm-ss (24 órás)
Összesen	Szám (USD)	A nyugta teljes tranzakciós összege	Két decimális lebegőpontos
Részösszeg	Szám (USD)	A bevétel részösszege, gyakran az adók alkalmazása előtt	Két decimális lebegőpontos
Adó	Szám (USD)	Teljes bevételi adó (gyakran forgalmi adó vagy azzal egyenértékű). 2022-06-30-ban átnevezték a "TotalTax" névre.	Két decimális lebegőpontos
Tipp.	Szám (USD)	A vevő által tartalmazott tipp	Két decimális lebegőpontos
Elemek	Objektumok tömbje	Kinyert sorelemek névvel, mennyiséggel, egységárral és a kinyert teljes ármal
Név	Sztring	Elem leírása. 2022-06-30-ban átnevezték a "Leírás" névre.
Mennyiség	Szám	Az egyes cikkek mennyisége	Két decimális lebegőpontos
Ár	Szám	Az egyes cikkegységek egyedi ára	Két decimális lebegőpontos
Teljes ár	Szám	Sortétel teljes ára	Két decimális lebegőpontos

A támogatott dokumentumkinyerési mezőkért tekintse meg a GitHub-mintaadattárban található nyugtamodell sémalapját .

Migrálási útmutató és REST API 3.1-es verzió

Kövesse a Document Intelligence v3.1 migrálási útmutatóját, amelyből megtudhatja, hogyan használhatja a v3.1-es verziót az alkalmazásokban és munkafolyamatokban.

Következő lépések

Próbálja meg feldolgozni saját űrlapjait és dokumentumait a Document Intelligence Studióval.
Végezze el a Dokumentumintelligencia rövid útmutatóját , és kezdje el létrehozni egy dokumentumfeldolgozó alkalmazást a választott fejlesztési nyelven.

További példákat találhat a GitHubon.

További példákat találhat a GitHubon.

Próbálja meg feldolgozni saját űrlapjait és dokumentumait a Dokumentumintelligencia mintacímkéző eszközzel.
Végezze el a Dokumentumintelligencia rövid útmutatóját , és kezdje el létrehozni egy dokumentumfeldolgozó alkalmazást a választott fejlesztési nyelven.

Megosztás a következőn keresztül: