Dokumentumintelligencia-visszaigazolási modell
Fontos
- A Document Intelligence nyilvános előzetes verziójú kiadásai korai hozzáférést biztosítanak az aktív fejlesztés alatt lévő funkciókhoz. A funkciók, a megközelítések és a folyamatok az általános rendelkezésre állás (GA) előtt változhatnak a felhasználói visszajelzések alapján.
- A Document Intelligence ügyfélkódtárak nyilvános előzetes verziója alapértelmezés szerint a REST API 2024-07-31-preview verziója.
- A nyilvános előzetes verzió 2024-07-31 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el. Vegye figyelembe, hogy az AI Studio egyéni generatív (dokumentummező-kinyerési) modellje csak az USA északi középső régiójában érhető el:
- USA keleti régiója
- USA2 nyugati régiója
- Nyugat-Európa
- USA északi középső régiója
Ez a tartalom a következőre vonatkozik: v4.0 (előzetes verzió) | Korábbi verziók: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Ez a tartalom a következőre vonatkozik: v3.1 (GA) | Legújabb verzió: v4.0 (előzetes verzió) | Korábbi verziók: v3.0 v2.1
Ez a tartalom a következőre vonatkozik: v3.0 (GA) | Legújabb verziók: v4.0 (előzetes verzió) v3.1 | Korábbi verzió: 2.1-es verzió
Ez a tartalom a következőre vonatkozik: v2.1 | Legújabb verzió: 4.0-s verzió (előzetes verzió)
A dokumentumintelligencia-nyugtamodell a hatékony optikai karakterfelismerési (OCR) képességeket mélytanulási modellekkel kombinálva elemzi és kinyeri a legfontosabb információkat az értékesítési bevételekből. A nyugták különböző formátumúak és minőségűek lehetnek, beleértve a nyomtatott és kézzel írt nyugtákat is. Az API kinyeri a főbb információkat, például a kereskedő nevét, a kereskedő telefonszámát, a tranzakció dátumát, az adót és a tranzakció összegét, és strukturált JSON-adatokat ad vissza.
Támogatott nyugtatípusok:
- Termikus
- Hitelkártya
- Gas
- Parkoló
- Szálloda
- Szállítmányozás
- Kommunikáció
- Szórakozás
- Repülőút
- Oktatás
- Gyógyszertár/Orvosi
Nyugtaadatok kinyerése
A nyugta digitalizálása magában foglalja a különböző típusú nyugták, köztük a beolvasott, fényképezett és nyomtatott másolatok digitális formátumba történő átalakítását az egyszerűsített alsóbb rétegbeli feldolgozás érdekében. Ilyenek például a költségkezelés, a fogyasztói viselkedés elemzése, az adóautomatizálás stb. A Dokumentumintelligencia OCR (Optikai karakterfelismerés) technológiával történő használatával kinyerheti és értelmezheti az adatokat ezekből a különböző nyugtaformátumokból. A dokumentumintelligencia-feldolgozás leegyszerűsíti az átalakítás folyamatát, de jelentősen csökkenti a szükséges időt és erőfeszítést, ezáltal elősegíti a hatékony adatkezelést és a lekérést.
A dokumentumintelligencia-mintacímkéző eszközzel feldolgozott mintabevételezés:
Fejlesztési lehetőségek
A Document Intelligence v4.0 (2024-07-31-preview) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források | Modellazonosító |
---|---|---|
Nyugtamodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
előre összeállított nyugta |
A Document Intelligence v3.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források | Modellazonosító |
---|---|---|
Nyugtamodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
előre összeállított nyugta |
A Document Intelligence 3.0-s verzió a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források | Modellazonosító |
---|---|---|
Nyugtamodell | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
előre összeállított nyugta |
A Document Intelligence v2.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:
Szolgáltatás | Források |
---|---|
Nyugtamodell | • Dokumentumintelligencia-címkézési eszköz • REST API • Ügyfélkódtár SDK • Dokumentumintelligencia Docker-tároló |
Bemeneti követelmények
Támogatott fájlformátumok:
Modell PDF Kép: JPEG/JPG
,PNG
,BMP
,TIFF
HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLOlvasás ✔ ✔ ✔ Elrendezés ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Általános dokumentum ✔ ✔ Előre összeállított ✔ ✔ Egyéni kinyerés ✔ ✔ Egyéni besorolás ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) A legjobb eredmény érdekében dokumentumonként egy tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.
PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).
A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) szint, az
4
ingyenes (F0) szint esetén pedig MB.A képméreteknek 50 képpont x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.
Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.
A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül
8
150 pont/hüvelyk (DPI) pontszövegnek felel meg.Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.
Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete 50 MB a sablonmodellhez, a neurális modellhez pedig
1
GB.Egyéni besorolási modell betanítása esetén a betanítási adatok
1
teljes mérete GB, legfeljebb 10 000 oldal. A 2024-07-31-es és újabb verziókban a betanítási adatok2
teljes mérete GB, legfeljebb 10 000 oldal.
- Támogatott fájlformátumok: JPEG, PNG, PDF és TIFF.
- A PDF és a TIFF támogatott oldalkerete: A dokumentumintelligencia legfeljebb 2000 oldalt képes feldolgozni a standard szintű előfizetők számára, vagy csak az első két oldalt az ingyenes szintű előfizetők számára.
- Támogatott fájlméret: kisebb, mint 50 MB; minimális képpontok 50 x 50 px; maximális képpontméret 10 000 x 10 000 px.
Nyugtamodell adatkinyerése
Megtudhatja, hogyan nyeri ki a Dokumentumintelligencia az adatokat, beleértve a tranzakciók időpontját és dátumát, a kereskedő adatait és a bevételekből származó összegek összegét. A következő erőforrásokra van szüksége:
Azure-előfizetés – ingyenesen létrehozhat egyet.
Dokumentumintelligencia-példány az Azure Portalon. A szolgáltatás kipróbálásához használhatja az ingyenes tarifacsomagot (
F0
). Az erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget a kulcs és a végpont lekéréséhez.
Feljegyzés
A Document Intelligence Studio 3.1-s és 3.0-s verziójú API-kkal és újabb verziókkal érhető el.
A Document Intelligence Studio kezdőlapján válassza a Visszaigazolások lehetőséget.
Elemezheti a minta nyugtát, vagy feltöltheti saját fájljait.
Válassza az Elemzés futtatása gombot, és szükség esetén konfigurálja az Elemzési beállításokat:
Dokumentumintelligencia-mintacímkéző eszköz
Lépjen a dokumentumintelligencia-mintaeszközre.
A mintaeszköz kezdőlapján válassza az Előre összeállított modell használata lehetőséget az adatcsempék lekéréséhez.
Válassza ki az elemezni kívánt űrlaptípust a legördülő menüből.
Válassza ki az elemezni kívánt fájl URL-címét az alábbi lehetőségek közül:
A Forrás mezőben válassza az URL-címet a legördülő menüből, illessze be a kijelölt URL-címet, és válassza a Beolvasás gombot.
A Dokumentumintelligencia szolgáltatás végpont mezőjébe illessze be a Dokumentumintelligencia-előfizetéssel beszerzett végpontot.
A kulcsmezőbe illessze be a Dokumentumintelligencia-erőforrásból beszerzett kulcsot.
Válassza a Futtatás elemzése lehetőséget. A dokumentumintelligencia-mintacímkézési eszköz meghívja az Elemzés előre összeállított API-t, és elemzi a dokumentumot.
Az eredmények megtekintése – megtekintheti a kinyert kulcs-érték párokat, a sorelemeket, a kibontott kiemelt szöveget és a táblákat.
Feljegyzés
A Mintacímke eszköz nem támogatja a BMP fájlformátumot. Ez nem a Dokumentumintelligencia-szolgáltatás, hanem az eszköz korlátozása.
Támogatott nyelvek és területi beállítások
A támogatott nyelvek teljes listáját az előre összeállított modellek nyelvtámogatási oldalán találja.
Mező kinyerése
Név | Típus | Leírás | Szabványosított kimenet |
---|---|---|---|
ReceiptType | Sztring | Értékesítési nyugta típusa | Tételes |
MerchantName | Sztring | A nyugtát kiállító kereskedő neve | |
MerchantPhoneNumber | phoneNumber | A kereskedő telefonszáma | +1 xxx xxx xxxx |
MerchantAddress | Sztring | A kereskedő listázott címe | |
TransactionDate | Dátum | A nyugta kiállításának dátuma | yyyy-mm-dd |
TransactionTime | Idő | A nyugta kiállításának időpontja | hh-mm-ss (24 órás) |
Összesen | Szám (USD) | A nyugta teljes tranzakciós összege | Két decimális lebegőpontos |
Részösszeg | Szám (USD) | A bevétel részösszege, gyakran az adók alkalmazása előtt | Két decimális lebegőpontos |
Adó | Szám (USD) | Teljes bevételi adó (gyakran forgalmi adó vagy azzal egyenértékű). 2022-06-30-ban átnevezték a "TotalTax" névre. | Két decimális lebegőpontos |
Tipp. | Szám (USD) | A vevő által tartalmazott tipp | Két decimális lebegőpontos |
Elemek | Objektumok tömbje | Kinyert sorelemek névvel, mennyiséggel, egységárral és a kinyert teljes ármal | |
Név | Sztring | Elem leírása. 2022-06-30-ban átnevezték a "Leírás" névre. | |
Mennyiség | Szám | Az egyes cikkek mennyisége | Két decimális lebegőpontos |
Ár | Szám | Az egyes cikkegységek egyedi ára | Két decimális lebegőpontos |
Teljes ár | Szám | Sortétel teljes ára | Két decimális lebegőpontos |
A támogatott dokumentumkinyerési mezőkért tekintse meg a GitHub-mintaadattárban található nyugtamodell sémalapját .
Migrálási útmutató és REST API 3.1-es verzió
Következő lépések
Próbálja meg feldolgozni saját űrlapjait és dokumentumait a Document Intelligence Studióval.
Végezze el a Dokumentumintelligencia rövid útmutatóját , és kezdje el létrehozni egy dokumentumfeldolgozó alkalmazást a választott fejlesztési nyelven.
Próbálja meg feldolgozni saját űrlapjait és dokumentumait a Dokumentumintelligencia mintacímkéző eszközzel.
Végezze el a Dokumentumintelligencia rövid útmutatóját , és kezdje el létrehozni egy dokumentumfeldolgozó alkalmazást a választott fejlesztési nyelven.