Mi az Az Azure AI-dokumentumintelligencia?

Fontos

  • A Document Intelligence nyilvános előzetes verziójú kiadásai korai hozzáférést biztosítanak az aktív fejlesztés alatt lévő funkciókhoz.
  • A funkciók, a megközelítések és a folyamatok az általános rendelkezésre állás (GA) előtt változhatnak a felhasználói visszajelzések alapján.
  • A Document Intelligence ügyfélkódtárak nyilvános előzetes verziója alapértelmezés szerint a REST API 2024-02-29-preview verziója.
  • A nyilvános előzetes verzió 2024-02-29 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el:
  • USA keleti régiója
  • USA2 nyugati régiója
  • Nyugat-Európa

Ez a tartalom a következőre vonatkozik::Sakkv4.0 (előzetes verzió) | Korábbi verziók:kék pipav3.1 (GA)kék pipav3.0 (GA)kék pipav2.1 (GA)

Ez a tartalom a következőre vonatkozik::Sakkv3.1 (GA) | Legújabb verzió:lila pipav4.0 (előzetes verzió) | Korábbi verziók:kék pipav3.0kék pipav2.1

Ez a tartalom a következőre vonatkozik::Sakkv3.0 (GA) | Legújabb verziók:lila pipav4.0 (előzetes verzió)lila pipav3.1 (előzetes verzió) | Előző verzió:kék pipav2.1

Ez a tartalom a következőre vonatkozik::Sakkv2.1 | Legújabb verzió:kék pipav4.0 (előzetes verzió)

Feljegyzés

A Form Recognizer mostantól Az Azure AI-dokumentumintelligencia!

  • 2023 júliusától az Azure AI-szolgáltatások a korábban Cognitive Servicesnek és Azure-alkalmazás lied AI-szolgáltatásoknak nevezett összes szolgáltatást magukban foglalják.
  • A díjszabás nem változik.
  • A Cognitive Services és a Azure-alkalmazás lied AI neve továbbra is használatos az Azure-számlázásban, a költségelemzésben, az árlistában és az ár API-kban.
  • Az alkalmazásprogramozási felületek (API-k) és az SDK-k nem változnak a 3.1-et megelőző és az azt megelőző verzióban. A 4.0-s verziótól kezdve az API-k és az SDK-k a Dokumentumintelligencia szolgáltatásra frissülnek.
  • Egyes platformok továbbra is az átnevezési frissítésre várnak. A Dokumentációnkban a Form Recognizer vagy a Document Intelligence minden említése ugyanarra az Azure-szolgáltatásra vonatkozik.

Az Azure AI Document Intelligence egy felhőalapú Azure AI-szolgáltatás, amely lehetővé teszi intelligens dokumentumfeldolgozási megoldások létrehozását. A számos adattípust felölelő nagy mennyiségű adat űrlapokban és dokumentumokban van tárolva. A Dokumentumintelligencia segítségével hatékonyan kezelheti az adatok gyűjtésének és feldolgozásának sebességét, és kulcsfontosságú a továbbfejlesztett műveletekhez, a megalapozott adatvezérelt döntésekhez és a felvilágosult innovációhoz.

| ✔️ Dokumentumelemzési modellek | ✔️ Előre összeállított modellek | ✔️ Egyéni modellek |

Dokumentumelemzési modellek

A dokumentumelemzési modellek lehetővé teszik az űrlapokból és dokumentumokból való szövegkivételt, és strukturált, üzleti használatra kész tartalmakat ad vissza, amelyek készen állnak a szervezet tevékenységére, használatára vagy előrehaladására.


Olvasás | Nyomtatott
és kézzel írt szöveg kinyerve.


Elrendezés | Szöveg, táblázatok
és dokumentumstruktúra kinyerése.


Olvasás | Nyomtatott
és kézzel írt szöveg kinyerve.


Elrendezés | Szöveg, táblázatok
és dokumentumstruktúra kinyerése.


Általános dokumentum | Szöveg,
struktúra és kulcs-érték párok kinyerése.

Előre összeállított modellek

Az előre összeállított modellek lehetővé teszik intelligens dokumentumfeldolgozás hozzáadását az alkalmazásokhoz és folyamatokhoz anélkül, hogy saját modelleket kellene betanítanod és felépíteni.


Számla | Vevői
és szállítói adatok kinyerve.


Nyugta | Értékesítési
tranzakció részleteinek kinyerésében.


Identitás | Azonosítási
és ellenőrzési adatok kinyerésével.


1003 EULA | A jelzálog részleteinek kinyerésében.


1008 - os űrlap | A jelzálog részleteinek kinyerésében.


Záró közzététel | A jelzálog részleteinek kinyerésében.


Egészségbiztosítási kártya | Az egészségbiztosítás
részleteinek kinyerésében.


Szerződés | Bontsa ki a szerződést
és a felek adatait.


Hitelkártya/bankkártya | Információk kinyerve a bankkártyákból.


Házassági anyakönyvi kivonat | Információk kinyerve a házassági tanúsítványokból.


US Tax W-2 űrlap | Az adóköteles
kompenzáció részleteinek kinyerése.


US Tax 1098 form | A jelzálog-kamat részleteinek kinyerésében.


US Tax 1098-E űrlap | A diákhitel kamatadatainak kinyerésében.


US Tax 1098-T form | Minősített tandíj részleteinek kinyerése.


US Tax 1099 form | Információk kinyerése az 1099-ből.


US Tax 1040 form | Információk kinyerése az 1040-ből.


Számla | Vevői
és szállítói adatok kinyerve.


Nyugta | Értékesítési
tranzakció részleteinek kinyerésében.


Identitás | Azonosítási
és ellenőrzési adatok kinyerésével.


Egészségbiztosítási kártya | Az egészségbiztosítás részleteinek kinyerésében.


Névjegykártya | Üzleti kapcsolattartási adatok kinyerve.


Szerződés | Bontsa ki a szerződést
és a felek adatait.


US Tax W-2 űrlap | Az adóköteles
kompenzáció részleteinek kinyerése.


US Tax 1098 form | A jelzálog-kamat részleteinek kinyerésében.


US Tax 1098-E űrlap | A diákhitel kamatadatainak kinyerésében.


US Tax 1098-T form | Minősített tandíj részleteinek kinyerése.

Egyéni modellek

  • Az egyéni modelleket a címkézett adatkészletek használatával tanítjuk be, hogy különböző adatokat nyerjenek ki űrlapokból és dokumentumokból, a használati esetekre jellemzően.
  • Önálló egyéni modellek kombinálhatók a komponált modellek létrehozásához.
  • Kinyerési modellek
    ✔️ Az egyéni kinyerési modellek betanítással nyerik ki a címkézett mezőket a dokumentumokból.


Egyéni sablon | Adatok kinyerása statikus elrendezésekből.


Egyéni neurális | Adatok kinyerve vegyes típusú dokumentumokból.


Egyéni összeállítás | Adatok kinyerése modellek gyűjteményével.

  • A besorolási modell
    ✔️ egyéni osztályozói a kinyerési modell meghívása előtt azonosítják a dokumentumtípusokat.


Egyéni osztályozó | Az extrakciós modell meghívása előtt azonosítsa a kijelölt dokumentumtípusokat (osztályokat
).

Bővítmények képességei

A Dokumentumintelligencia támogatja azokat az opcionális funkciókat, amelyek a dokumentum kinyerési forgatókönyvétől függően engedélyezhetők és letilthatók. A következő bővítményfunkciók érhetők el az és újabb kiadásokhoz 2023-07-31 (GA) :

A Dokumentumintelligencia támogatja azokat az opcionális funkciókat, amelyek a dokumentum kinyerési forgatókönyvétől függően engedélyezhetők és letilthatók. A következő bővítményfunkciók érhetőek el az 2023-10-31-preview, és újabb kiadásokhoz2024-02-29-preview:

Elemzési funkciók

Modellazonosító Tartalom kinyerése Lekérdezési mezők Bekezdések Bekezdésszerepkörök Kijelölési jelek Táblák Kulcs-érték párok Nyelvek Vonalkódok Dokumentumelemzés Képletek* Stílus betűtípusa* Felsőbb*
előre összeállított olvasás O O O O O
előre összeállított elrendezés O O O O O
előre összeállított dokumentum O O O O O
előre összeállított-businessCard
előre összeállított szerződés O O O O O
prebuilt-healthInsuranceCard.us O O O O O
előre összeállított-idDocument O O O O O
előre összeállított számla O O O O O O
előre összeállított nyugta O O O O O
prebuilt-marriageCertificate.us O O O O O
előre összeállított-creditCard O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099(változatok) O O O O O
prebuilt-tax.us.1040(változatok) O O O O O
{ customModelName } O O O O O

✓ – Engedélyezett
O – Nem kötelező
* – A prémium funkciók többletköltséggel járnak

Modellek és fejlesztési lehetőségek

Feljegyzés

A Dokumentumintelligencia szolgáltatás 3.0-s verzióban a következő dokumentumelemzési modelleket és fejlesztési lehetőségeket támogatja.

A Dokumentumintelligencia használatával automatizálhatja a dokumentumfeldolgozást alkalmazásokban és munkafolyamatokban, javíthatja az adatvezérelt stratégiákat, és bővítheti a dokumentumkeresési képességeket. A táblázatban található hivatkozások segítségével többet tudhat meg az egyes modellekről, és böngészhet a fejlesztési lehetőségek között.

Olvasás

Képernyőkép a Modellelemzés olvasása a Document Intelligence Studióval.

Modellazonosító Leírás Automatizálási használati esetek Fejlesztési lehetőségek
előre összeállított olvasás ● Szöveg kinyerve a dokumentumokból.
Adatkinyerés
● Bármely dokumentum digitalizálása.
● Megfelelőség és naplózás.
● Kézzel írt jegyzetek feldolgozása fordítás előtt.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Elrendezés

Képernyőkép az elrendezésmodell-elemzésről a Document Intelligence Studióval.

Modellazonosító Leírás Automatizálási használati esetek Fejlesztési lehetőségek
előre összeállított elrendezés ● Szöveg- és elrendezésinformációk kinyerve a dokumentumokból.
Adatkinyerés
● Dokumentumindexelés és lekérés struktúra szerint.
● Pénzügyi és orvosi jelentéselemzés.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Általános dokumentum (elavult: 2023-10-31-preview)

Képernyőkép az Általános dokumentummodell-elemzésről a Document Intelligence Studióval.

Modellazonosító Leírás Automatizálási használati esetek Fejlesztési lehetőségek
előre összeállított dokumentum ● Szöveg-, elrendezés- és kulcs-érték párok kinyerése dokumentumokból.
Adatok és mezők kinyerése
● Kulcs-érték pár kinyerése.
● Űrlapfeldolgozás.
● Felmérési adatgyűjtés és -elemzés.
Document Intelligence Studio
REST API

Számla

Képernyőkép a Számlamodell-elemzésről a Document Intelligence Studióval.

Modellazonosító Leírás Automatizálási használati esetek Fejlesztési lehetőségek
előre összeállított számla ● Kulcsinformációk kinyerése a számlákból.
Adatok és mezők kinyerése
● A kötelezettségek feldolgozása.
● Automatizált adóbevallás és -bevallás.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Nyugta

Képernyőkép a Nyugtamodell-elemzésről a Document Intelligence Studióval.

Modellazonosító Leírás Automatizálási használati esetek Fejlesztési lehetőségek
előre összeállított nyugta ● Kulcsinformációk kinyerése a nyugtákból.
Adatok és mezők kinyerése
● A 3.0-s nyugtamodell támogatja az egyoldalas szállodai nyugták feldolgozását.
● Költségkezelés.
● Fogyasztói viselkedési adatok elemzése.
● Ügyfélhűség program.
● Az áru visszaküldésének feldolgozása.
● Automatizált adóbevallás és -bevallás.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Identitás (azonosító)

Képernyőkép az Identitás (ID) dokumentummodell-elemzésről a Document Intelligence Studióval.

Modellazonosító Leírás Automatizálási használati esetek Fejlesztési lehetőségek
előre összeállított-idDocument ● Kulcsinformációk kinyerése útlevelekből és személyi igazolványokból.
Dokumentumtípusok
● Engedélyek, korlátozások és járműbesorolások kinyerhetőek az egyesült államokbeli jogosítványokból.
● Ismerje meg az ügyfél (KYC) pénzügyi szolgáltatásokra vonatkozó irányelveinek megfelelőségét.
● Orvosi fiókkezelés.
● Identitás-ellenőrzőpontok és átjárók.
● Szállodai regisztráció.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Egészségbiztosítási kártya

Képernyőkép az Állapotbiztosítási kártya modellelemzéséről a Document Intelligence Studióval.

Modellazonosító Leírás Automatizálási használati esetek Fejlesztési lehetőségek
prebuilt-healthInsuranceCard.us ● A legfontosabb információk kinyerése az EGYESÜLT Államok egészségbiztosítási kártyáiból.
Adatok és mezők kinyerése
● Lefedettség és jogosultság ellenőrzése.
● Prediktív modellezés.
● Értékalapú elemzés.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Szerződési modell

Képernyőkép a Szerződésmodell kinyeréséről a Document Intelligence Studióval.

Modellazonosító Leírás Fejlesztési lehetőségek
előre összeállított szerződés Bontsa ki a szerződés és a felek adatait. Document Intelligence Studio
REST API

US Tax W-2 modell

A W-2 modellelemzés képernyőképe a Document Intelligence Studióval.

Modellazonosító Leírás Automatizálási használati esetek Fejlesztési lehetőségek
előre összeállított-tax.us.W-2 ● Kulcsinformációk kinyerése az IRS US W2 adózási űrlapjaiból (2018–2021-es év).
Adatok és mezők kinyerése
● Automatizált adódokumentum-kezelés.
● Jelzáloghitel-kérelem feldolgozása.
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Amerikai adó 1098 űrlap

Képernyőkép a Document Intelligence Studióban elemzett US 1098-as adóűrlapról.

Modellazonosító Leírás Fejlesztési lehetőségek
prebuilt-tax.us.1098 A jelzáloghitel kamatinformációinak és részleteinek kinyeréséről. Document Intelligence Studio
REST API

Amerikai adó 1098-E űrlap

Képernyőkép az US 1098-E adózási űrlapról, amely a Document Intelligence Studióban van elemezve.

Modellazonosító Leírás Fejlesztési lehetőségek
prebuilt-tax.us.1098E A diákhitel adatainak és részleteinek kinyeréséről. Document Intelligence Studio
REST API

Amerikai adó 1098-T űrlap

Képernyőkép a Document Intelligence Studióban elemzett US 1098-T adóűrlapról.

Modellazonosító Leírás Fejlesztési lehetőségek
prebuilt-tax.us.1098T Tandíjinformációk és részletek kinyerése. Document Intelligence Studio
REST API

Amerikai adó 1099 (és változatok) űrlap

Képernyőkép az USA 1099-ben a Document Intelligence Studióban elemzett adózási űrlapról.

Modellazonosító Leírás Fejlesztési lehetőségek
prebuilt-tax.us.1099(Változatok) Információ kinyerés 1099 formátumú változatból. Document Intelligence Studio
REST API

Névjegykártya

Képernyőkép a Névjegykártyamodell-elemzésről a Document Intelligence Studióval.

Modellazonosító Leírás Automatizálási használati esetek Fejlesztési lehetőségek
előre összeállított-businessCard ● Kulcsinformációk kinyerése névjegykártyákból.
Adatok és mezők kinyerése
● Értékesítési érdeklődők és marketingkezelés. Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

Egyéni modell áttekintése

Képernyőkép az egyéni modell betanításáról a Document Intelligence Studióval.

Névjegy Leírás Automatizálási használati esetek Fejlesztési lehetőségek
Egyéni modell Adatokat nyer ki űrlapokból és dokumentumokból strukturált adatokba egy reprezentatív betanítási dokumentumkészletekből létrehozott modell alapján. Az üzleti és használati esetekre jellemző űrlapokból és dokumentumokból nyerjen ki különböző adatokat. Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

Egyéni sablon

Képernyőkép az egyéni sablonmodell-elemzésről a Document Intelligence Studióval.

Feljegyzés

Egyéni sablonmodell betanásához állítsa a tulajdonságot a buildMode következőre template: . További információ: Sablonmodell betanítása

Névjegy Leírás Automatizálási használati esetek Fejlesztési lehetőségek
Egyéni sablonmodell Az egyéni sablonmodell strukturált és félig strukturált dokumentumokból nyer ki címkézett értékeket és mezőket.
Kulcsadatok kinyerése magas strukturált dokumentumokból meghatározott vizualizációsablonokkal vagy gyakori vizualizációs elrendezésekkel, űrlapokkal. Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK

Egyéni neurális

Képernyőkép a Document Intelligence Studióval végzett egyéni neurális modellelemzésről.

Feljegyzés

Egyéni neurális modell betanításához állítsa a tulajdonságot a buildMode következőre neural: . További információ: Neurális modell betanítása

Névjegy Leírás Automatizálási használati esetek Fejlesztési lehetőségek
Egyéni neurális modell Az egyéni neurális modell a címkézett adatok strukturált (felmérések, kérdőívek), félig strukturált (számlák, beszerzési megrendelések) és strukturálatlan dokumentumokból (szerződésekből, levelekből) nyerhető ki. Szöveges adatok, jelölőnégyzetek és táblázatos mezők kinyerése strukturált és strukturálatlan dokumentumokból. Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

Egyéni összeállítás

Képernyőkép a Document Intelligence Studio egyéni modelllistájáról.

Névjegy Leírás Automatizálási használati esetek Fejlesztési lehetőségek
Összeállított egyéni modellek A rendszer úgy hoz létre egy összeállított modellt, hogy egyéni modellek gyűjteményét veszi fel, és egyetlen, az űrlaptípusokból készült modellhez rendeli őket. Akkor hasznos, ha több modellt tanít be, és csoportosítani szeretné őket, hogy hasonló űrlaptípusokat elemezzen, például a beszerzési rendeléseket. Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

Egyéni besorolási modell

{alt-text}

Névjegy Leírás Automatizálási használati esetek Fejlesztési lehetőségek
Összeállított besorolási modell Az egyéni besorolási modellek az elrendezési és nyelvi funkciókat kombinálva észlelik, azonosítják és osztályozzák a bemeneti fájlban lévő dokumentumokat. ● A hitelkérelem csomagja, amely tartalmazza a kérelem űrlapot, a fizetési feltételeket és a bankszámlakivonatot.
● Beolvasott számlák gyűjteménye.
Document Intelligence Studio
REST API

Az Azure AI Document Intelligence egy felhőalapú Azure AI-szolgáltatás a fejlesztők számára, amely intelligens dokumentumfeldolgozási megoldásokat hoz létre. A Dokumentumintelligencia gépi tanuláson alapuló optikai karakterfelismerést (OCR) és dokumentumértelmező technológiákat alkalmaz szöveg, táblázatok, struktúra és kulcs-érték párok dokumentumokból való kinyerésére. Egyéni modellek címkézését és betanítását is végezheti a strukturált, félig strukturált és strukturálatlan dokumentumokból történő adatkinyerés automatizálásához. Az egyes modellekkel kapcsolatos további információkért tekintse meg az Alapfogalmakat ismertető cikkeket:

Modell típusa Modell neve
Dokumentumelemzési modell Elrendezéselemzési modell
Előre összeállított modellek Számlamodell
Nyugtamodell
Identitásdokumentum -modell (ID) modell
Névjegykártya-modell
Egyéni modellek Egyéni modell
Összeállított modell

Ez a tartalom a következőre vonatkozik::Sakkv2.1 | Legújabb verzió:kék pipav4.0 (előzetes verzió)

Dokumentumintelligencia-modellek és fejlesztési lehetőségek

Tipp.

  • A továbbfejlesztett felhasználói élmény és a fejlett modellminőség érdekében próbálja ki a Document Intelligence v3.0 Studiót.
  • A v3.0 Studio támogatja a v2.1 címkével ellátott adatokkal betanított modelleket.
  • A 2.1-es verzióról a 3.0-s verzióra való migrálással kapcsolatos részletes információkért tekintse meg az API migrálási útmutatójában.

Feljegyzés

A Document Intelligence service v2.1 az alábbi modelleket és fejlesztési lehetőségeket támogatja.

A táblázatban található hivatkozások segítségével többet tudhat meg az egyes modellekről, és tallózhat az API-referenciák között:

Modell Leírás Fejlesztési lehetőségek
Elrendezéselemzés Szöveg, kijelölési jelek, táblázatok és határolókeret koordinátáinak kinyerése és elemzése űrlapokból és dokumentumokból. Dokumentumintelligencia-címkézési eszköz
REST API
Ügyfélkódtár SDK
Dokumentumintelligencia Docker-tároló
Egyéni modell Adatok kinyerése és elemzése különböző üzleti adatokra és használati esetekre jellemző űrlapokból és dokumentumokból. Dokumentumintelligencia-címkézési eszköz
REST API
Mintacímkéző eszköz
Document Intelligence Docker-tároló
Számlamodell A kulcsadatok automatizált feldolgozása és kinyerése az értékesítési számlákból. Dokumentumintelligencia-címkézési eszköz
REST API
Ügyfélkódtár SDK
Dokumentumintelligencia Docker-tároló
Nyugtamodell A kulcsadatok automatizált feldolgozása és kinyerése az értékesítési nyugtákból. Dokumentumintelligencia-címkézési eszköz
REST API
Ügyfélkódtár SDK
Dokumentumintelligencia Docker-tároló
Identitásdokumentum-modell (ID) Az usa-beli jogosítványokból és nemzetközi útlevelekből származó kulcsfontosságú adatok automatizált feldolgozása és kinyerése. Dokumentumintelligencia-címkézési eszköz
REST API
Ügyfélkódtár SDK
Dokumentumintelligencia Docker-tároló
Névjegykártya-modell Kulcsadatok automatizált feldolgozása és kinyerése névjegykártyákról. Dokumentumintelligencia-címkézési eszköz
REST API
Ügyfélkódtár SDK
Dokumentumintelligencia Docker-tároló

Adatvédelem és biztonság

Az összes AI-szolgáltatáshoz hasonlóan a Document Intelligence szolgáltatást használó fejlesztőknek is tisztában kell lenniük a Microsoft ügyféladatokra vonatkozó szabályzataival. Tekintse meg a Dokumentumintelligencia-oldal adatait, adatvédelmi és biztonsági adatait.

Következő lépések