Mi az az Azure Form Recognizer?

Ez a cikk a következőre vonatkozik:Form Recognizer v3.0 pipaForm Recognizer v3.0. Korábbi verzió:Form Recognizer 2.1-es verzió

Az Azure Form Recognizer egy felhőalapú Azure Applied AI-szolgáltatás fejlesztők számára, amely intelligens dokumentumfeldolgozási megoldásokat hoz létre. Form Recognizer gépi tanuláson alapuló optikai karakterfelismerést (OCR) és dokumentumértelmező technológiákat alkalmaz a nyomtatott és kézzel írt szövegek, táblázatok, szerkezet és kulcs-érték párok dokumentumokból való kinyerésére. Egyéni modellek címkézését és betanítását is végezheti a strukturált, félig strukturált és strukturálatlan dokumentumokból történő adatkinyerés automatizálásához. Az egyes modellekkel kapcsolatos további információkért tekintse meg az Alapfogalmakat ismertető cikkeket:

Modell típusa Modell neve
Dokumentumelemzési modellek Olvasási OCR-modell
Általános dokumentummodell
Elrendezéselemzési modell
Előre összeállított modellek W-2 űrlapmodell
SzámlamodellNyugtamodell

Identitás (azonosító) dokumentummodell
Névjegykártya-modell
Egyéni modellek Egyéni modell
Összeállított modell

Melyik Form Recognizer modellt érdemes használni?

Ez a szakasz segít eldönteni, hogy melyik Form Recognizer 3.0-s verzió által támogatott modellt kell használnia az alkalmazáshoz:

Dokumentum típusa Kinyerendő adatok Dokumentumformátum A legjobb megoldás
Általános dokumentum , például szerződés vagy levél. Elsősorban szövegsorokat, szavakat, helyeket és észlelt nyelveket szeretne kinyerni. A dokumentum írása vagy nyomtatása támogatott nyelven történik. OCR-modell olvasása
Olyan dokumentum, amely szerkezeti információkat, például jelentést vagy tanulmányt tartalmaz. A szöveg mellett szerkezeti információkat is ki kell nyernie, például táblázatokat, kijelölési jeleket, bekezdéseket, címeket, címsorokat és alszámokat. A dokumentum írása vagy nyomtatása támogatott nyelven történik Elrendezéselemzési modell
Egy strukturált vagy részben strukturált dokumentum, amely mezőkként és értékekként formázott tartalmat tartalmaz, például hiteligénylési vagy felmérési űrlapként. Egyéni modell betanítása nélkül szeretne kinyerni mezőket és értékeket, beleértve azokat is, amelyeket nem fednek le a forgatókönyv-specifikus előre összeállított modellek. Az űrlap vagy dokumentum az üzleti vagy iparágban gyakran használt szabványosított formátum, amelyet támogatott nyelven nyomtatnak ki. Általános dokumentummodell
Amerikai W-2 űrlap Olyan fontos információkat szeretne kinyerni, mint a fizetés, a bérek és az usa-beli W2 adózási űrlapokból visszatartott adók. A W-2 dokumentum Egyesült Államok angol (en-US) szövegben található. W-2 modell
Számla Olyan fontos információkat szeretne kinyerni, mint az ügyfél neve, a számlázási cím és a számlákból esedékes összeg. A számladokumentum írása vagy nyomtatása támogatott nyelven történik. Számlamodell
Beérkezési Olyan fontos információkat szeretne kinyerni, mint a kereskedő neve, a tranzakció dátuma és a tranzakció összege egy értékesítési vagy egyoldalas szállodai nyugtából. A nyugta írása vagy nyomtatása támogatott nyelven történik. Nyugtamodell
Személyazonosító okmány (azonosító), például útlevél vagy jogosítvány. Olyan fontos információkat szeretne kinyerni, mint az utónév, a vezetéknév és a születési dátum amerikai jogosítványokból vagy nemzetközi útlevelekből. Személyi igazolványa egy amerikai jogosítvány vagy egy nemzetközi útlevélből származó életrajzi oldal (nem vízum). Identitásdokumentum -modell (ID)
Névjegykártya A névjegykártyákból olyan fontos információkat szeretne kinyerni, mint az utónév, a vezetéknév, a vállalat neve, az e-mail-cím és a telefonszám. A névjegykártya-dokumentum angol vagy japán nyelvű. Névjegykártyamodell
Vegyes típusú dokumentum(ok) Olyan kulcs-érték párokat, kijelölési jeleket, táblákat, aláírásmezőket és kijelölt régiókat szeretne kinyerni, amelyeket nem az előre összeállított vagy általános dokumentummodellek nyernek ki. Különböző dokumentumokkal rendelkezik strukturált, részben strukturált és/vagy strukturálatlan elemekkel. Egyéni modell

Tipp

  • Ha még mindig nem tudja, melyik modellt használja, próbálja ki az Általános dokumentum modellt kulcs-érték párok kinyeréséhez.
  • Az általános dokumentummodellt az OcR olvasási motorja működteti a szövegsorok, szavak, helyek és nyelvek észleléséhez.
  • Az általános dokumentum ugyanazokat az adatokat is kinyeri, mint a dokumentum elrendezési modellje (lapok, táblázatok, stílusok).

Dokumentumfeldolgozási modellek és fejlesztési lehetőségek

Megjegyzés

A Form Recognizer service v3.0 támogatja a modelleket és fejlesztési lehetőségeket ismertető alábbi dokumentumot.

A Form Recognizer használatával automatizálhatja a dokumentumfeldolgozást alkalmazásokban és munkafolyamatokban, javíthatja az adatvezérelt stratégiákat, és bővítheti a dokumentumkeresési képességeket. A táblázatban található hivatkozások segítségével többet tudhat meg az egyes modellekről, és tallózhat az API-referenciák között.

Modellezés Description Automatizálási használati esetek Fejlesztési lehetőségek
OCR-modell olvasása Kinyerheti a szövegsorokat, szavakat, felismert nyelveket és kézzel írt stílusokat, ha észleli őket.
  • Szerződésfeldolgozás.
  • Pénzügyi vagy orvosi jelentések feldolgozása.
Általános dokumentummodell Szöveg, táblázatok, struktúra és kulcs-érték párok kinyerése.
  • Kulcs-érték pár kinyerése.
  • Űrlapfeldolgozás.
  • Felmérési adatgyűjtés és -elemzés.
Elrendezéselemzési modell Szöveg, kijelölésjelek és táblázatstruktúrák, valamint azok határolókeret-koordinátáinak kinyerése űrlapokból és dokumentumokból.

Az Layout API egy előre összeállított modellre lett frissítve.
  • Dokumentumok indexelése és lekérése struktúra szerint.
  • Előfeldolgozás az OCR-elemzés előtt.
Egyéni modell (frissítve) Adatok kinyerése és elemzése különböző üzleti adatokra és használati esetekre jellemző űrlapokból és dokumentumokból.

Az egyéni modell API 3.0-s verzió támogatja az aláírásészlelést az egyéni (egyéni űrlap) modellekhez.

Az egyéni modell API 3.0-s verzió már két modelltípust támogat:
  • Az ön vállalkozása számára egyedi adatok azonosítása és összeállítása, amelyet egy jogszabályi változás vagy piaci esemény érint.
  • A korábban figyelmen kívül hagyott egyedi adatok azonosítása és elemzése.
Form Recognizer Studio
  • REST API
  • C# SDK
  • Python SDK
  • Java SDK
  • JavaScript
  • W-2 űrlap A W-2 űrlap minden mezőjében jelentett információk kinyerésével.
    • Automatizált adódokumentum-kezelés.
    • Jelzáloghitel-igénylés feldolgozása.
    Számlamodell A kulcsadatok automatizált feldolgozása és kinyerése az értékesítési számlákból.
    • A fizetendő számlák feldolgozása.
    • Automatizált adóbevallás és bevallás.
    Visszaigazolási modell (frissítve) A kulcsadatok automatizált feldolgozása és kinyerése az értékesítési nyugtákból.

    A 3.0-s verziószámú nyugtamodell támogatja az egyoldalas szállodai nyugták feldolgozását.
    • Költségkezelés.
    • Fogyasztói viselkedési adatok elemzése.
    • Ügyfélhűség program.
    • Az áru visszaküldésének feldolgozása.
    • Automatizált adóbevallás és bevallás.
    Identitásdokumentum -modell (frissítve) Az usa-beli jogosítványokból és nemzetközi útlevelekből származó kulcsfontosságú adatok automatizált feldolgozása és kinyerése.

    Az előre összeállított azonosító dokumentum API támogatja az ajánlásokat, korlátozásokat és járműbesorolásokat az USA-beli vezetői licencekből.
    • Ismerje meg az ügyfél (KYC) pénzügyi szolgáltatásokra vonatkozó irányelveinek megfelelőségét.
    • Orvosi fiókkezelés.
    • Identitás-ellenőrzőpontok és -átjárók.
    • Hotelregisztráció.
    Névjegykártyamodell Kulcsadatok automatizált feldolgozása és kinyerése névjegykártyákról.
    • Értékesítési érdeklődők és marketingkezelés.

    Ez a cikk a következőre vonatkozik: Form Recognizerv2.1 pipaForm Recognizer v2.1. Újabb verzió:Form Recognizer 3.0-s verzió

    Az Azure Form Recognizer egy felhőalapú Azure Applied AI-szolgáltatás fejlesztők számára, amely intelligens dokumentumfeldolgozási megoldásokat hoz létre. Form Recognizer gépi tanulási alapú optikai karakterfelismerést (OCR) és dokumentumértelmező technológiákat alkalmaz a nyomtatott és kézzel írt szövegek, táblázatok, szerkezet és kulcs-érték párok dokumentumokból való kinyerésére. Egyéni modellek címkézését és betanítását is végezheti a strukturált, félig strukturált és strukturálatlan dokumentumokból történő adatkinyerés automatizálásához. Az egyes modellekkel kapcsolatos további információkért tekintse meg a Concepts (Alapfogalmak) című cikkeket:

    Modell típusa Modell neve
    Dokumentumelemzési modell Elrendezéselemzési modell
    Előre összeállított modellek Számlamodell
    Nyugtamodell
    Identitásdokumentum -modell (id) modell
    Névjegykártya-modell
    Egyéni modellek Egyéni modell
    Összeállított modell

    Melyik dokumentumfeldolgozási modellt kell használnom?

    Ez a szakasz segít eldönteni, hogy melyik Form Recognizer v2.1-es támogatott modellt kell használnia az alkalmazáshoz:

    Dokumentum típusa Kinyerendő adatok Dokumentumformátum A legjobb megoldás
    Olyan dokumentum, amely szerkezeti információkat, például jelentést vagy tanulmányt tartalmaz. A szöveg mellett szerkezeti információkat is ki kell nyernie, például táblákat és kijelölési jeleket. A dokumentum írása vagy nyomtatása támogatott nyelven történik Elrendezéselemzési modell
    Számla Olyan fontos információkat szeretne kinyerni, mint az ügyfél neve, a számlázási cím és a számlákból esedékes összeg. A számladokumentum írása vagy nyomtatása támogatott nyelven történik. Számlamodell
    Beérkezési Olyan fontos információkat szeretne kinyerni, mint a kereskedő neve, a tranzakció dátuma és a tranzakció összege egy értékesítési vagy egyoldalas szállodai nyugtából. A visszaigazolást támogatott nyelven írják vagy nyomtatják ki. Nyugtamodell
    Személyazonosító okmány (azonosító), például útlevél vagy jogosítvány. Olyan fontos információkat szeretne kinyerni, mint az utónév, a vezetéknév és a születési dátum amerikai jogosítványokból vagy nemzetközi útlevelekből. Személyi igazolványa egy amerikai jogosítvány vagy egy nemzetközi útlevélből származó életrajzi oldal (nem vízum). Azonosító dokumentummodell
    Névjegykártya A névjegykártyákból olyan fontos információkat szeretne kinyerni, mint az utónév, a vezetéknév, a vállalat neve, az e-mail-cím és a telefonszám. A névjegykártya-dokumentum angol vagy japán nyelvű. Névjegykártyamodell
    Vegyes típusú dokumentum(ok) Olyan kulcs-érték párokat, kijelölési jeleket, táblákat, aláírásmezőket és kijelölt régiókat szeretne kinyerni, amelyeket nem az előre összeállított vagy általános dokumentummodellek nyernek ki. Különböző dokumentumokkal rendelkezik strukturált, részben strukturált és/vagy strukturálatlan elemekkel. Egyéni modell

    modellek és fejlesztési lehetőségek Form Recognizer

    Tipp

    • A továbbfejlesztett élmény és a fejlett modellminőség érdekében próbálja ki a Form Recognizer v3.0 Studiót.
    • A v3.0 Studio támogatja a v2.1 címkével ellátott adatokkal betanított modelleket.
    • A 2.1-ről a 3.0-s verzióra való migrálással kapcsolatos részletes információkért tekintse meg az API migrálási útmutatóját.

    Megjegyzés

    A Form Recognizer service v2.1 az alábbi modelleket és fejlesztési lehetőségeket támogatja.

    A táblázatban található hivatkozásokkal többet tudhat meg az egyes modellekről, és tallózhat az API-referenciák között:

    Modellezés Description Fejlesztési lehetőségek
    Elrendezéselemzés Szöveg, kijelölésjelek, táblázatok és határolókeret-koordináták kinyerése és elemzése űrlapokból és dokumentumokból.
    Egyéni modell Adatok kinyerése és elemzése különböző üzleti adatokra és használati esetekre jellemző űrlapokból és dokumentumokból.
    Számlamodell Kulcsadatok automatizált feldolgozása és kinyerése az értékesítési számlákból.
    Nyugtamodell Kulcsadatok automatizált feldolgozása és kinyerése az értékesítési nyugtákból.
    Identitásdokumentum -modell (ID) Az usa-beli jogosítványokból és nemzetközi útlevelekből származó kulcsfontosságú adatok automatizált feldolgozása és kinyerése.
    Névjegykártyamodell Kulcsadatok automatizált feldolgozása és kinyerése névjegykártyákról.

    Adatvédelem és biztonság

    Mint minden AI-szolgáltatás esetében, a Form Recognizer szolgáltatást használó fejlesztőknek is tisztában kell lenniük Microsoft ügyféladatokra vonatkozó szabályzatokkal. Tekintse meg az Adatok, adatvédelem és biztonság Form Recognizer oldalon.

    Következő lépések