Melyik modellt válasszam?

Fontos

  • A Document Intelligence nyilvános előzetes verziójú kiadásai korai hozzáférést biztosítanak az aktív fejlesztés alatt lévő funkciókhoz.
  • A funkciók, a megközelítések és a folyamatok az általános rendelkezésre állás (GA) előtt változhatnak a felhasználói visszajelzések alapján.
  • A Document Intelligence ügyfélkódtárak nyilvános előzetes verziója alapértelmezés szerint a REST API 2024-02-29-preview verziója.
  • A nyilvános előzetes verzió 2024-02-29 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el:
  • USA keleti régiója
  • USA2 nyugati régiója
  • Nyugat-Európa

Ez a tartalom a következőre vonatkozik::Sakkv4.0 (előzetes verzió) | Korábbi verziók:kék pipav3.1 (GA)kék pipav3.0 (GA)

Ez a tartalom a következőre vonatkozik::Sakkv3.1 (GA) | Legújabb verzió:lila pipav4.0 (előzetes verzió) | Korábbi verziók:kék pipav3.0

Ez a tartalom a következőre vonatkozik::Sakkv3.0 (GA) | Legújabb verziók:lila pipav4.0 (előzetes verzió)lila pipav3.1

Az Azure AI Document Intelligence számos olyan modellt támogat, amelyek lehetővé teszik intelligens dokumentumfeldolgozás hozzáadását az alkalmazásokhoz, és optimalizálhatja a munkafolyamatokat. A megfelelő modell kiválasztása elengedhetetlen a vállalat sikerességének biztosításához. Ebben a cikkben áttekintjük az elérhető Dokumentumintelligencia-modelleket, és útmutatást nyújtunk a projektek legjobb megoldásának kiválasztásához.

Az alábbi döntési diagramok kiemelik a Document Intelligence 3.0-s verziójának támogatott modelljeinek funkcióit, és segítenek kiválasztani az alkalmazás igényeinek és követelményeinek leginkább megfelelő modellt.

Fontos

Mindenképpen ellenőrizze a nyelvtámogatási oldalt, hogy támogatott-e a nyelvi szöveg és a mező kinyerése funkció szerint.

Előre betanított dokumentumelemzési modellek

Dokumentumtípusok Példa Kivonandó adatok A legjobb megoldás
Általános dokumentum. Szerződés vagy levél. Elsősorban írott vagy nyomtatott szövegsorokat, szavakat, helyeket és észlelt nyelveket szeretne kinyerni. OCR-modell olvasása
Szerkezeti információkat tartalmazó dokumentum. Jelentés vagy tanulmány. Az írott vagy nyomtatott szövegek mellett olyan szerkezeti információkat is ki kell nyernie, mint a táblázatok, a kijelölési jelek, a bekezdések, a címek, a címsorok és az alcímek. Elrendezéselemzési modell
Strukturált vagy részben strukturált dokumentum, amely mezők (kulcsok) és értékek formájában formázott tartalmat tartalmaz. Az üzleti vagy iparágban gyakran használt szabványosított formátumú űrlap vagy dokumentum, például hitelalkalmazás vagy felmérés. Olyan mezőket és értékeket szeretne kinyerni, amelyek nem fedik le a forgatókönyv-specifikus előre összeállított modelleket anélkül, hogy egyéni modellt kellene betanítaniuk. **Elrendezéselemzési modell az opcionális lekérdezési sztring paraméterrel features=keyValuePairs **

Előre betanított forgatókönyv-specifikus modellek

Dokumentumtípusok Kivonandó adatok A legjobb megoldás
AMERIKAI W-2 adóűrlap Olyan fontos információkat szeretne kinyerni, mint a fizetés, a bérek és a visszatartott adók. AMERIKAI adó W-2 modell
US Tax 1098 űrlap Szeretné kinyerni a jelzálog-kamat adatait, például a tőke, a pontok és az adó adatait. Amerikai adó 1098-modell
US Tax 1098-E űrlap Szeretné kinyerni a diákhitel kamatadatait, például a hitelezőt és a kamatösszeget. Amerikai adó 1098-E modell
US Tax 1098T űrlap Olyan minősített tandíjadatokat szeretne kinyerni, mint az ösztöndíj-kiigazítások, a hallgatói jogviszony és a kölcsönadók adatai. Amerikai adó 1098-T modell
US Tax 1099(Változatok) űrlap Adatokat szeretne kinyerni az űrlapokból és azok változataiból 1099 (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). Amerikai adó 1099-modell
US Tax 1040(Változatok) űrlap Adatokat szeretne kinyerni az űrlapokból és azok változataiból 1040 (1. ütemezés, 2. ütemezés, 3. ütemezés, 8812. ütemezés, A. ütemezés, B. ütemezés, C. ütemezés, D. ütemezés, E. ütemezés, E. ütemezés, F. ütemezés, H. ütemezés, J. ütemezés, R. ütemezés, ütemezési Standard kiadás, vezető beosztás). Amerikai adó 1040-modell
Szerződés (felek közötti jogi megállapodás). Ki szeretné nyerni a szerződés részleteit, például a feleket, a dátumokat és az intervallumokat. Szerződési modell
Egészségbiztosítási kártya vagy egészségbiztosítási azonosító. Olyan fontos információkat szeretne kinyerni, mint a biztosító, a tagazonosító, a vénykötelesség és a csoport száma. Egészségbiztosítási kártyamodell
Hitelkártya/bankkártya . Olyan fontos információkat szeretne kinyerni, mint a kártyaszám és a bank neve. Hitel-/bankkártya-modell
Házassági anyakönyvi kivonat . Fontos információkat szeretne kinyerni a házassági anyakönyvi kivonatokból. Házassági anyakönyvi kivonat modell
Számla vagy számlakivonat. Olyan fontos információkat szeretne kinyerni, mint az ügyfél neve, a számlázási cím és a fizetendő összeg. Számlamodell
Nyugta, utalvány vagy egyoldalas szállodai nyugta. Olyan kulcsadatokat szeretne kinyerni, mint a kereskedő neve, a tranzakció dátuma és a tranzakció összege. Nyugtamodell
Személyazonossági okmány (azonosító), például egy amerikai jogosítvány vagy nemzetközi útlevél. Olyan kulcsadatokat szeretne kinyerni, mint a vezetéknév, a vezetéknév, a születési dátum, a cím és az aláírás. Identitásdokumentum-modell (ID)
US Mortgage 1003 . Fontos információkat szeretne kinyerni az egységes lakáshitel-kérelemből. 1003-at használó űrlapmodell
US Mortgage 1008 . Fontos információkat szeretne kinyerni az egységes jegyzési és továbbítási összegzésből. 1008 űrlapmodell
US Mortgage Closing Disclosure . Fontos információkat szeretne kinyerni egy jelzálog-záró közzétételi űrlapból. Jelzálog-záró közzétételi űrlapmodell
Vegyes típusú dokumentum(ok) strukturált, részben strukturált és/vagy strukturálatlan elemekkel. Kulcs-érték párokat, kijelölési jeleket, táblákat, aláírásmezőket és olyan kijelölt régiókat szeretne kinyerni, amelyeket nem az előre összeállított vagy általános dokumentummodellek nyernek ki. Egyéni modell

Tipp.

  • Ha még mindig nem biztos abban, hogy melyik előre betanított modellt használja, próbálja ki az elrendezési modellt az opcionális lekérdezési sztring paraméter features=keyValuePairs engedélyezésével.
  • Az elrendezési modellt az OcR olvasási motorja működteti a lapok, táblázatok, stílusok, szövegek, sorok, szavak, helyek és nyelvek észleléséhez.

Egyéni extrakciós modellek

Betanítási csoport Példadokumentumok A legjobb megoldás
Strukturált, konzisztens, statikus elrendezésű dokumentumok. Strukturált űrlapok, például kérdőívek vagy alkalmazások. Egyéni sablonmodell
Strukturált, részben strukturált és strukturálatlan dokumentumok. ● Strukturált → felmérések
● Félig strukturált → számlák
● Strukturálatlan → betűk
Egyéni neurális modell
A hasonló típusú dokumentumokra betanított modellek gyűjteménye. ● Beszerzési rendelések
ellátása● Berendezésvásárlási rendelések
● Bútorvásárlási rendelések
Mindegyike egyetlen modellben áll össze.
Összeállított egyéni modell

Egyéni besorolási modell

Betanítási csoport Példadokumentumok A legjobb megoldás
Legalább két különböző típusú dokumentum. Űrlapok, levelek vagy dokumentumok Egyéni besorolási modell

Következő lépések