Který model mám zvolit?

Důležité

  • Verze Document Intelligence ve verzi Public Preview poskytují dřívější přístup k funkcím, které jsou aktivní ve vývoji.
  • Funkce, přístupy a procesy se můžou před obecnou dostupností (GA) změnit na základě zpětné vazby uživatelů.
  • Verze Public Preview klientských knihoven Document Intelligence ve výchozím nastavení je rest API verze 2024-02-29-preview.
  • Verze Public Preview 2024-02-29-preview je aktuálně dostupná jenom v následujících oblastech Azure:
  • USA – východ
  • USA – západ 2
  • Západní Evropa

Tento obsah se vztahuje na:Zaškrtnutív4.0 (Preview) | Předchozí verze:modrá značka zaškrtnutív3.1 (GA)modrá značka zaškrtnutív3.0 (GA)

Tento obsah se vztahuje na:Zaškrtnutív3.1 (GA) | Nejnovější verze:nachová značka zaškrtnutív4.0 (Preview) | Předchozí verze:modrá značka zaškrtnutív3.0

Tento obsah se vztahuje na:Zaškrtnutív3.0 (GA) | Nejnovější verze:nachová značka zaškrtnutív4.0 (Preview)nachová značka zaškrtnutív3.1

Azure AI Document Intelligence podporuje širokou škálu modelů, které umožňují přidat inteligentní zpracování dokumentů do aplikací a optimalizovat pracovní postupy. Výběr správného modelu je nezbytný k zajištění úspěchu vašeho podniku. V tomto článku prozkoumáme dostupné modely Document Intelligence a poskytneme pokyny, jak zvolit nejlepší řešení pro vaše projekty.

Následující rozhodovací grafy zvýrazňují funkce jednotlivých podporovaných modelů Document Intelligence v3.0 a pomáhají vám zvolit nejlepší model, který bude vyhovovat potřebám a požadavkům vaší aplikace.

Důležité

Nezapomeňte zkontrolovat stránku podpory jazyka pro podporovaný text jazyka a extrakci polí podle funkce.

Předem natrénované modely analýzy dokumentů

Typ dokumentu Příklad Data, která se mají extrahovat Vaše nejlepší řešení
Obecný dokument. Smlouva nebo dopis. Chcete primárně extrahovat psané nebo tištěné textové řádky, slova, umístění a zjištěné jazyky. Čtení modelu OCR
Dokument, který obsahuje strukturální informace. Zpráva nebo studie. Kromě psaného nebo tištěného textu je potřeba extrahovat strukturální informace, jako jsou tabulky, značky výběru, odstavce, názvy, nadpisy a podnadpisy. Model analýzy rozložení
Strukturovaný nebo částečně strukturovaný dokument, který obsahuje obsah formátovaný jako pole (klíče) a hodnoty. Formulář nebo dokument, který je standardizovaný formát běžně používaný ve vaší firmě nebo odvětví, jako je úvěrová aplikace nebo průzkum. Chcete extrahovat pole a hodnoty, včetně těch, které nejsou pokryty předem vytvořenými modely specifickými pro scénář, aniž byste museli trénovat vlastní model. **Model analýzy rozložení s povoleným volitelným parametrem features=keyValuePairs řetězce dotazu **

Předem natrénované modely specifické pro scénáře

Typ dokumentu Data, která se mají extrahovat Vaše nejlepší řešení
Daňový formulář PRO USA W-2 Chcete extrahovat klíčové informace, jako jsou mzdy, mzdy a daně sdružené. Daňový model W-2 v USA
Formulář pro daň z USA 1098 Chcete extrahovat podrobnosti o hypotékách, jako jsou jistina, body a daň. Model us tax 1098
Us Tax 1098-E form Chcete extrahovat podrobnosti o úrokech studentů, jako je věřitel a částka úroku. Americký daňový model 1098-E
Us Tax 1098T form Chcete extrahovat podrobnosti o kvalifikované výuce, jako jsou úpravy stipendia, stav studenta a informace o věřiteli. Americký daňový model 1098-T
Formulář us Tax 1099(Varianty) Chcete extrahovat informace z 1099 formulářů a jejich variant (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). Model us tax 1099
Formulář pro daň z USA 1040(Varianty) Chcete extrahovat informace z 1040 formulářů a jejich variant (Plán 1, Plán 2, Plán 3, Plán 8812, Plán A, Plán B, Plán C, Plán D, Plán E, Plán EIC, Plán F, Plán H, Plán J, Plán R, Plán SE, Plán 1, Plán SE, Plán 1). Model daně z USA 1040
Smlouva (právní dohoda mezi stranami). Chcete extrahovat podrobnosti smlouvy, jako jsou strany, data a intervaly. Model kontraktů
Zdravotní pojištění nebo ID zdravotního pojištění. Chcete extrahovat klíčové informace, jako je pojištění, ID člena, pokrytí předpisem a číslo skupiny. Model zdravotní karty
Kreditní/debetní karta . Chcete extrahovat klíčové informace bankovní karty, jako je číslo karty a název banky. Model kreditní/debetní karty
Manželství osvědčení . Chcete extrahovat klíčové informace z manželství certifikátů. Model certifikátu manželství
Faktura nebo vyúčtování Chcete extrahovat klíčové informace, jako je jméno zákazníka, fakturační adresa a splatná částka. Model faktury
Potvrzení, poukázka nebo jednostránkové potvrzení o hotelu. Chcete extrahovat klíčové informace, jako je název obchodníka, datum transakce a celkový součet transakcí. Model účtenek
Doklad totožnosti (ID), jako je průkaz řidiče USA nebo mezinárodní pas. Chcete extrahovat klíčové informace, jako je jméno, příjmení, datum narození, adresa a podpis. Model dokumentu identity (ID)
Americký hypotéka 1003 . Chcete extrahovat klíčové informace z žádosti o půjčku Uniform Residential. Model formuláře 1003
Americký hypotéka 1008 . Chcete extrahovat klíčové informace ze souhrnu jednotných přepisů a přenosů. Model formuláře 1008
Americké hypotéky uzavření zveřejnění . Chcete extrahovat klíčové informace z formuláře pro uzavření hypotéky. Model zpřístupnění hypotéky
Dokumenty se smíšeným typem se strukturovanými, částečně strukturovanými a/nebo nestrukturovanými prvky Chcete extrahovat páry klíč-hodnota, značky výběru, tabulky, pole podpisu a vybrané oblasti, které nejsou extrahovány předem vytvořenými nebo obecnými modely dokumentů. Vlastní model

Tip

  • Pokud si stále nejste jistí, který předem natrénovaný model použít, zkuste model rozložení s povoleným volitelným parametrem features=keyValuePairs řetězce dotazu.
  • Model rozložení využívá modul Read OCR ke zjišťování stránek, tabulek, stylů, textu, řádků, slov, umístění a jazyků.

Vlastní modely extrakce

Trénovací sada Ukázkové dokumenty Vaše nejlepší řešení
Strukturované, konzistentní dokumenty se statickým rozložením Strukturované formuláře, jako jsou dotazníky nebo aplikace. Vlastní model šablony
Strukturované, částečně strukturované a nestrukturované dokumenty. ● Strukturované → průzkumy
● Částečně strukturovaná → faktur
● Nestrukturovaná → písmena
Vlastní neurální model
Kolekce několika modelů, které jsou vytrénované na dokumentech podobného typu. ● Nákupní objednávky
zařízení● Nákupní objednávky
nábytku
Všechny složené do jednoho modelu.
Složený vlastní model

Vlastní klasifikační model

Trénovací sada Ukázkové dokumenty Vaše nejlepší řešení
Aspoň dva různé typy dokumentů. Formuláře, dopisy nebo dokumenty Vlastní klasifikační model

Další kroky