Vilken modell ska jag välja?

Viktigt!

  • Versioner av den offentliga förhandsversionen av Document Intelligence ger tidig åtkomst till funktioner som är i aktiv utveckling.
  • Funktioner, metoder och processer kan ändras, före allmän tillgänglighet (GA), baserat på användarfeedback.
  • Den offentliga förhandsversionen av Dokumentinformationsklientbiblioteken är som standard REST API version 2024-02-29-preview.
  • Förhandsversion 2024-02-29-preview är för närvarande endast tillgänglig i följande Azure-regioner:
  • USA, östra
  • USA, västra 2
  • Europa, västra

Det här innehållet gäller för:Bockmarkeringv4.0 (förhandsversion) | Tidigare versioner:blå bockmarkeringv3.1 (GA)blå bockmarkeringv3.0 (GA)

Det här innehållet gäller för:Bockmarkeringv3.1 (GA) | Senaste version:lila bockmarkeringv4.0 (förhandsversion) | Tidigare versioner:blå bockmarkeringv3.0

Det här innehållet gäller för:Bockmarkeringv3.0 (GA) | Senaste versionerna:lila bockmarkeringv4.0 (förhandsversion)lila bockmarkeringv3.1

Azure AI Document Intelligence stöder en mängd olika modeller som gör att du kan lägga till intelligent dokumentbearbetning i dina program och optimera dina arbetsflöden. Det är viktigt att välja rätt modell för att säkerställa att företaget lyckas. I den här artikeln utforskar vi tillgängliga dokumentinformationsmodeller och ger vägledning för hur du väljer den bästa lösningen för dina projekt.

Följande beslutsdiagram belyser funktionerna i varje modell som stöds av Document Intelligence v3.0 och hjälper dig att välja den bästa modellen för att uppfylla programmets behov och krav.

Viktigt!

Se till att kontrollera språkstödsidan för språktext och fältextrahering efter funktion som stöds.

Förtränad dokumentanalysmodeller

Dokumenttyp Exempel Data som ska extraheras Din bästa lösning
Ett allmänt dokument. Ett kontrakt eller brev. Du vill främst extrahera skrivna eller utskrivna textrader, ord, platser och identifierade språk. Läs OCR-modell
Ett dokument som innehåller strukturell information. En rapport eller studie. Förutom skriven eller tryckt text måste du extrahera strukturell information som tabeller, markeringsmarkeringar, stycken, rubriker, rubriker och underrubriker. Layoutanalysmodell
Ett strukturerat eller halvstrukturerat dokument som innehåller innehåll formaterat som fält (nycklar) och värden. Ett formulär eller dokument som är ett standardiserat format som ofta används i ditt företag eller din bransch, till exempel ett kreditprogram eller en undersökning. Du vill extrahera fält och värden inklusive värden som inte omfattas av de scenariospecifika fördefinierade modellerna utan att behöva träna en anpassad modell. **Layoutanalysmodell med den valfria frågesträngsparametern features=keyValuePairs aktiverad **

Förtränat scenariospecifika modeller

Dokumenttyp Data som ska extraheras Din bästa lösning
Momsformulär för US W-2 Du vill extrahera viktig information som lön, löner och skatter som undanhålls. W-2-modell för amerikansk skatt
Formulär för US Tax 1098 Du vill extrahera information om bolåneräntor som kapital, punkter och skatt. Us tax 1098-modell
Formulär för US Tax 1098-E Du vill extrahera ränteinformation för studielån, till exempel långivare och räntebelopp. Amerikansk skatt 1098-E-modell
Formulär för US Tax 1098T Du vill extrahera kvalificerad undervisningsinformation som stipendiejusteringar, studentstatus och långivarens information. Amerikansk skatt 1098-T-modell
Formulär för US Tax 1099(Variations) Du vill extrahera information från 1099 formulär och dess variationer (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). Us tax 1099-modell
Formulär för US Tax 1040(Variations) Du vill extrahera information från 1040 formulär och dess varianter (Schema 1, Schema 2, Schema 3, Schema 8812, Schema A, Schema B, Schema C, Schema D, Schema E, Schema EIC, Schema F, Schema H, Schema J, Schema R, Schema SE, Schema Senior). Us tax 1040-modell
Avtal (juridiskt avtal mellan parter). Du vill extrahera avtalsinformation som parter, datum och intervall. Kontraktsmodell
Sjukförsäkringskort eller sjukförsäkrings-ID. Du vill extrahera viktig information som försäkringsgivare, medlems-ID, recepttäckning och gruppnummer. Modell för sjukförsäkringskort
Kredit-/debetkort . Du vill extrahera bankkort för nyckelinformation, till exempel kortnummer och banknamn. Kredit-/debetkortsmodell
Äktenskapscertifikat . Du vill extrahera viktig information från äktenskapscertifikat. Modell för äktenskapscertifikat
Faktura eller faktureringsutdrag. Du vill extrahera viktig information, till exempel kundnamn, faktureringsadress och belopp som ska betalas. Fakturamodell
Kvitto, kuponger eller hotellkvitto på en sida. Du vill extrahera viktig information, till exempel handelsnamn, transaktionsdatum och transaktionssumma. Kvittomodell
Identitetsdokument (ID) som ett amerikanskt körkort eller internationellt pass. Du vill extrahera viktig information som förnamn, efternamn, födelsedatum, adress och signatur. Modell för identitetsdokument (ID)
US Mortgage 1003 . Du vill extrahera viktig information från låneprogrammet Uniform Residential. 1003-formulärmodell
US Mortgage 1008 . Du vill extrahera viktig information från sammanfattningen enhetlig garanti och överföring. 1008-formulärmodell
Information om stängning av amerikanska hypotekslån . Du vill extrahera viktig information från ett upplysningsformulär för hypotekslån. Formulärmodell för information om stängning av bolån
Dokument av blandad typ med strukturerade, halvstrukturerade och/eller ostrukturerade element. Du vill extrahera nyckel/värde-par, markeringsmarkeringar, tabeller, signaturfält och valda regioner som inte extraheras av fördefinierade eller allmänna dokumentmodeller. Anpassad modell

Dricks

  • Om du fortfarande är osäker på vilken förtränad modell du ska använda kan du prova layoutmodellen med den valfria frågesträngsparametern features=keyValuePairs aktiverad.
  • Layoutmodellen drivs av OCR-motorn för att identifiera sidor, tabeller, format, text, rader, ord, platser och språk.

Anpassade extraheringsmodeller

Träningsuppsättning Exempeldokument Din bästa lösning
Strukturerade, konsekventa dokument med statisk layout. Strukturerade formulär som enkäter eller program. Anpassad mallmodell
Strukturerade, halvstrukturerade och ostrukturerade dokument. ● Strukturerade → undersökningar
● Halvstrukturerade → fakturor
● Ostrukturerade → bokstäver
Anpassad neural modell
En samling med flera modeller som var och en tränats på dokument av liknande typ. ● Leveransköpsbeställningar
● Beställningar av utrustningsköp
● Inköpsorder
för möbler Alla består av en enda modell.
Skapad anpassad modell

Anpassad klassificeringsmodell

Träningsuppsättning Exempeldokument Din bästa lösning
Minst två olika typer av dokument. Formulär, bokstäver eller dokument Anpassad klassificeringsmodell

Nästa steg