Dela via


Vilken modell ska jag välja?

Viktigt!

  • Versioner av den offentliga förhandsversionen av Document Intelligence ger tidig åtkomst till funktioner som är i aktiv utveckling. Funktioner, metoder och processer kan ändras, före allmän tillgänglighet (GA), baserat på användarfeedback.
  • Den offentliga förhandsversionen av Dokumentinformationsklientbiblioteken är som standard REST API version 2024-07-31-preview.
  • Den offentliga förhandsversionen 2024-07-31-preview är för närvarande endast tillgänglig i följande Azure-regioner. Observera att modellen för anpassad generativ (extrahering av dokumentfält) i AI Studio endast är tillgänglig i regionen USA, norra centrala:
    • USA, östra
    • USA, västra 2
    • Europa, västra
    • USA, norra centrala

Azure AI Document Intelligence stöder en mängd olika modeller som gör att du kan lägga till intelligent dokumentbearbetning i dina program och optimera dina arbetsflöden. Det är viktigt att välja rätt modell för att säkerställa att företaget lyckas. I den här artikeln utforskar vi tillgängliga dokumentinformationsmodeller och ger vägledning för hur du väljer den bästa lösningen för dina projekt.

Följande beslutsdiagram belyser funktionerna i varje modell som stöds för att hjälpa dig att välja den modell som bäst uppfyller programmets behov och krav.

Viktigt!

Se till att kontrollera språkstödsidan för språktext och fältextrahering efter funktion som stöds.

Förtränad dokumentanalysmodeller

Dokumenttyp Exempel Data som ska extraheras Din bästa lösning
Ett allmänt dokument. Ett kontrakt eller brev. Du vill främst extrahera skrivna eller utskrivna textrader, ord, platser och identifierade språk. Läs OCR-modell
Ett dokument som innehåller strukturell information. En rapport eller studie. Förutom skriven eller tryckt text måste du extrahera strukturell information som tabeller, markeringsmarkeringar, stycken, rubriker, rubriker och underrubriker. Layoutanalysmodell
Ett strukturerat eller halvstrukturerat dokument som innehåller innehåll formaterat som fält (nycklar) och värden. Ett formulär eller dokument som är ett standardiserat format som ofta används i ditt företag eller din bransch, till exempel ett kreditprogram eller en undersökning. Du vill extrahera fält och värden inklusive värden som inte omfattas av de scenariospecifika fördefinierade modellerna utan att behöva träna en anpassad modell. **Layoutanalysmodell med den valfria frågesträngsparametern features=keyValuePairs aktiverad **

Förtränat scenariospecifika modeller

Dokumenttyp Data som ska extraheras Din bästa lösning
Enhetlig skatt i USA Du vill extrahera viktig information i alla skatteformer i W2, 1040, 1090, 1098 från en enda fil utan att köra någon egen anpassad klassificering. Enhetlig skattemodell för USA
Us Tax W-2 tax Du vill extrahera viktig information som lön, löner och skatter som undanhålls. W-2-modell för amerikansk skatt
Amerikansk skatt 1098 Du vill extrahera information om bolåneräntor som kapital, punkter och skatt. Us tax 1098-modell
Amerikansk skatt 1098-E Du vill extrahera ränteinformation för studielån, till exempel långivare och räntebelopp. Amerikansk skatt 1098-E-modell
Us Tax 1098T Du vill extrahera kvalificerad undervisningsinformation som stipendiejusteringar, studentstatus och långivarens information. Amerikansk skatt 1098-T-modell
US Tax 1099(Variationer) Du vill extrahera information från 1099 formulär och dess variationer (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). Us tax 1099-modell
US Tax 1040(Variationer) Du vill extrahera information från 1040 formulär och dess varianter (schema 1, schema 2, schema 3, schema 8812, schema A, schema B, schema C, schema D, schema E, schema, schema EICF, schema H, schema J, schema R, schema R, schema SE, schema senior). Us tax 1040-modell
Kontoutdrag Du vill extrahera viktig information från ett kontoutdrag i USA \Kontoutdrag
Bankkontroll Du vill extrahera nyckelinformation från checkdokumentet. Bankkontroll
Avtal (juridiskt avtal mellan parter). Du vill extrahera avtalsinformation som parter, datum och intervall. Kontraktsmodell
Sjukförsäkringskort eller sjukförsäkrings-ID. Du vill extrahera viktig information som försäkringsgivare, medlems-ID, recepttäckning och gruppnummer. Modell för sjukförsäkringskort
Kredit-/debetkort Du vill extrahera bankkort för nyckelinformation, till exempel kortnummer och banknamn. Kredit-/debetkortsmodell
Vigselbevis Du vill extrahera viktig information från äktenskapscertifikat. Modell för äktenskapscertifikat
Faktura- eller faktureringsutdrag Du vill extrahera viktig information, till exempel kundnamn, faktureringsadress och belopp som ska betalas. Fakturamodell
Kvitto, kuponger eller hotellkvitto på en sida. Du vill extrahera viktig information, till exempel handelsnamn, transaktionsdatum och transaktionssumma. Kvittomodell
Identitetsdokument (ID) som ett amerikanskt körkort eller internationellt pass Du vill extrahera viktig information som förnamn, efternamn, födelsedatum, adress och signatur. Modell för identitetsdokument (ID)
Betala stub Du vill extrahera viktig information från lönedokumentet. Betala stub-modell
US Mortgage 1003 Du vill extrahera viktig information från låneprogrammet Uniform Residential. 1003-formulärmodell
Us Mortgage 1004 Du vill extrahera viktig information från URAR (Uniform Residential Appraisal Report). 1004-formulärmodell
US Mortgage 1005 Du vill extrahera viktig information från formuläret Verifiering av anställning 1005-formulärmodell
Us Mortgage 1008 Du vill extrahera viktig information från sammanfattningen enhetlig garanti och överföring. 1008-formulärmodell
Information om stängning av amerikanska hypotekslån Du vill extrahera viktig information från ett upplysningsformulär för hypotekslån. Formulärmodell för information om stängning av bolån
Dokument av blandad typ med strukturerade, halvstrukturerade och/eller ostrukturerade element Du vill extrahera nyckel/värde-par, markeringsmarkeringar, tabeller, signaturfält och valda regioner som inte extraheras av fördefinierade eller allmänna dokumentmodeller. Anpassad modell

Dricks

  • Om du fortfarande är osäker på vilken förtränad modell du ska använda kan du prova layoutmodellen med den valfria frågesträngsparametern features=keyValuePairs aktiverad.
  • Layoutmodellen drivs av OCR-motorn för att identifiera sidor, tabeller, format, text, rader, ord, platser och språk.

Anpassade extraheringsmodeller

Träningsuppsättning Exempeldokument Din bästa lösning
Strukturerade, konsekventa dokument med statisk layout. Strukturerade formulär som enkäter eller program. Anpassad mallmodell
Strukturerad och halvstrukturerad. ● Strukturerade → undersökningar
● Halvstrukturerade → fakturor
Anpassad neural modell
Ostrukturerade dokument, dokument med varierande mallar. ● Ostrukturerade dokument som kontrakt eller brev
● Varierande dokumentmallar som låneutdrag från olika hypoteksföretag
Anpassad generativ modell
En samling med flera modeller som var och en tränats på dokument av liknande typ. ● Leveransköpsbeställningar
● Beställningar av utrustningsköp
● Inköpsorder
för möbler Alla består av en enda modell.
Skapad anpassad modell

Anpassad klassificeringsmodell

Träningsuppsättning Exempeldokument Din bästa lösning
Minst två olika typer av dokument. Formulär, bokstäver eller dokument Anpassad klassificeringsmodell

Nästa steg