Vilken modell ska jag välja?
Viktigt!
- Versioner av den offentliga förhandsversionen av Document Intelligence ger tidig åtkomst till funktioner som är i aktiv utveckling. Funktioner, metoder och processer kan ändras, före allmän tillgänglighet (GA), baserat på användarfeedback.
- Den offentliga förhandsversionen av Dokumentinformationsklientbiblioteken är som standard REST API version 2024-07-31-preview.
- Den offentliga förhandsversionen 2024-07-31-preview är för närvarande endast tillgänglig i följande Azure-regioner. Observera att modellen för anpassad generativ (extrahering av dokumentfält) i AI Studio endast är tillgänglig i regionen USA, norra centrala:
- USA, östra
- USA, västra 2
- Europa, västra
- USA, norra centrala
Azure AI Document Intelligence stöder en mängd olika modeller som gör att du kan lägga till intelligent dokumentbearbetning i dina program och optimera dina arbetsflöden. Det är viktigt att välja rätt modell för att säkerställa att företaget lyckas. I den här artikeln utforskar vi tillgängliga dokumentinformationsmodeller och ger vägledning för hur du väljer den bästa lösningen för dina projekt.
Följande beslutsdiagram belyser funktionerna i varje modell som stöds för att hjälpa dig att välja den modell som bäst uppfyller programmets behov och krav.
Viktigt!
Se till att kontrollera språkstödsidan för språktext och fältextrahering efter funktion som stöds.
Förtränad dokumentanalysmodeller
Dokumenttyp | Exempel | Data som ska extraheras | Din bästa lösning |
---|---|---|---|
Ett allmänt dokument. | Ett kontrakt eller brev. | Du vill främst extrahera skrivna eller utskrivna textrader, ord, platser och identifierade språk. | Läs OCR-modell |
Ett dokument som innehåller strukturell information. | En rapport eller studie. | Förutom skriven eller tryckt text måste du extrahera strukturell information som tabeller, markeringsmarkeringar, stycken, rubriker, rubriker och underrubriker. | Layoutanalysmodell |
Ett strukturerat eller halvstrukturerat dokument som innehåller innehåll formaterat som fält (nycklar) och värden. | Ett formulär eller dokument som är ett standardiserat format som ofta används i ditt företag eller din bransch, till exempel ett kreditprogram eller en undersökning. | Du vill extrahera fält och värden inklusive värden som inte omfattas av de scenariospecifika fördefinierade modellerna utan att behöva träna en anpassad modell. | **Layoutanalysmodell med den valfria frågesträngsparametern features=keyValuePairs aktiverad ** |
Förtränat scenariospecifika modeller
Dokumenttyp | Data som ska extraheras | Din bästa lösning |
---|---|---|
Enhetlig skatt i USA | Du vill extrahera viktig information i alla skatteformer i W2, 1040, 1090, 1098 från en enda fil utan att köra någon egen anpassad klassificering. | Enhetlig skattemodell för USA |
Us Tax W-2 tax | Du vill extrahera viktig information som lön, löner och skatter som undanhålls. | W-2-modell för amerikansk skatt |
Amerikansk skatt 1098 | Du vill extrahera information om bolåneräntor som kapital, punkter och skatt. | Us tax 1098-modell |
Amerikansk skatt 1098-E | Du vill extrahera ränteinformation för studielån, till exempel långivare och räntebelopp. | Amerikansk skatt 1098-E-modell |
Us Tax 1098T | Du vill extrahera kvalificerad undervisningsinformation som stipendiejusteringar, studentstatus och långivarens information. | Amerikansk skatt 1098-T-modell |
US Tax 1099(Variationer) | Du vill extrahera information från 1099 formulär och dess variationer (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). |
Us tax 1099-modell |
US Tax 1040(Variationer) | Du vill extrahera information från 1040 formulär och dess varianter (schema 1, schema 2, schema 3, schema 8812, schema A, schema B, schema C, schema D, schema E, schema, schema EIC F, schema H, schema J, schema R, schema R, schema SE , schema senior). |
Us tax 1040-modell |
Kontoutdrag | Du vill extrahera viktig information från ett kontoutdrag i USA | \Kontoutdrag |
Bankkontroll | Du vill extrahera nyckelinformation från checkdokumentet. | Bankkontroll |
Avtal (juridiskt avtal mellan parter). | Du vill extrahera avtalsinformation som parter, datum och intervall. | Kontraktsmodell |
Sjukförsäkringskort eller sjukförsäkrings-ID. | Du vill extrahera viktig information som försäkringsgivare, medlems-ID, recepttäckning och gruppnummer. | Modell för sjukförsäkringskort |
Kredit-/debetkort | Du vill extrahera bankkort för nyckelinformation, till exempel kortnummer och banknamn. | Kredit-/debetkortsmodell |
Vigselbevis | Du vill extrahera viktig information från äktenskapscertifikat. | Modell för äktenskapscertifikat |
Faktura- eller faktureringsutdrag | Du vill extrahera viktig information, till exempel kundnamn, faktureringsadress och belopp som ska betalas. | Fakturamodell |
Kvitto, kuponger eller hotellkvitto på en sida. | Du vill extrahera viktig information, till exempel handelsnamn, transaktionsdatum och transaktionssumma. | Kvittomodell |
Identitetsdokument (ID) som ett amerikanskt körkort eller internationellt pass | Du vill extrahera viktig information som förnamn, efternamn, födelsedatum, adress och signatur. | Modell för identitetsdokument (ID) |
Betala stub | Du vill extrahera viktig information från lönedokumentet. | Betala stub-modell |
US Mortgage 1003 | Du vill extrahera viktig information från låneprogrammet Uniform Residential. | 1003-formulärmodell |
Us Mortgage 1004 | Du vill extrahera viktig information från URAR (Uniform Residential Appraisal Report). | 1004-formulärmodell |
US Mortgage 1005 | Du vill extrahera viktig information från formuläret Verifiering av anställning | 1005-formulärmodell |
Us Mortgage 1008 | Du vill extrahera viktig information från sammanfattningen enhetlig garanti och överföring. | 1008-formulärmodell |
Information om stängning av amerikanska hypotekslån | Du vill extrahera viktig information från ett upplysningsformulär för hypotekslån. | Formulärmodell för information om stängning av bolån |
Dokument av blandad typ med strukturerade, halvstrukturerade och/eller ostrukturerade element | Du vill extrahera nyckel/värde-par, markeringsmarkeringar, tabeller, signaturfält och valda regioner som inte extraheras av fördefinierade eller allmänna dokumentmodeller. | Anpassad modell |
Dricks
- Om du fortfarande är osäker på vilken förtränad modell du ska använda kan du prova layoutmodellen med den valfria frågesträngsparametern
features=keyValuePairs
aktiverad. - Layoutmodellen drivs av OCR-motorn för att identifiera sidor, tabeller, format, text, rader, ord, platser och språk.
Anpassade extraheringsmodeller
Träningsuppsättning | Exempeldokument | Din bästa lösning |
---|---|---|
Strukturerade, konsekventa dokument med statisk layout. | Strukturerade formulär som enkäter eller program. | Anpassad mallmodell |
Strukturerad och halvstrukturerad. | ● Strukturerade → undersökningar ● Halvstrukturerade → fakturor |
Anpassad neural modell |
Ostrukturerade dokument, dokument med varierande mallar. | ● Ostrukturerade dokument som kontrakt eller brev ● Varierande dokumentmallar som låneutdrag från olika hypoteksföretag |
Anpassad generativ modell |
En samling med flera modeller som var och en tränats på dokument av liknande typ. | ● Leveransköpsbeställningar ● Beställningar av utrustningsköp ● Inköpsorder för möbler Alla består av en enda modell. |
Skapad anpassad modell |
Anpassad klassificeringsmodell
Träningsuppsättning | Exempeldokument | Din bästa lösning |
---|---|---|
Minst två olika typer av dokument. | Formulär, bokstäver eller dokument | Anpassad klassificeringsmodell |