Welk model moet ik kiezen?
Belangrijk
- Openbare preview-versies van Document Intelligence bieden vroegtijdige toegang tot functies die actief zijn in ontwikkeling. Functies, benaderingen en processen kunnen veranderen, vóór algemene beschikbaarheid (GA), op basis van feedback van gebruikers.
- De openbare preview-versie van Document Intelligence-clientbibliotheken is standaard ingesteld op REST API-versie 2024-07-31-preview.
- Openbare preview-versie 2024-07-31-preview is momenteel alleen beschikbaar in de volgende Azure-regio's. Houd er rekening mee dat het aangepaste model voor generatieve (extractie van documentvelden) in AI Studio alleen beschikbaar is in de regio VS - noord-centraal:
- VS - oost
- VS - west 2
- Europa -west
- VS - noord-centraal
Azure AI Document Intelligence ondersteunt een groot aantal modellen waarmee u intelligente documentverwerking kunt toevoegen aan uw toepassingen en uw werkstromen kunt optimaliseren. Het selecteren van het juiste model is essentieel om het succes van uw onderneming te garanderen. In dit artikel verkennen we de beschikbare Document Intelligence-modellen en bieden we richtlijnen voor het kiezen van de beste oplossing voor uw projecten.
In de volgende beslissingsgrafieken worden de functies van elk ondersteund model gemarkeerd, zodat u het model kunt kiezen dat het beste voldoet aan de behoeften en vereisten van uw toepassing.
Belangrijk
Controleer de pagina voor taalondersteuning voor ondersteunde taaltekst en veldextractie per functie.
Vooraf getrainde modellen voor documentanalyse
Documenttype | Opmerking | Gegevens om te extraheren | Uw beste oplossing |
---|---|---|---|
Een algemeen document. | Een contract of brief. | U wilt voornamelijk geschreven of afgedrukte tekstregels, woorden, locaties en gedetecteerde talen extraheren. | OCR-model lezen |
Een document met structurele informatie. | Een rapport of studie. | Naast geschreven of afgedrukte tekst moet u structurele informatie extraheren, zoals tabellen, selectiemarkeringen, alinea's, titels, koppen en subkoppen. | Indelingsanalysemodel |
Een gestructureerd of semi-gestructureerd document met inhoud die is opgemaakt als velden (sleutels) en waarden. | Een formulier of document dat een gestandaardiseerde indeling is die vaak wordt gebruikt in uw bedrijf of branche, zoals een krediettoepassing of enquête. | U wilt velden en waarden extraheren, inclusief velden en waarden die niet worden gedekt door de scenariospecifieke vooraf samengestelde modellen zonder dat u een aangepast model hoeft te trainen. | **Indelingsanalysemodel waarvoor de optionele queryreeksparameter features=keyValuePairs is ingeschakeld ** |
Vooraf getrainde scenariospecifieke modellen
Documenttype | Gegevens om te extraheren | Uw beste oplossing |
---|---|---|
Verenigde Amerikaanse belasting | U wilt belangrijke informatie extraheren uit alle belastingformulieren van W2, 1040, 1090, 1098 uit één bestand zonder dat u zelf een aangepaste classificatie hoeft uit te voeren. | Amerikaans uniform belastingmodel |
Amerikaanse belasting W-2 | U wilt belangrijke informatie extraheren, zoals salaris, lonen en belastingen die zijn ingehouden. | Amerikaanse belasting W-2-model |
Amerikaanse belasting 1098 | U wilt hypotheekrentegegevens zoals hoofdsom, punten en belasting extraheren. | Amerikaanse belastingmodel 1098 |
Amerikaanse belasting 1098-E | U wilt details van de lening voor studenten extraheren, zoals kredietverlener en rentebedrag. | Amerikaanse belasting 1098-E-model |
Amerikaanse belasting 1098T | U wilt gekwalificeerde collegegeldgegevens extraheren, zoals aanpassingen van beurzen, studentenstatus en kredietverlenerinformatie. | Amerikaanse belastingmodel 1098-T |
Amerikaanse belasting 1099(variaties) | U wilt informatie extraheren uit 1099 formulieren en de variaties (A, B, C, CAP, DIV, G, H, INT, K, LS, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB). |
Amerikaanse belastingmodel 1099 |
Amerikaanse belasting 1040(variaties) | U wilt gegevens extraheren uit 1040 formulieren en de variaties (Planning 1, Planning 2, Planning 3, Planning 8812, Planning A, Planning B, Planning C, Planning D, Planning E, Planning EIC E, Planning F, Planning H, Planning J, Planning R, Planning, Planning SE Senior). |
Amerikaanse belastingmodel 1040 |
Bankafschrift | U wilt belangrijke informatie extraheren uit amerikaanse bankafschriften | \Bankafschrift |
Bankcontrole | U wilt belangrijke informatie extraheren uit het controledocument. | Bankcontrole |
Contract (juridische overeenkomst tussen partijen). | U wilt contractovereenkomstgegevens extraheren, zoals partijen, datums en intervallen. | Contractmodel |
Ziekteverzekeringskaart of ziekteverzekerings-id. | U wilt belangrijke informatie extraheren, zoals verzekeraar, lid-id, receptdekking en groepsnummer. | Model van gezondheidsverzekeringskaart |
Creditcard/betaalpas | U wilt sleutelgegevens bankkaarten extraheren, zoals kaartnummer en banknaam. | Creditcardmodel |
Huwelijksakte | U wilt belangrijke informatie extraheren uit huwelijkscertificaten. | Model van huwelijkscertificaat |
Factuur - of factuuroverzicht | U wilt belangrijke informatie extraheren, zoals de naam van de klant, het factuuradres en het verschuldigde bedrag. | Factuurmodel |
Ontvangstbewijs, voucher of hotelbevestiging met één pagina. | U wilt belangrijke informatie extraheren, zoals de naam van de verkoper, de transactiedatum en het transactietotaal. | Ontvangstbewijsmodel |
Identiteitsdocument (id) zoals een Amerikaanse rijbewijs of internationaal paspoort | U wilt belangrijke informatie extraheren, zoals voornaam, achternaam, geboortedatum, adres en handtekening. | Identiteitsdocumentmodel (ID) |
Stub betalen | U wilt belangrijke informatie extraheren uit het document met betalen per stuk. | Stub-model voor betalen |
Amerikaanse hypotheek 1003 | U wilt belangrijke informatie extraheren uit de aanvraag Uniform Residential-lening. | 1003-formuliermodel |
Amerikaanse hypotheek 1004 | U wilt belangrijke informatie extraheren uit het Uniform Residential Tax Report (URAR). | 1004-formuliermodel |
Amerikaanse hypotheek 1005 | U wilt belangrijke informatie extraheren uit de verificatie van het arbeidsformulier | 1005-formuliermodel |
Amerikaanse hypotheek 1008 | U wilt belangrijke informatie extraheren uit de samenvatting Uniform Underwriting en Transmittal. | 1008-formuliermodel |
Openbaarmaking van hypotheekafsluiting in de VS | U wilt belangrijke informatie extraheren uit een openbaarmakingsformulier voor hypotheeksluiting. | Formuliermodel voor het sluiten van de hypotheek |
Document(en) met gemengde, semi-gestructureerde en/of ongestructureerde elementen | U wilt sleutel-waardeparen, selectiemarkeringen, tabellen, handtekeningvelden en geselecteerde regio's extraheren die niet zijn geëxtraheerd door vooraf gedefinieerde of algemene documentmodellen. | Aangepast model |
Tip
- Als u nog steeds niet zeker weet welk vooraf getraind model moet worden gebruikt, probeert u het indelingsmodel waarvoor de optionele queryreeksparameter
features=keyValuePairs
is ingeschakeld. - Het indelingsmodel wordt mogelijk gemaakt door de read OCR-engine om pagina's, tabellen, stijlen, tekst, regels, woorden, locaties en talen te detecteren.
Aangepaste extractiemodellen
Trainingsset | Voorbeelddocumenten | Uw beste oplossing |
---|---|---|
Gestructureerde, consistente documenten met een statische indeling. | Gestructureerde formulieren, zoals vragenlijsten of aanvragen. | Aangepast sjabloonmodel |
Gestructureerd en semi-gestructureerd. | ● Gestructureerde → enquêtes ● Semi-gestructureerd → facturen |
Aangepast neuraal model |
Ongestructureerde documenten, documenten met verschillende sjablonen. | ● Ongestructureerde documenten zoals contracten of brieven ● Variërende documentsjablonen zoals leningverklaringen van verschillende hypotheekbedrijven |
Aangepast generatief model |
Een verzameling van verschillende modellen die elk zijn getraind op vergelijkbare documenten. | ● Inkooporders leveren● Inkooporders ● Meubelaanbestellingen Alle samengesteld in één model. |
Samengesteld aangepast model |
Aangepast classificatiemodel
Trainingsset | Voorbeelddocumenten | Uw beste oplossing |
---|---|---|
Ten minste twee verschillende typen documenten. | Formulieren, brieven of documenten | Aangepast classificatiemodel |