Document Intelligence AMERIKAANSE belastingdocumentmodellen

Belangrijk

  • Openbare preview-versies van Document Intelligence bieden vroegtijdige toegang tot functies die actief zijn in ontwikkeling.
  • Functies, benaderingen en processen kunnen veranderen, vóór algemene beschikbaarheid (GA), op basis van feedback van gebruikers.
  • De openbare preview-versie van Document Intelligence-clientbibliotheken is standaard ingesteld op REST API-versie 2024-02-29-preview.
  • Openbare preview-versie 2024-02-29-preview is momenteel alleen beschikbaar in de volgende Azure-regio's:
  • VS - oost
  • VS - west 2
  • Europa -west

Deze inhoud is van toepassing op:Vinkjev4.0 (preview) | Vorige versies:blauw-vinkjev3.1 (GA)

Deze inhoud is van toepassing op:Vinkjev3.1 (GA) | Nieuwste versie:paars vinkjev4.0 (preview)

Het Document Intelligence-contractmodel maakt gebruik van krachtige OCR-mogelijkheden (Optical Character Recognition) om belangrijke velden en regelitems uit een selecte groep belastingdocumenten te analyseren en te extraheren. Belastingdocumenten kunnen van verschillende indelingen en kwaliteit zijn, waaronder door de telefoon vastgelegde afbeeldingen, gescande documenten en digitale PDF-bestanden. De API analyseert documenttekst; extraheert belangrijke informatie, zoals klantnaam, factuuradres, vervaldatum en verschuldigd bedrag; en retourneert een gestructureerde JSON-gegevensweergave. Het model ondersteunt momenteel bepaalde Indelingen voor Engelse belastingdocumenten.

Ondersteunde documenttypen:

  • W-2
  • 1098
  • 1098-E
  • 1098-T
  • 1099 en variaties (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB)
  • 1040 en variaties (Planning 1, Planning 2, Planning 3, Planning 8812, Planning A, Planning B, Planning C, Planning D, Planning E, Planning E, Planning EICF, Planning H, Planning J, Schema R, Schema SE en Planning Senior)

Geautomatiseerde verwerking van belastingdocumenten

Geautomatiseerde verwerking van belastingdocumenten is het proces van het extraheren van sleutelvelden uit belastingdocumenten. Belastingdocumenten werden in het verleden handmatig verwerkt. Met dit model kunt u eenvoudig belastingscenario's automatiseren.

Ontwikkelingsopties

Document Intelligence v4.0 (2023-10-31-preview) ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie Resources Model-id
Amerikaanse belastingformuliermodellen Document Intelligence Studio
REST API
C# SDK
• Python SDK
Java SDK
JavaScript SDK
• prebuilt-tax.us.W-2• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T
• prebuilt-tax.us.1099A
• prebuilt-tax.us.1099B
• prebuilt-tax.us.1099C
• prebuilt-tax.us.1099CAP
• prebuilt-tax.us.1099DIV
• prebuilt-tax.us.1099G
• prebuilt-tax.us.1099H
• prebuilt-tax.us.1099INT
• prebuilt-tax.us.1099K
• prebuilt-tax.us.1099LS
• prebuilt-tax.us.us.1099LTC
• prebuilt-tax.us.1099MISC

prebuilt-tax.us.1099NEC• prebuilt-tax.us.1099OID
• prebuilt-tax.us.us.1099PATR
• prebuilt-tax.us.1099Q
• prebuilt-tax.us.1099QA
• prebuilt-tax.us.1099R
• prebuilt-tax.us.1099S
• prebuilt-tax.us.1099SA
• prebuilt-tax.us.1099SB
• prebuilt-tax.us.1040
• prebuilt-tax.us.1040Schedule1
• prebuilt-tax.us•built-tax.us.1040Schedule2
• prebuilt-tax.us.1040Schedule3
• prebuilt-tax.us.1040Schedule8812

prebuilt-tax.us.1040ScheduleA
• prebuilt-tax.us.1040ScheduleB
• prebuilt-tax.us.1040ScheduleC• pre prebuilt-tax.us.us.1040ScheduleC• prebuilt-tax.us.1040ScheduleC
• prebuilt-taxbuilt-tax.us.1040ScheduleD
• prebuilt-tax.us.1040ScheduleE
• prebuilt-tax.us.1040ScheduleEIC
• prebuilt-tax.us.1040ScheduleF
• prebuilt-tax.us.1040ScheduleH
• prebuilt-tax.us.us.1040ScheduleJ
• prebuilt-tax.us.1040ScheduleR
• prebuilt-tax.us.1040ScheduleSE
• prebuilt-tax.us.1040Senior

Document Intelligence v3.1 ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie Resources Model-id
Amerikaanse belastingformuliermodellen Document Intelligence Studio
REST API
C# SDK
• Python SDK
Java SDK
JavaScript SDK
• prebuilt-tax.us.W-2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

Document Intelligence v3.0 ondersteunt de volgende hulpprogramma's, toepassingen en bibliotheken:

Functie Resources Model-id
Amerikaanse belastingformuliermodellen Document Intelligence Studio
REST API
C# SDK
• Python SDK
Java SDK
JavaScript SDK
• prebuilt-tax.us.W-2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

Vereisten voor invoer

  • Geef voor de beste resultaten één duidelijke foto of een hoogwaardige scan per document op.

  • Ondersteunde bestandsindelingen:

    Model PDF Afbeelding:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) en HTML
    Read
    Indeling ✔ (2024-02-29-preview, 2023-10-31-preview)
    Algemeen document
    Vooraf gebouwd
    Aangepaste extractie
    Aangepaste classificatie ✔ (2024-02-29-preview)
  • Voor PDF en TIFF kunnen maximaal 2000 pagina's worden verwerkt (met een abonnement op de gratis laag worden alleen de eerste twee pagina's verwerkt).

  • De bestandsgrootte voor het analyseren van documenten is 500 MB voor betaalde (S0) laag en 4 MB gratis (F0).

  • De afmetingen van de afbeelding moeten tussen 50 x 50 pixels en 10.000 pixels x 10.000 pixels zijn.

  • Als uw PDF's zijn vergrendeld met een wachtwoord, moet u de vergrendeling verwijderen voordat u ze indient.

  • De minimale hoogte van de tekst die moet worden geëxtraheerd, is 12 pixels voor een afbeelding van 1024 x 768 pixels. Deze dimensie komt overeen met ongeveer 8-punttekst op 150 punten per inch (DPI).

  • Voor aangepaste modeltraining is het maximum aantal pagina's voor trainingsgegevens 500 voor het aangepaste sjabloonmodel en 50.000 voor het aangepaste neurale model.

    • Voor het trainen van aangepaste extractiemodellen is de totale grootte van trainingsgegevens 50 MB voor het sjabloonmodel en 1G-MB voor het neurale model.

    • Voor het trainen van aangepast classificatiemodel is 1GB de totale grootte van trainingsgegevens maximaal 10.000 pagina's.

Gegevensextractie van belastingdocument proberen

Bekijk hoe gegevens, waaronder klantgegevens, details van leveranciers en regelitems, worden geëxtraheerd uit facturen. U hebt de volgende resources nodig:

  • Een Azure-abonnement: u kunt er gratis een maken.

  • Een Document Intelligence-exemplaar in Azure Portal. U kunt de gratis prijscategorie (F0) gebruiken om de service te proberen. Nadat uw resource is geïmplementeerd, selecteert u Ga naar de resource om uw sleutel en eindpunt op te halen.

Schermopname van sleutels en eindpuntlocatie in Azure Portal.

Document Intelligence Studio

  1. Selecteer op de startpagina van Document Intelligence Studio het ondersteunde belastingdocumentmodel.

  2. U kunt een voorbeeld van een belastingdocument analyseren of uw eigen bestanden uploaden.

  3. Selecteer de knop Analyse uitvoeren en configureer indien nodig de opties Analyseren:

    Schermopname van de knoppen Analyse uitvoeren en Opties analyseren in Document Intelligence Studio.

Ondersteunde talen en landinstellingen

Zie onze pagina met vooraf samengestelde modellen voor een volledige lijst met ondersteunde talen.

Veldextractie W-2

Hier volgen de velden die zijn geëxtraheerd uit een W-2-belastingformulier in het JSON-uitvoerantwoord.

Name Type Description Voorbeelduitvoer Doelcellen
W-2FormVariant String IR W-2 Form variant. Dit veld kan een van de volgende waarden hebben: W-2, W-2AS, W-2CM, of W-2GUW-2VI W-2
TaxYear Aantal Formulierbelastingjaar 2021
W2Copy String W-2 belasting kopie versie samen met afgedrukte instructie gerelateerd aan deze kopie Copy A — For Social Security Beheer istration
Employee object Object met burgerservicenummer, naam en adres
ControlNumber tekenreeks W-2 controlenummer. IRS W-2 veld d 0AB12 D345 7890
Employer Object Object dat het identificatienummer, de naam en het adres van de werkgever bevat
WagesTipsAndOtherCompensation Aantal Lonen, tips en ander compensatiebedrag in USD. IRS W-2 veld 1 1234567.89
FederalIncomeTaxWithheld Aantal Federale ingehouden belastingbedrag in USD. IRS W-2 veld 2 1234567.89
SocialSecurityWages Aantal Het loon van de sociale zekerheid in USD. IRS W-2 veld 3 1234567.89
SocialSecurityTaxWithheld Aantal De belasting van de sociale zekerheid die in USD wordt ingehouden. IRS W-2 veld 4 1234567.89
MedicareWagesAndTips Aantal Medicare-lonen en tips bedrag in USD. IRS W-2 veld 5 1234567.89
MedicareTaxWithheld Aantal Medicare belasting ingehouden bedrag in USD. IRS W-2 veld 6 1234567.89
SocialSecurityTips Aantal Het bedrag van tips voor sociale zekerheid in USD. IRS W-2 veld 7 1234567.89
AllocatedTips Aantal Toegewezen tips in USD. IRS W-2 veld 8 1234567.89
VerificationCode Aantal W-2-verificatiecode. IRS W-2 veld 9 1234567.89
DependentCareBenefits Aantal Bedrag van afhankelijke zorguitkeringen in USD. IRS W-2 veld 10 1234567.89
NonQualifiedPlans Aantal Niet-gekwalificeerde abonnementen in USD. IRS W-2 veld 11 1234567.89
IsStatutoryEmployee String Onderdeel van IRS W-2 veld 13. Kan waar of onwaar zijn true
IsRetirementPlan String Onderdeel van IRS W-2 veld 13. Kan waar of onwaar zijn true
IsThirdPartySickPay String Onderdeel van IRS W-2 veld 13. Kan waar of onwaar zijn true
Other String Inhoud van IRS W-2 veld 14 ZIEKE LV-LONEN SBJT TOT $ 511/DAG LIMIET 1356
StateTaxInfos Matrix Belastinggerelateerde informatie. inhoud van IRS W-2 veld 15 tot en met 17
LocaleTaxInfos Matrix Informatie over lokale belasting. Inhoud van IRS W-2 veld 18 tot 20

Veldextractie 1098

Hier volgen de velden die zijn geëxtraheerd uit een belastingformulier van 1098 in het JSON-uitvoerantwoord. De formulieren 1098-T en 1098-E worden ook ondersteund.

Name Type Description Voorbeelduitvoer
Belastingjaar Aantal Formulierbelastingjaar 2021
Kredietnemer Object Een object dat het TIN, de naam, het adres en het accountnummer van de kredietnemer bevat
Kredietgever Object Een object dat het TIN, de naam, het adres en de telefoon van de kredietverlener bevat
Hypotheekinterest Aantal Hypotheekrentebedrag ontvangen van betalers/kredietnemers (box 1) 1,234,567.89
OutstandingMortgagePrincipal Aantal Openstaande hypotheekprincipaal (box 2) 1,234,567.89
MortgageOriginationDate Datum Oorsprongsdatum van de hypotheek (box 3) 2022-01-01
OverpaidInterestRefund Aantal Restitutiebedrag van overbetaalde rente (vak 4) 1,234,567.89
MortgageInsurancePremium Aantal Hypotheekverzekeringspremiebedrag (box 5) 1,234,567.89
PointsPaid Aantal Punten betaald bij aankoop van hoofdwoning (Box 6) 1,234,567.89
IsPropertyAddressSameAsBorrower String Is het adres van de woning die de hypotheek beveiligt hetzelfde als het postadres van de betaler/de kredietnemer (vak 7) true
PropertyAddress String Adres of beschrijving van de woning die de hypotheek beveiligt (box 8) 123 Main St., Redmond WA 98052
MortgagedPropertiesCount Aantal Aantal hypotheekwoningen (vak 9) 1
Overige String Aanvullende informatie om te rapporteren aan de betaler (vak 10)
RealEstateTax Aantal Onroerend goedbelasting (box 1) 1,234,567.89
Aanvullende evaluatie String Evaluaties toegevoegd die zijn uitgevoerd op de eigenschap (vak 10) 1,234,567.89
MortgageAcquisitionDate datum Datum van hypotheekaankoop (vak 11) 2022-01-01

Veldextractie 1099-NEC

Hier volgen de velden die zijn geëxtraheerd uit een belastingformulier van 1099-nec in het JSON-uitvoerantwoord. De andere variaties van 1099 worden ook ondersteund.

Name Type Description Voorbeelduitvoer
TaxYear String Belastingjaar geëxtraheerd uit formulier 1099-NEC. 2021
Payer Object Een object dat het TIN, de naam, het adres en Telefoon getal van de betaler bevat
Recipient Object Een object dat het TIN, de naam, het adres en het accountnummer van de geadresseerde bevat
Box1 Nummer Box 1 geëxtraheerd uit formulier 1099-NEC. 123456
Box2 boolean Box 2 geëxtraheerd uit Formulier 1099-NEC. true
Box4 Nummer Box 4 geëxtraheerd uit formulier 1099-NEC. 123456
StateTaxesWithheld matrix Staatsbelastingen ingetrokken uit formulier 1099-NEC (vakken 5, 6 en 7)

Veldextractie 1040 belastingformulier

Hier volgen de velden die zijn geëxtraheerd uit een belastingformulier van 1040 in het JSON-uitvoerantwoord. De andere variaties van 1040 worden ook ondersteund.

Name Type Description Voorbeelduitvoer
TaxPayer Object Een object dat de gegevens van de belastingbetaler bevat, zoals SSN, Achternaam en Adres
Spouse Object Een object dat de gegevens van de echtgenoot bevat, zoals SSN, achternaam en voornaam en initialennaam
Dependents matrix Een matrix die een lijst met afhankelijkheden bevat, waaronder informatie zoals Naam, SSN en Krediettype
ThirdPartyDesignee object Een object met informatie over de ontwerpinstelling van derden
SignatureDetails object Een object met informatie over de ondertekening, zoals telefoonnummers en e-mailberichten
PaidPreparer object Een object met informatie over de voorbereiding.
FillingStatus String Waarde kan een van noSelection, single, marriedFilingJointly, marriedFillingSeparately, headOfHousehold, qualifyingSurvivingSpouse of multiSelection zijn. Één
FilingStatusDetails object Een object met informatie over de archiveringsstatus.
NameOfSpouseOrQualifyingPerson String Naam van echtgenoot of in aanmerking komende persoon geëxtraheerd uit formulier 1040. John Smith
PresidentialElectionCampaign String Waarde kan een van noSelection, belastingbetaler, echtgenoot of multiSelection zijn. Belastingbetaler
PresidentialElectionCampaignDetails object Een object met details over de presidentsverkiezingen.
DigitalAssets String Waarde kan een van noSelection zijn, ja, nee of multiSelection. ja
DigitalAssetsDetails object Een object met details over de digitale assets.
ClaimStatus String Waarde kan een van noSelection, belastingbetalerAsDependent, echtgenootAsDependent, echtgenootItemizesSeparatelyOrDualStatusAlien of multiSelection zijn. belastingbetalerAsDependent
ClaimStatusDetails object Een object met details over de claimstatus.
TaxpayerAgeBlindness String Waarde kan een van noSelection, above64blind of multiSelection zijn. boven64
TaxPayerAgeBlindnessDetails object Een object met details over de blindheid van de belastingbetaler.
SpouseAgeBlindness String Waarde kan een van noSelection, above64blind of multiSelection zijn. boven64
TaxPayerAgeBlindnessDetails object Een object met details over de leeftijdsblindheid van de echtgenoot.
MoreThanFourDependents boolean Meer dan vier afhankelijke elementen die zijn geëxtraheerd uit formulier 1040. true
Box1a Nummer Box 1a geëxtraheerd uit 1040. 123456
Op basis van de opgegeven JSON-structuur en deze converteren naar dezelfde tabelindeling als aangevraagd, is het resultaat als volgt:
Box1b Nummer Box 1b geëxtraheerd uit 1040. 123456
Box1c Nummer Box 1c geëxtraheerd uit 1040. 123456
Box1d Nummer Box 1d geëxtraheerd uit 1040. 123456
Box1e Nummer Box 1e geëxtraheerd uit 1040. 123456
Box1f Nummer Box 1f geëxtraheerd uit 1040. 123456
Box1g Nummer Box 1g geëxtraheerd uit 1040. 123456
Box1h Nummer Box 1h geëxtraheerd uit 1040. 123456
Box1i Nummer Box 1i geëxtraheerd uit 1040. 123456
Box1z Nummer Box 1z geëxtraheerd uit 1040. 123456
Box2a Nummer Box 2a geëxtraheerd uit 1040. 123456
Box2b Nummer Box 2b geëxtraheerd uit 1040. 123456
Box3a Nummer Box 3a geëxtraheerd uit 1040. 123456
Box3b Nummer Box 3b geëxtraheerd uit 1040. 123456
Box4a Nummer Box 4a geëxtraheerd uit 1040. 123456
Box4b Nummer Box 4b geëxtraheerd uit 1040. 123456
Box5a Nummer Box 5a geëxtraheerd uit 1040. 123456
Box5b Nummer Box 5b geëxtraheerd uit 1040. 123456
Box6a Nummer Box 6a geëxtraheerd uit 1040. 123456
Box6b Nummer Box 6b geëxtraheerd uit 1040. 123456
Box6cCheckbox boolean Selectievakje 6c uit 1040 geëxtraheerd. true
Box7Checkbox boolean Selectievakje 7 geëxtraheerd uit 1040. true
Box7 Nummer Box 7 geëxtraheerd uit 1040. 123456
Box8 Nummer Box 8 geëxtraheerd uit 1040. 123456
Box9 Nummer Box 9 geëxtraheerd uit 1040. 123456
Box10 Nummer Box 10 geëxtraheerd uit 1040. 123456
Box11 Nummer Box 11 geëxtraheerd uit 1040. 123456
Box12 Nummer Box 12 geëxtraheerd uit 1040. 123456
Box13 Nummer Box 13 geëxtraheerd uit 1040. 123456
Box14 Nummer Box 14 geëxtraheerd uit 1040. 123456
Box15 Nummer Box 15 geëxtraheerd uit 1040. 123456
Box16FromForm tekenreeks Waarde kan een van noSelection, 8814, 4972, andere of multiSelection zijn. 8814
Box16FromFormDetails object Object met details over box 16
Box16OtherFormNumber tekenreeks Vak 16 Ander formuliernummer geëxtraheerd uit 1040. 8888
Box16 Nummer Box 16 geëxtraheerd uit 1040. 123456
Box17 Nummer Box 17 geëxtraheerd uit 1040. 123456
Box18 Nummer Box 18 geëxtraheerd uit 1040. 123456
Box19 Nummer Box 19 geëxtraheerd uit 1040. 123456
Box20 Nummer Box 20 geëxtraheerd uit 1040. 123456
Box21 Nummer Box 21 geëxtraheerd uit 1040. 123456
Box22 Nummer Box 22 geëxtraheerd uit 1040. 123456
Box23 Nummer Box 23 geëxtraheerd uit 1040. 123456
Box24 Nummer Box 24 geëxtraheerd uit 1040. 123456
Box25a Nummer Box 25a geëxtraheerd uit 1040. 123456
Box25b Nummer Box 25b geëxtraheerd uit 1040. 123456
Box25c Nummer Box 25c geëxtraheerd uit 1040. 123456
Box25d Nummer Box 25d geëxtraheerd uit 1040. 123456
Box26 Nummer Box 26 geëxtraheerd uit 1040. 123456
Box27 Nummer Box 27 geëxtraheerd uit 1040. 123456
Box28 Nummer Box 28 geëxtraheerd uit 1040. 123456
Box29 Nummer Box 29 geëxtraheerd uit 1040. 123456
Box31 Nummer Box 31 geëxtraheerd uit 1040. 123456
Box32 Nummer Box 32 geëxtraheerd uit 1040. 123456
Box33 Nummer Box 33 geëxtraheerd uit 1040. 123456
Box34 Nummer Box 34 geëxtraheerd uit 1040. 123456
Box35Checkbox boolean Selectievakje 35 geëxtraheerd uit 1040. true
Box35a Nummer Box 35a geëxtraheerd uit 1040. 123456
Box35b Nummer Box 35b geëxtraheerd uit 1040. 123456
Box35c tekenreeks Waarde kan een van noSelection, controle, besparingen of multiSelection zijn. Controleren
Box35cDetails object Object met details over Box 35c
Box35d Nummer Box 35d geëxtraheerd uit 1040. 123456
Box36 Nummer Box 36 geëxtraheerd uit 1040. 123456
Box37 Nummer Box 37 geëxtraheerd uit 1040. 123456
Box38 Nummer Box 38 geëxtraheerd uit 1040. 123456
HasAssignedThirdPartyDesignee tekenreeks Waarde kan een van noSelection zijn, ja, nee of multiSelection. ja
HasAssignedThirdPartyDesigneeDetails object Object met informatie over wat is geselecteerd voor de toegewezen ontwerpinstelling van derden

De sleutel-waardeparen van belastingdocumenten en regelitems die zijn geëxtraheerd, bevinden zich in de documentResults sectie van de JSON-uitvoer.

Volgende stappen

  • Probeer uw eigen formulieren en documenten te verwerken met Document Intelligence Studio.

  • Voltooi een quickstart voor Document Intelligence en ga aan de slag met het maken van een app voor documentverwerking in de ontwikkeltaal van uw keuze.