Freigeben über


Dokument Intelligenz US-Steuerdokumentmodell

Wichtig

  • Public Preview-Releases von Dokument Intelligenz bieten frühzeitigen Zugriff auf Features, die sich in der aktiven Entwicklung befinden.
  • Features, Ansätze und Prozesse können sich aufgrund von Benutzerfeedback vor der allgemeinen Verfügbarkeit (General Availability, GA) ändern.
  • Die öffentliche Vorschauversion der Clientbibliotheken für Dokument-Intelligence ist standardmäßig die REST-API-Version 2024-02-29-preview.
  • Öffentliche Vorschauversion 2024-02-29-preview ist derzeit nur in den folgenden Azure-Regionen verfügbar:
  • USA, Osten
  • USA, Westen 2
  • Europa, Westen

Dieser Inhalt gilt für:Häkchenv4.0 (Vorschau) | Vorherige Versionen:Blaues Häkchenv3.1 (allgemein verfügbar)

Dieser Inhalt gilt für:Häkchenv3.1 (GA) | Aktuelle Version:Lila Häkchenv4.0 (Vorschau)

Das Dokument Intelligenz-Vertragsmodell nutzt leistungsstarke Funktionen zur optischen Zeichenerkennung (Optical Character Recognition, OCR), um Schlüsselfelder und Positionen aus ausgewählten Steuerdokumenten zu analysieren und zu extrahieren. Steuerdokumente können viele verschiedene Formate und Qualitätsmerkmale aufweisen (z. B. mit dem Smartphone aufgenommene Bilder, gescannte Dokumente und digitale PDF-Dateien). Die API analysiert den Dokumenttext, extrahiert Schlüsselinformationen wie Kundenname, Rechnungsadresse, Fälligkeitsdatum und fälliger Betrag und gibt eine strukturierte JSON-Datendarstellung zurück. Das Modell unterstützt derzeit bestimmte englische Steuerdokumentformate.

Unterstützte Dokumenttypen:

  • W-2
  • 1.098
  • 1098-E
  • 1098-T
  • 1099 und Variationen (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB​)
  • 1040 und Variationen (Zeitplan 1, Zeitplan 2, Zeitplan 3, Zeitplan 8812, Zeitplan A, Zeitplan B, Zeitplan C, Zeitplan D, Zeitplan E, Zeitplan EICF, Zeitplan H, Zeitplan J, Zeitplan R, Plan SE und Leitender Plan)

Automatisierte Verarbeitung von Steuerdokumenten

Bei der automatisierten Verarbeitung von Steuerdokumenten werden Schlüsselfelder aus Steuerdokumenten extrahiert. In der Vergangenheit wurden Steuerdokumente manuell verarbeitet. Dieses Modell ermöglicht die einfache Automatisierung von Steuerszenarien.

Entwicklungsoptionen

Dokument-Intelligence v4.0 (2023-10-31-preview) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature Ressourcen Modell-ID
US-Steuerformularmodelle Document Intelligence Studio
REST-API
C#SDK
SDK für Python
Java SDK
JavaScript SDK
• prebuilt-tax.us.W-2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T
• prebuilt-tax.us.1099A
• prebuilt-tax.us.1099B
• prebuilt-tax.us.1099C
• prebuilt-tax.us.1099CAP
• prebuilt-tax.us.1099DIV
• prebuilt-tax.us.1099G
• prebuilt-tax.us.1099H
• prebuilt-tax.us.1099INT
• prebuilt-tax.us.1099K
• prebuilt-tax.us.1099LS
• prebuilt-tax.us.1099LTC
• prebuilt-tax.us.1099MISC
• prebuilt-tax.us.1099NEC
• prebuilt-tax.us.1099OID
• prebuilt-tax.us.1099PATR
• prebuilt-tax.us.1099Q
• prebuilt-tax.us.1099QA
• prebuilt-tax.us.1099R
• prebuilt-tax.us.1099S
• prebuilt-tax.us.1099SA
• prebuilt-tax.us.1099SB
• prebuilt-tax.us.1040
• prebuilt-tax.us.1040Schedule1
• prebuilt-tax.us.1040Schedule2
• prebuilt-tax.us.1040Schedule3
• prebuilt-tax.us.1040Schedule8812
• prebuilt-tax.us.1040ScheduleA
• prebuilt-tax.us.1040ScheduleB
• prebuilt-tax.us.1040ScheduleC
• prebuilt-tax.us.1040ScheduleD
• prebuilt-tax.us.1040ScheduleE
• prebuilt-tax.us.1040ScheduleEIC
• prebuilt-tax.us.1040ScheduleF
• prebuilt-tax.us.1040ScheduleH
• prebuilt-tax.us.1040ScheduleJ
• prebuilt-tax.us.1040ScheduleR
• prebuilt-tax.us.1040ScheduleSE
• prebuilt-tax.us.1040Senior

Dokument-Intelligence v3.1 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature Ressourcen Modell-ID
US-Steuerformularmodelle Document Intelligence Studio
REST-API
C#SDK
SDK für Python
Java SDK
JavaScript SDK
• prebuilt-tax.us.W-2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

Dokument Intelligenz v3.0 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature Ressourcen Modell-ID
US-Steuerformularmodelle Document Intelligence Studio
REST-API
C#SDK
SDK für Python
Java SDK
JavaScript SDK
• prebuilt-tax.us.W-2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

Eingabeanforderungen

  • Die besten Ergebnisse erzielen Sie, wenn Sie pro Dokument ein deutliches Foto oder einen hochwertigen Scan bereitstellen.

  • Unterstützte Dateiformate:

    Modell PDF Bild:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) und HTML
    Lesen
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Allgemeines Dokument
    Vordefiniert
    Benutzerdefinierte Extraktion
    Benutzerdefinierte Klassifizierung ✔ (2024-02-29-preview)
  • In den Formaten PDF und TIFF können bis zu 2.000 Seiten verarbeitet werden (bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet).

  • Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für die kostenpflichtige (S0) und 4 MB für die kostenlose (F0) Stufe.

  • Die Bildgrößen müssen im Bereich zwischen 50 × 50 Pixel und 10.000 × 10.000 Pixel liegen.

  • Wenn Ihre PDFs kennwortgeschützt sind, müssen Sie die Sperre vor dem Senden entfernen.

  • Die Mindesthöhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 × 768 Pixel. Diese Abmessung entspricht etwa einem 8-Punkt-Text bei 150 Punkten pro Zoll (Dots per Inch, DPI).

  • Die maximale Anzahl Seiten für Trainingsdaten beträgt beim benutzerdefinierten Modelltraining 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neuronale Modell.

    • Für das Training des benutzerdefinierten Extraktionsmodells beträgt die Gesamtgröße der Trainingsdaten 50 MB für das Vorlagenmodell und 1G-MB für das neuronale Modell.

    • Für das Training des benutzerdefinierten Klassifizierungsmodells beträgt die Gesamtgröße der Trainingsdaten 1GB mit einem Maximum von 10 000 Seiten.

Testen der Datenextraktion bei Steuerdokumenten

Erfahren Sie, wie Daten, einschließlich Kundeninformationen, Herstellerdetails und Positionen, aus Rechnungen extrahiert werden. Sie benötigen die folgenden Ressourcen:

  • Ein Azure-Abonnement (Sie können ein kostenloses Abonnement erstellen).

  • Eine Dokument Intelligenz-Instanz im Azure-Portal. Sie können den kostenlosen Tarif (F0) verwenden, um den Dienst auszuprobieren. Wählen Sie nach der Bereitstellung Ihrer Ressource Zu Ressource wechseln aus, um Ihren Schlüssel und Endpunkt abzurufen.

Screenshot: Schlüssel und Endpunkt im Azure-Portal

Dokument Intelligenz Studio

  1. Wählen Sie auf der Startseite von Document Intelligence Studio das unterstützte Model für Steuerdokumente aus.

  2. Sie können ein Beispielsteuerdokument analysieren oder Ihre eigenen Dateien hochladen.

  3. Wählen Sie die Schaltfläche Analyse ausführen aus, und konfigurieren Sie bei Bedarf die Analyseoptionen :

    Screenshot der Schaltflächen „Analyse ausführen“ und „Analyseoptionen“ im Document Intelligence Studio.

Unterstützte Sprachen und Gebietsschemas

Eine vollständige Liste der unterstützten Sprachen finden Sie unter Sprachunterstützung - vordefinierte Modelle.

Feldextraktion W-2

Im Folgenden sind die Felder aufgeführt, die aus einem W-2-Steuerformular in der JSON-Ausgabeantwort extrahiert wurden.

Name Typ Beschreibung Beispielausgabe Abhängige Dateien
W-2FormVariant String IR W-2 Formularvariante. Dieses Feld kann einen der folgenden Werte aufweisen: W-2, W-2AS, W-2CM, W-2GU oder W-2VI. W-2
TaxYear Number Steuerjahr im Formular 2021
W2Copy String W-2-Steuerkopieversion zusammen mit gedruckten Anweisungen für diese Kopie Copy A – For Social Security Administration
Employee Objekt Objekt, das die Sozialversicherungsnummer, den Namen und die Adresse enthält
ControlNumber Zeichenfolge W-2-Kontrollnummer. IRS W-2 Feld d 0AB12 D345 7890
Employer Objekt Objekt, das die Identifikationsnummer des Arbeitgebers, den Namen und die Adresse enthält
WagesTipsAndOtherCompensation Anzahl Löhne, Trinkgelder und andere Kompensationsbeträge in US-Dollar. IRS W-2 Feld 1 1234567.89
FederalIncomeTaxWithheld Number Einbehaltener Betrag der Bundeseinkommensteuer in US-Dollar. IRS W-2 Feld 2 1234567.89
SocialSecurityWages Number Sozialversicherungspflichtige Einkünfte in US-Dollar. IRS W-2 Feld 3 1234567.89
SocialSecurityTaxWithheld Number Einbehaltene Sozialversicherungsabgaben in US-Dollar. IRS W-2 Feld 4 1234567.89
MedicareWagesAndTips Number Medicare-Löhne und Trinkgelder in US-Dollar. IRS W-2 Feld 5 1234567.89
MedicareTaxWithheld Number Einbehaltene Medicare-Steuer in US-Dollar. IRS W-2-Feld 6 1234567.89
SocialSecurityTips Number Sozialversicherungspflichtige Trinkgelder in US-Dollar. IRS W-2 Feld 7 1234567.89
AllocatedTips Number Zugeordnete Trinkgelder in US-Dollar. IRS W-2 Feld 8 1234567.89
VerificationCode Number W-2-Prüfcode. IRS W-2 Feld 9 1234567.89
DependentCareBenefits Number Höhe der Pflegeleistungen in US-Dollar. IRS W-2 Feld 10 1234567.89
NonQualifiedPlans Number Nicht qualifizierte Pläne in US-Dollar. IRS W-2 Feld 11 1234567.89
IsStatutoryEmployee String Teil von IRS W-2 Feld 13. Kann „true“ oder „false“ sein true
IsRetirementPlan String Teil von IRS W-2 Feld 13. Kann „true“ oder „false“ sein true
IsThirdPartySickPay String Teil von IRS W-2 Feld 13. Kann „true“ oder „false“ sein true
Other String Inhalt von IRS W-2-Feld 14 SICK LV WAGES SBJT TO $511/DAY LIMIT 1356
StateTaxInfos Array Informationen zu staatlichen Steuern. Inhalt von IRS W-2-Feld 15 bis 17
LocaleTaxInfos Array Informationen zu Kommunalsteuern. Inhalt von IRS W-2-Feld 18 bis 20

Feldextraktion 1098

Im Folgenden sind die Felder aufgeführt, die aus einem 1098-Steuerformular in der JSON-Ausgabeantwort extrahiert wurden. Die Formulare 1098-T und 1098-E werden ebenfalls unterstützt.

Name Typ Beschreibung Beispielausgabe
TaxYear Number Steuerjahr im Formular 2021
Borrower Object Objekt, das die TIN, den Namen, die Adresse und die Kontonummer der Kreditnehmer*innen enthält
Lender Object Objekt, das die TIN, den Namen, die Adresse und die Telefonnummer der Kreditgeber*innen enthält
MortgageInterest Anzahl Hypothekenzinsbetrag, der von den Kreditgebern/Kreditnehmern erhalten wurde (Feld 1) 1,234,567.89
OutstandingMortgagePrincipal Number Ausstehender Hypothekenbetrag (Feld 2) 1,234,567.89
MortgageOriginationDate Datum Vergabedatum der Hypothek (Feld 3) 2022-01-01
OverpaidInterestRefund Number Erstattungsbetrag für zu viel gezahlte Zinsen (Feld 4) 1,234,567.89
MortgageInsurancePremium Number Hypothekenversicherungsbeitrag (Feld 5) 1,234,567.89
PointsPaid Number Beim Erwerb des Hauptwohnsitzes bezahlte Zinspunkte (Feld 6) 1,234,567.89
IsPropertyAddressSameAsBorrower String Adresse des Grundstücks, das die Hypothek sichert. Adresse entspricht der Postanschrift der Kreditgeber*innen/Kreditnehmer*innen (Feld 7) true
PropertyAddress String Adresse oder Beschreibung des Grundstücks, das die Hypothek sichert (Feld 8) 123 Main St., Redmond WA 98052
MortgagedPropertiesCount Number Anzahl der mit einer Hypothek belasteten Grundstücke (Feld 9) 1
Andere String Zusätzliche Informationen, die den Zahler*innen gemeldet werden sollen (Feld 10)
RealEstateTax Number Grundsteuer (Feld 1) 1,234,567.89
AdditionalAssessment String Hinzugefügte Bewertungen für das Grundstück (Feld 10) 1,234,567.89
MortgageAcquisitionDate date Datum des Hypothekenerwerbs (Feld 11) 2022-01-01

Feldextraktion 1099-NEC

Im Folgenden sind die Felder aufgeführt, die aus einem 1099-nec-Steuerformular in der JSON-Ausgabeantwort extrahiert wurden. Die anderen Varianten von 1099 werden ebenfalls unterstützt.

Name Typ Beschreibung Beispielausgabe
TaxYear String Aus dem Formular 1099-NEC extrahiertes Steuerjahr. 2021
Payer Object Objekt, das die TIN, den Namen, die Adresse und die Telefonnummer der zahlenden Person enthält
Recipient Object Objekt, das die TIN, den Namen, die Adresse und die Kontonummer des Empfängers enthält
Box1 Zahl Box 1 aus Formular 1099-NEC extrahiert. 123456
Box2 boolean Box 2 aus Formular 1099-NEC extrahiert. true
Box4 Zahl Box 4 aus Formular 1099-NEC extrahiert. 123456
StateTaxesWithheld array Aus Formular 1099-NEC extrahierte Bundesstaatliche Steuern (Felder 5, 6 und 7)

Feldextraktion 1040 Steuerformular

Im Folgenden sind die Felder aufgeführt, die aus einem 1040-Steuerformular in der JSON-Ausgabeantwort extrahiert wurden. Die anderen Varianten von 1040 werden ebenfalls unterstützt.

Name Typ Beschreibung Beispielausgabe
TaxPayer Objekt Ein Objekt, das die Informationen des Steuerpflichtigen enthält, z. B. SSN, Nachname und Adresse
Spouse Objekt Ein Objekt, das die Informationen des Ehegatten enthält, z. B. SSN, Nachname und Vorname und InitialenName
Dependents array Ein Array, das eine Liste der Nachfolger enthält, einschließlich Informationen wie Name, SSN und Kredittyp
ThirdPartyDesignee Objekt Ein Objekt, das Informationen zum Design des Drittanbieters enthält
SignatureDetails Objekt Ein Objekt, das Informationen zum Signierer enthält, z. B. Telefonnummern und E-Mails
PaidPreparer Objekt Ein Objekt mit Informationen zum Fehler.
FillingStatus String Wert kann einer von noSelection, single, verheiratetFilingJointly, verheiratetFillingSeparately, headOfHousehold, qualifyingSurvivingSpouse oder multiSelection sein. single
FilingStatusDetails Objekt Ein Objekt, das Informationen zum Ablagestatus enthält.
NameOfSpouseOrQualifyingPerson String Name des Ehegatten oder der qualifizierenden Person aus Formular 1040. Johan Lorenz
PresidentialElectionCampaign String Der Wert kann eine von noSelection, Steuerzahler, Ehegatten oder MultiSelection sein. Steuerzahler
PresidentialElectionCampaignDetails Objekt Ein Objekt, das Details zur Präsidentschaftswahl enthält.
DigitalAssets String Der Wert kann eine von "noSelection", "ja", "no" oder "multiSelection" sein. ja
DigitalAssetsDetails Objekt Ein Objekt, das Details zu den digitalen Objekten enthält.
ClaimStatus String Der Wert kann eine von noSelection, taxpayerAsDependent, spouseAsDependent, spouseItemizesSeparatelyOrDualStatusAlien oder multiSelection sein. taxpayerAsDependent
ClaimStatusDetails Objekt Ein Objekt, das Details zum Anspruchsstatus enthält.
TaxpayerAgeBlindness String Der Wert kann eine von noSelection, above64, blind oder multiSelection sein. above64
TaxPayerAgeBlindnessDetails Objekt Ein Objekt, das Details zur Blindheit des Steuerzahleralters enthält.
SpouseAgeBlindness String Der Wert kann eine von noSelection, above64, blind oder multiSelection sein. above64
TaxPayerAgeBlindnessDetails Objekt Ein Objekt, das Details zur Blindheit des Ehegatten enthält.
MoreThanFourDependents boolean Aus Form 1040 extrahierte mehr als vier Abhängige. true
Box1a Zahl Box 1a extrahiert aus 1040. 123456
Basierend auf der bereitgestellten JSON-Struktur und konvertierung in das gleiche Tabellenformat wie angefordert, lautet das Ergebnis wie folgt:
Box1b Zahl Box 1b extrahiert aus 1040. 123456
Box1c Zahl Box 1c extrahiert aus 1040. 123456
Box1d Zahl Box 1d extrahiert aus 1040. 123456
Box1e Zahl Box 1e extrahiert aus 1040. 123456
Box1f Zahl Box 1f extrahiert aus 1040. 123456
Box1g Zahl Box 1g extrahiert aus 1040. 123456
Box1h Zahl Box 1h extrahiert aus 1040. 123456
Box1i Zahl Box 1i extrahiert aus 1040. 123456
Box1z Zahl Box 1z extrahiert aus 1040. 123456
Box2a Zahl Box 2a extrahiert aus 1040. 123456
Box2b Zahl Box 2b extrahiert aus 1040. 123456
Box3a Zahl Box 3a extrahiert aus 1040. 123456
Box3b Zahl Box 3b extrahiert aus 1040. 123456
Box4a Zahl Box 4a extrahiert aus 1040. 123456
Box4b Zahl Box 4b extrahiert aus 1040. 123456
Box5a Zahl Box 5a extrahiert aus 1040. 123456
Box5b Zahl Box 5b extrahiert aus 1040. 123456
Box6a Zahl Box 6a extrahiert aus 1040. 123456
Box6b Zahl Box 6b extrahiert aus 1040. 123456
Box6cCheckbox boolean Box 6c Kontrollkästchen aus 1040 extrahiert. true
Box7Checkbox boolean Box 7 Kontrollkästchen aus 1040 extrahiert. true
Box7 Zahl Box 7 extrahiert aus 1040. 123456
Box8 Zahl Box 8 extrahiert aus 1040. 123456
Box9 Zahl Box 9 extrahiert aus 1040. 123456
Box10 Zahl Box 10 extrahiert aus 1040. 123456
Box11 Zahl Box 11 extrahiert aus 1040. 123456
Box12 Zahl Box 12 extrahiert aus 1040. 123456
Box13 Zahl Box 13 extrahiert aus 1040. 123456
Box14 Zahl Box 14 extrahiert aus 1040. 123456
Box15 Zahl Box 15 extrahiert aus 1040. 123456
Box16FromForm Zeichenfolge Der Wert kann eine von „noSelection“, „8814“, „4972“, „andere“ oder „multiSelection“ sein. 8814
Box16FromFormDetails Objekt Objekt, das Details zu Box 16 enthält
Box16OtherFormNumber Zeichenfolge Feld 16 Sonstige Formularnummer aus 1040 extrahiert. 8888
Box16 Zahl Box 16 extrahiert aus 1040. 123456
Box17 Zahl Box 17 extrahiert aus 1040. 123456
Box18 Zahl Box 18 extrahiert aus 1040. 123456
Box19 Zahl Box 19 extrahiert aus 1040. 123456
Box20 Zahl Box 20 extrahiert aus 1040. 123456
Box21 Zahl Box 21 extrahiert aus 1040. 123456
Box22 Zahl Box 22 extrahiert aus 1040. 123456
Box23 Zahl Box 23 extrahiert aus 1040. 123456
Box24 Zahl Box 24 extrahiert aus 1040. 123456
Box25a Zahl Box 25a extrahiert aus 1040. 123456
Box25b Zahl Box 25b extrahiert aus 1040. 123456
Box25c Zahl Box 25c extrahiert aus 1040. 123456
Box25d Zahl Box 25d extrahiert aus 1040. 123456
Box26 Zahl Box 26 aus 1040 extrahiert. 123456
Box27 Zahl Box 27 extrahiert aus 1040. 123456
Box28 Zahl Box 28 extrahiert aus 1040. 123456
Box29 Zahl Box 29 extrahiert aus 1040. 123456
Box31 Zahl Box 31 extrahiert aus 1040. 123456
Box32 Zahl Box 32 extrahiert aus 1040. 123456
Box33 Zahl Box 33 extrahiert aus 1040. 123456
Box34 Zahl Box 34 extrahiert aus 1040. 123456
Box35Checkbox boolean Box 35 Kontrollkästchen aus 1040 extrahiert. true
Box35a Zahl Box 35a extrahiert aus 1040. 123456
Box35b Zahl Box 35b extrahiert aus 1040. 123456
Box35c Zeichenfolge Der Wert kann eine von „noSelection“, „Check“, „Savings“ oder „multiSelection“ sein. Überprüfen
Box35cDetails Objekt Objekt, das Details zu Box enthält 35c
Box35d Zahl Box 35d extrahiert aus 1040. 123456
Box36 Zahl Box 36 extrahiert aus 1040. 123456
Box37 Zahl Box 37 extrahiert aus 1040. 123456
Box38 Zahl Box 38 extrahiert aus 1040. 123456
HasAssignedThirdPartyDesignee Zeichenfolge Der Wert kann eine von "noSelection", "ja", "no" oder "multiSelection" sein. ja
HasAssignedThirdPartyDesigneeDetails Objekt Objekt, das Informationen darüber enthält, was für den zugewiesenen Drittanbieterentwurf ausgewählt wurde

Die extrahierten Schlüssel-Wert-Paare der Steuerdokumente und die Rechnungspositionen befinden sich im Abschnitt documentResults der JSON-Ausgabe.

Nächste Schritte