Modelli di documento fiscale degli Stati Uniti di Document Intelligence

Importante

  • Le versioni di anteprima pubblica di Document Intelligence consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo.
  • Le funzionalità, gli approcci e i processi possono cambiare, prima della disponibilità generale, in base al feedback degli utenti.
  • La versione di anteprima pubblica delle librerie client di Document Intelligence per impostazione predefinita è l'API REST versione 2024-02-29-preview.
  • L'anteprima pubblica versione 2024-02-29-preview è attualmente disponibile solo nelle aree di Azure seguenti:
  • Stati Uniti orientali
  • Stati Uniti occidentali2
  • Europa occidentale

Questo contenuto si applica a:segno di spuntav4.0 (anteprima) | Versioni precedenti:segno di spunta bluv3.1 (GA)

Questo contenuto si applica a:v3.1segno di spunta (GA) | Versione più recente:segno di spunta violav4.0 (anteprima)

Il modello di contratto document intelligence usa potenti funzionalità di riconoscimento ottico dei caratteri (OCR) per analizzare ed estrarre campi chiave ed elementi di riga da un gruppo selezionato di documenti fiscali. I documenti fiscali possono essere di vari formati e qualità, tra cui immagini acquisite dal telefono, documenti digitalizzati e PDF digitali. L'API analizza il testo del documento; estrae le informazioni chiave, ad esempio il nome del cliente, l'indirizzo di fatturazione, la data di scadenza e l'importo dovuto; e restituisce una rappresentazione di dati JSON strutturata. Il modello supporta attualmente determinati formati di documento fiscale in inglese.

Tipi di documento supportati:

  • W-2
  • 1098
  • 1098-E
  • 1098-T
  • 1099 e varianti (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB)
  • 1040 e variazioni (Schedule 1, Schedule 2, Schedule 3, Schedule 8812, Schedule A, Schedule B, Schedule C, Schedule D, Schedule E, EICSchedule F, Schedule H, Schedule J, Schedule R, Schedule R, Schedule edizione Standard e Schedule Senior)

Elaborazione automatica dei documenti fiscali

L'elaborazione automatica dei documenti fiscali è il processo di estrazione dei campi chiave dai documenti fiscali. Storicamente, i documenti fiscali sono stati elaborati manualmente. Questo modello consente di automatizzare facilmente gli scenari fiscali.

Opzioni di sviluppo

Document Intelligence v4.0 (2023-10-31-preview) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modelli di modulo fiscale degli Stati Uniti Document Intelligence Studio
• API
REST•
C# SDK
Python SDK
Java SDK
JavaScript SDK
• precompilt-tax.us.W-2• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T
• prebuilt-tax.us.1099A
• prebuilt-tax.us.1099B
• precompilt-tax.us.1099C
• prebuilt-tax.us.1099CAP
• prebuilt-tax.us.1099DIV
• prebuilt-tax.us.1099G
• precompilt-tax.us.1099H
• prebuilt-tax.us.1099INT
• prebuilt-tax.us.1099K
• prebuilt-tax.us.1099LS
• precompilt-tax.us.1099LTC
• prebuilt-tax.us.1099MISC

prebuilt-tax.us.1099NEC• prebuilt-tax.us.1099OID
• precompilt-tax.us.1099PATR
• precompilt-tax.us.1099Q
• prebuilt-tax.us.1099QA
• precompilt-tax.us.1099R
• prebuilt-tax.us.1099S
• precompilt-tax.us 1099SA
• prebuilt-tax.us.1099SB
• prebuilt-tax.us.1040
• prebuilt-tax.us.1040Schedule1
• precompiltbuilt-tax.us.1040Schedule2
• prebuilt-tax.us.1040Schedule3
• prebuilt-tax.us.1040Schedule8812

prebuilt-tax.us.1040ScheduleA• prebuilt-tax.us.1040ScheduleB
• prebuilt-tax.us.1040ScheduleC
• prebuilt-tax.us.1040ScheduleD
• prebuilt-tax.us.1040ScheduleE
• prebuilt-tax.us.1040ScheduleEIC
• prebuilt-tax.us.1040ScheduleF
• prebuilt-tax.us.1040ScheduleH
• prebuilt-tax.us.1040ScheduleJ
• prebuilt-tax.us.1040ScheduleR
• prebuilt-tax.us.1040Schedule edizione Standard

prebuilt-tax.us.1040Senior

Document Intelligence v3.1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modelli di modulo fiscale degli Stati Uniti Document Intelligence Studio
• API
REST•
C# SDK
Python SDK
Java SDK
JavaScript SDK
• precompilt-tax.us.W-2
• prebuilt-tax.us.1098
• precompilt-tax.us.1098E
• prebuilt-tax.us.1098T

Document Intelligence v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modelli di modulo fiscale degli Stati Uniti Document Intelligence Studio
• API
REST•
C# SDK
Python SDK
Java SDK
JavaScript SDK
• precompilt-tax.us.W-2
• prebuilt-tax.us.1098
• precompilt-tax.us.1098E
• prebuilt-tax.us.1098T

Requisiti di input

  • Per ottenere risultati ottimali, fornire una foto chiara o un'analisi di alta qualità per ogni documento.

  • Formati di file supportati:

    Modello PDF Immagine:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
    Lettura
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Documento generale
    Predefinito
    Estrazione personalizzata
    Classificazione personalizzata ✔ (2024-02-29-preview)
  • Per PDF e TIFF, è possibile elaborare fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).

  • Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).

  • Le dimensioni dell'immagine devono essere comprese tra 50 x 50 pixel e 10.000 px x 10.000 pixel.

  • Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.

  • L'altezza minima del testo da estrarre è di 12 pixel per un'immagine da 1024 x 768 pixel. Questa dimensione corrisponde a circa 8-point text a 150 punti per pollice (DPI).

  • Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello di modello personalizzato e 50.000 per il modello neurale personalizzato.

    • Per il training del modello di estrazione personalizzato, le dimensioni totali dei dati di training sono di 50 MB per il modello di modello e 1G-MB per il modello neurale.

    • Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono 1GB pari a un massimo di 10.000 pagine.

Provare l'estrazione dei dati dei documenti fiscali

Vedere in che modo i dati, incluse le informazioni sui clienti, i dettagli del fornitore e le voci, vengono estratti dalle fatture. Sono necessarie le risorse seguenti:

  • Una sottoscrizione di Azure: è possibile crearne una gratuitamente.

  • Istanza di Document Intelligence nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (F0). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per ottenere la chiave e l'endpoint.

Screenshot delle chiavi e della posizione dell'endpoint nella portale di Azure.

Document Intelligence Studio

  1. Nella home page di Document Intelligence Studio selezionare il modello di documento fiscale supportato.

  2. È possibile analizzare un documento fiscale di esempio o caricare i propri file.

  3. Selezionare il pulsante Esegui analisi e, se necessario, configurare le opzioni Analizza :

    Screenshot dei pulsanti Esegui analisi e Analizza opzioni in Document Intelligence Studio.

Lingue e impostazioni locali supportate

Per un elenco completo delle lingue supportate, vedere la pagina Dei modelli predefiniti.

Estrazione di campi W-2

Di seguito sono riportati i campi estratti da un modulo fiscale W-2 nella risposta di output JSON.

Nome Tipo Descrizione Output di esempio Dipendenti
W-2FormVariant String Variante del modulo ir W-2. Questo campo può avere uno dei valori seguenti: W-2, W-2AS, W-2CM, W-2GUo W-2VI W-2
TaxYear Numero Anno fiscale modulo 2021
W2Copy String Versione della copia fiscale W-2 insieme all'istruzione stampata correlata a questa copia Copia A- Per Amministrazione istration previdenza sociale
Employee oggetto Oggetto contenente il numero di previdenza sociale, il nome e l'indirizzo
ControlNumber string Numero di controllo W-2. Campo IRS W-2 d 0AB12 D345 7890
Employer Object Oggetto contenente il numero di identificazione, il nome e l'indirizzo del datore di lavoro
WagesTipsAndOtherCompensation Numero Salari, mance e altri importi di compensazione in USD. Campo W-2 IRS 1 1234567.89
FederalIncomeTaxWithheld Numero Imposta sul reddito federale trattenuta in USD. Campo W-2 IRS 2 1234567.89
SocialSecurityWages Numero Importo dei salari per la previdenza sociale in USD. Campo IRS W-2 3 1234567.89
SocialSecurityTaxWithheld Numero Imposta sulla previdenza sociale trattenuta in USD. Campo IRS W-2 4 1234567.89
MedicareWagesAndTips Numero Medicare salari e mance in USD. Campo W-2 IRS 5 1234567.89
MedicareTaxWithheld Numero Importo trattenuto fiscale medicare in USD. Campo IRS W-2 6 1234567.89
SocialSecurityTips Numero Importo dei suggerimenti per la previdenza sociale in USD. Campo IRS W-2 7 1234567.89
AllocatedTips Numero Suggerimenti allocati in USD. Campo IRS W-2 8 1234567.89
VerificationCode Numero Codice di verifica W-2. Campo W-2 IRS 9 1234567.89
DependentCareBenefits Numero Importo dei benefici dell'assistenza dipendente in USD. Campo IRS W-2 10 1234567.89
NonQualifiedPlans Numero Importo dei piani non qualificati in USD. Campo IRS W-2 11 1234567.89
IsStatutoryEmployee String Parte del campo IRS W-2 13. Può essere true o false true
IsRetirementPlan String Parte del campo IRS W-2 13. Può essere true o false true
IsThirdPartySickPay String Parte del campo IRS W-2 13. Può essere true o false true
Other String Contenuto del campo IRS W-2 14 SALARI LV MALATI SBJT A $511/GIORNO LIMITE 1356
StateTaxInfos Matrice Informazioni relative alle imposte statali. contenuto del campo IRS W-2 da 15 a 17
LocaleTaxInfos Matrice Informazioni relative alle imposte locali. Contenuto del campo W-2 IRS da 18 a 20

Estrazione campi 1098

Di seguito sono riportati i campi estratti da un modulo fiscale 1098 nella risposta di output JSON. Sono supportati anche i moduli 1098-T e 1098-E.

Nome Tipo Descrizione Output di esempio
TaxYear Numero Anno fiscale modulo 2021
Mutuatario Object Oggetto che contiene il tin, il nome, l'indirizzo e l'accountNumber del mutuatario
Prestatore Object Oggetto che contiene il tin, il nome, l'indirizzo e il telefono del lender
MutuoInterest Numero Importo degli interessi ipotecari ricevuti dai pagatori/mutuatari (casella 1) 1,234,567.89
OutstandingMortgagePrincipal Numero Capitale ipotecario in sospeso (casella 2) 1,234,567.89
MortgageOriginationDate Data Data di origine dell'ipoteca (casella 3) 2022-01-01
OverpaidInterestRefund Numero Importo del rimborso degli interessi pagati (casella 4) 1,234,567.89
MortgageInsurancePremium Numero Importo del premio assicurativo ipotecario (casella 5) 1,234,567.89
Punti pagati Numero Punti pagati all'acquisto di residenza principale (Box 6) 1,234,567.89
IsPropertyAddressSameAsBorrower String Indirizzo della proprietà che protegge il mutuo come l'indirizzo postale del debitore /mutuatario (casella 7) true
PropertyAddress String Indirizzo o descrizione della proprietà che protegge il mutuo (casella 8) 123 Main St., Redmond WA 98052
MortgagedPropertiesCount Numero Numero di immobili ipotecati (casella 9) 1
Altro String Informazioni aggiuntive da segnalare al pagamento (casella 10)
RealEstateTax Numero Imposta immobiliare (casella 1) 1,234,567.89
AdditionalAssessment String Aggiunte valutazioni effettuate sulla proprietà (casella 10) 1,234,567.89
MortgageAcquisitionDate data Data di acquisizione ipotecaria (casella 11) 2022-01-01

Estrazione campi 1099-NEC

Di seguito sono riportati i campi estratti da un modulo fiscale 1099-nec nella risposta di output JSON. Sono supportate anche le altre varianti del 1099.

Nome Tipo Descrizione Output di esempio
TaxYear String Anno fiscale estratto dal modulo 1099-NEC. 2021
Payer Object Oggetto contenente tin, nome, indirizzo e Telefono Number del payer
Recipient Object Oggetto contenente tin, nome, indirizzo e AccountNumber del destinatario
Box1 number Casella 1 estratta dal modulo 1099-NEC. 123456
Box2 boolean Casella 2 estratta dal modulo 1099-NEC. true
Box4 number Casella 4 estratta dal modulo 1099-NEC. 123456
StateTaxesWithheld array Imposte statali trattenute estratte dal modulo 1099-NEC (caselle 5, 6 e 7)

Modulo fiscale 1040 estrazione campi

Di seguito sono riportati i campi estratti da un modulo fiscale 1040 nella risposta di output JSON. Sono supportate anche le altre varianti di 1040.

Nome Tipo Descrizione Output di esempio
TaxPayer Object Oggetto che contiene le informazioni del contribuente, ad esempio SSN, Cognome e Indirizzo
Spouse Object Oggetto contenente le informazioni del coniuge, ad esempio SSN, cognome e nome e nome e nome
Dependents array Matrice che contiene un elenco di dipendenti, incluse informazioni quali Nome, SSN e Tipo di credito
ThirdPartyDesignee oggetto Oggetto che contiene informazioni sull'oggetto di progettazione di terze parti
SignatureDetails oggetto Oggetto che contiene informazioni sull'accesso, ad esempio numeri di telefono e messaggi di posta elettronica
PaidPreparer oggetto Oggetto che contiene informazioni sul preparatore.
FillingStatus String Value può essere uno di noSelection, single, marriedFilingJointly, marriedFillingSeparately, headOfHousehold, qualifyingSurvivingSpouse o multiSelection. singolo
FilingStatusDetails oggetto Oggetto che contiene informazioni sullo stato di archiviazione.
NameOfSpouseOrQualifyingPerson String Nome del coniuge o persona idonea estratta dal modulo 1040. Giorgio Cavaglieri
PresidentialElectionCampaign String Il valore può essere uno di noSelection, contribuente, coniuge o multiSelection. Contribuente
PresidentialElectionCampaignDetails oggetto Oggetto che contiene informazioni dettagliate sulla campagna elettorale presidenziale.
DigitalAssets String Il valore può essere uno di noSelection, sì, no o multiSelection. yes
DigitalAssetsDetails oggetto Oggetto che contiene informazioni dettagliate sugli asset digitali.
ClaimStatus String Il valore può essere uno di noSelection, contribuentAsDependent, spouseAsDependent, spouseItemizesSeparatelyOrDualStatusAlien o multiSelection. contribuenteAsDependent
ClaimStatusDetails oggetto Oggetto che contiene informazioni dettagliate sullo stato dell'attestazione.
TaxpayerAgeBlindness String Il valore può essere uno dei valori noSelection, above64, blind o multiSelection. sopra64
TaxPayerAgeBlindnessDetails oggetto Oggetto che contiene informazioni dettagliate sulla cecità dell'età del contribuente.
SpouseAgeBlindness String Il valore può essere uno dei valori noSelection, above64, blind o multiSelection. sopra64
TaxPayerAgeBlindnessDetails oggetto Oggetto che contiene dettagli sulla cecità dell'età del coniuge.
MoreThanFourDependents boolean Più di quattro dipendenti estratti dal modulo 1040. true
Box1a number Scatola 1a estratta da 1040. 123456
In base alla struttura JSON fornita e alla conversione nello stesso formato di tabella richiesto, il risultato è il seguente:
Box1b number Scatola 1b estratta da 1040. 123456
Box1c number Scatola 1c estratta da 1040. 123456
Box1d number Scatola 1d estratta da 1040. 123456
Box1e number Scatola 1e estratta da 1040. 123456
Box1f number Scatola 1f estratta da 1040. 123456
Box1g number Scatola 1g estratta da 1040. 123456
Box1h number Scatola 1h estratta da 1040. 123456
Box1i number Scatola 1i estratta da 1040. 123456
Box1z number Scatola 1z estratta da 1040. 123456
Box2a number Scatola 2a estratta da 1040. 123456
Box2b number Scatola 2b estratta da 1040. 123456
Box3a number Scatola 3a estratta da 1040. 123456
Box3b number Scatola 3b estratta da 1040. 123456
Box4a number Scatola 4a estratta da 1040. 123456
Box4b number Scatola 4b estratta da 1040. 123456
Box5a number Scatola 5a estratta da 1040. 123456
Box5b number Scatola 5b estratta da 1040. 123456
Box6a number Scatola 6a estratta da 1040. 123456
Box6b number Scatola 6b estratta da 1040. 123456
Box6cCheckbox boolean Casella 6c di controllo Estratta da 1040. true
Box7Checkbox boolean Casella di controllo 7 estratta da 1040. true
Box7 number Casella 7 estratta da 1040. 123456
Box8 number Casella 8 estratta da 1040. 123456
Box9 number Casella 9 estratta da 1040. 123456
Box10 number Casella 10 estratta da 1040. 123456
Box11 number Casella 11 estratta da 1040. 123456
Box12 number Casella 12 estratta da 1040. 123456
Box13 number Casella 13 estratta da 1040. 123456
Box14 number Casella 14 estratta da 1040. 123456
Box15 number Casella 15 estratta da 1040. 123456
Box16FromForm string Il valore può essere uno di noSelection, 8814, 4972, altro o multiSelection. 8814
Box16FromFormDetails oggetto Oggetto che contiene informazioni dettagliate sulla Casella 16
Box16OtherFormNumber string Casella 16 Altro numero modulo estratto da 1040. 8888
Box16 number Casella 16 estratta da 1040. 123456
Box17 number Casella 17 estratta da 1040. 123456
Box18 number Casella 18 estratta da 1040. 123456
Box19 number Casella 19 estratta da 1040. 123456
Box20 number Casella 20 estratta da 1040. 123456
Box21 number Casella 21 estratta da 1040. 123456
Box22 number Casella 22 estratta da 1040. 123456
Box23 number Casella 23 estratta da 1040. 123456
Box24 number Casella 24 estratta da 1040. 123456
Box25a number Scatola 25a estratta da 1040. 123456
Box25b number Scatola 25b estratta da 1040. 123456
Box25c number Scatola 25c estratta da 1040. 123456
Box25d number Scatola 25d estratta da 1040. 123456
Box26 number Casella 26 estratta da 1040. 123456
Box27 number Casella 27 estratta da 1040. 123456
Box28 number Casella 28 estratta da 1040. 123456
Box29 number Casella 29 estratta da 1040. 123456
Box31 number Casella 31 estratta da 1040. 123456
Box32 number Casella 32 estratta da 1040. 123456
Box33 number Casella 33 estratta da 1040. 123456
Box34 number Casella 34 estratta da 1040. 123456
Box35Checkbox boolean Casella di controllo 35 estratta da 1040. true
Box35a number Scatola 35a estratta da 1040. 123456
Box35b number Scatola 35b estratta da 1040. 123456
Box35c string Il valore può essere uno di noSelection, il controllo, il risparmio o la selezione multipla. controllo
Box35cDetails oggetto Oggetto che contiene dettagli su Box 35c
Box35d number Scatola 35d estratta da 1040. 123456
Box36 number Casella 36 estratta da 1040. 123456
Box37 number Casella 37 estratta da 1040. 123456
Box38 number Casella 38 estratta da 1040. 123456
HasAssignedThirdPartyDesignee string Il valore può essere uno di noSelection, sì, no o multiSelection. yes
HasAssignedThirdPartyDesigneeDetails oggetto Oggetto che contiene informazioni su ciò che è stato selezionato per l'utente di progettazione di terze parti assegnato

Le coppie chiave-valore dei documenti fiscali e gli elementi di riga estratti si trovano nella documentResults sezione dell'output JSON.

Passaggi successivi

  • Provare a elaborare moduli e documenti personalizzati con Document Intelligence Studio.

  • Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.