Condividi tramite


Modelli di documenti fiscali degli Stati Uniti di Informazioni sui documenti

Importante

  • Le versioni di anteprima pubblica di Informazioni sui documenti consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo.
  • Le funzionalità, gli approcci e i processi possono cambiare prima della disponibilità generale, a seconda del feedback degli utenti.
  • Per impostazione predefinita, la versione di anteprima pubblica delle librerie client di Informazioni sui documenti è la versione dell'API REST 2024-02-29-preview.
  • La versione di anteprima pubblica 2024-02-29-preview è attualmente disponibile solo nelle aree di Azure seguenti:
  • Stati Uniti orientali
  • Stati Uniti occidentali 2
  • Europa occidentale

Questo contenuto si applica a:segno di spunta v4.0 (anteprima) | Versioni precedenti: blue-checkmark v3.1 (disponibilità generale)

Questo contenuto si applica a: segno di spunta v3.1 (disponibilità generale) | Ultime versioni: segno di spunta viola v4.0 (anteprima)

Il modello di contratto di Informazioni sui documenti usa potenti funzionalità di riconoscimento ottico dei caratteri (OCR) per analizzare ed estrarre campi chiave e voci da un gruppo selezionato di documenti fiscali. I documenti fiscali possono essere di vari formati e qualità, tra cui immagini acquisite dal telefono, documenti digitalizzati e PDF digitali. L'API consente di analizzare il testo dei documenti, estrarre informazioni chiave, ad esempio nome cliente, indirizzo di fatturazione, scadenza e importo dovuto, e restituire una rappresentazione dei dati JSON strutturati. Il modello supporta attualmente determinati formati di documenti fiscali in inglese.

Tipi di documenti supportati:

  • W-2
  • 1098
  • 1098-E
  • 1098-T
  • 1099 e varianti (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB​)
  • 1040 e variazioni (Schedule 1, Schedule 2, Schedule 3, Schedule 8812, Schedule A, Schedule B, Schedule C, Schedule D, Schedule E, Schedule EIC, Schedule F, Schedule H, Schedule J, Schedule R, Schedule SE e Schedule Senior)

Elaborazione automatica dei documenti fiscali

L'elaborazione automatica dei documenti fiscali è il processo di estrazione dei campi chiave dai documenti fiscali. Storicamente, i documenti fiscali sono stati elaborati manualmente. Questo modello consente di automatizzare facilmente gli scenari fiscali.

Opzioni di sviluppo

Informazioni sui documenti v4.0 (2023-10-31-preview) supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modelli di modulo fiscale degli Stati Uniti Informazioni sui documenti Studio
API REST
SDK C#
SDK Python
SDK Java
SDK JavaScript
• precompilt-tax.us.W-2• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T
• prebuilt-tax.us.1099A
• prebuilt-tax.us.1099B
• precompilt-tax.us.1099C
• prebuilt-tax.us.1099CAP
• prebuilt-tax.us.1099DIV
• prebuilt-tax.us.1099G
• precompilt-tax.us.1099H
• prebuilt-tax.us.1099INT
• prebuilt-tax.us.1099K
• prebuilt-tax.us.1099LS
• precompilt-tax.us.1099LTC
• prebuilt-tax.us.1099MISC

prebuilt-tax.us.1099NEC• prebuilt-tax.us.1099OID
• precompilt-tax.us.1099PATR
• precompilt-tax.us.1099Q
• prebuilt-tax.us.1099QA
• precompilt-tax.us.1099R
• prebuilt-tax.us.1099S
• precompilt-tax.us 1099SA
• prebuilt-tax.us.1099SB
• prebuilt-tax.us.1040
• prebuilt-tax.us.1040Schedule1
• precompiltbuilt-tax.us.1040Schedule2
• prebuilt-tax.us.1040Schedule3
• prebuilt-tax.us.1040Schedule8812

prebuilt-tax.us.1040ScheduleA
• prebuilt-tax.us.1040ScheduleB
• prebuilt-tax.us.1040ScheduleC
• precompiltbuilt-tax.us.1040ScheduleD
• prebuilt-tax.us.1040ScheduleE
• prebuilt-tax.us.1040ScheduleEIC
• prebuilt-tax.us.1040ScheduleF
• prebuilt-tax.us.1040ScheduleH
• prebuilt-tax.us.1040ScheduleJ
• prebuilt-tax.us.1040ScheduleR
• prebuilt-tax.us.1040ScheduleSE
• prebuilt-tax.us.1040Senior

Informazioni sui documenti v3. 1 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modelli di modulo fiscale degli Stati Uniti Informazioni sui documenti Studio
API REST
SDK C#
SDK Python
SDK Java
SDK JavaScript
• precompilt-tax.us.W-2
• prebuilt-tax.us.1098
• precompilt-tax.us.1098E
• prebuilt-tax.us.1098T

Informazioni sui documenti v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:

Funzionalità Risorse Model ID
Modelli di modulo fiscale degli Stati Uniti Informazioni sui documenti Studio
API REST
SDK C#
SDK Python
SDK Java
SDK JavaScript
• precompilt-tax.us.W-2
• prebuilt-tax.us.1098
• precompilt-tax.us.1098E
• prebuilt-tax.us.1098T

Requisiti di input

  • Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.

  • Formati di file supportati:

    Modello PDF Immagine:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTML
    Lettura
    Layout ✔ (29-02-2024-anteprima, 31-10-2023-anteprima)
    Documento generale
    Predefinito
    Estrazione personalizzata
    Classificazione personalizzata ✔ (2024-02-29-anteprima)
  • Per i formati PDF e TIFF, possono essere elaborate fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).

  • La dimensione del file per l'analisi dei documenti è di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).

  • Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.

  • Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.

  • L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di 8 punti e 150 punti per pollice (DPI).

  • Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.

    • Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e 1G MB per il modello neurale.

    • Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono 1GB con un massimo di 10.000 pagine.

Provare l'estrazione dei dati dei documenti fiscali

Vedere in che modo i dati, incluse le informazioni sul cliente, i dettagli del fornitore e le voci, vengono estratti dalle fatture. Sono necessarie le risorse seguenti:

  • Sottoscrizione di Azure: è possibile crearne una gratuitamente.

  • Un'istanza di Informazioni sui documenti nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (F0). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per recuperare la chiave e l'endpoint.

Screenshot della posizione di chiavi ed endpoint nel portale di Azure.

Document Intelligence Studio

  1. Nella home page di Studio di Informazioni sui documenti, selezionare il modello di documento fiscale supportato.

  2. È possibile analizzare un documento fiscale di esempio o caricare i propri file.

  3. Selezionare il pulsante Esegui analisi e, se necessario, configurare Analizza opzioni:

    Screenshot del pulsanti Esegui analisi e Analizza opzioni in Informazioni sui documenti Studio.

Lingue e impostazioni locali supportate

Vedere la pagina Lingue supportate - modelli predefiniti per una lista completa delle lingue supportate.

Estrazione di campi W-2

Di seguito sono riportati i campi estratti da un modulo fiscale W-2 nella risposta di output JSON.

Nome Tipo Descrizione Output di esempio dipendenti
W-2FormVariant String Variante del modulo IR W-2. Questo campo può avere uno dei valori seguenti: W-2, W-2AS, W-2CM, W-2GU o W-2VI W-2
TaxYear Numero Anno fiscale modulo 2021
W2Copy String Versione della copia fiscale W-2 insieme all'istruzione stampata correlata a questa copia Copia A per la Previdenza sociale
Employee oggetto Oggetto contenente il numero di previdenza sociale, il nome e l'indirizzo
ControlNumber string Numero di controllo W-2. Campo IRS W-2 d 0AB12 D345 7890
Employer Object Oggetto contenente il numero di identificazione, il nome e l'indirizzo del datore di lavoro
WagesTipsAndOtherCompensation Numero Salari, mance e altri importi di compensazione in USD. Campo W-2 IRS 1 1234567.89
FederalIncomeTaxWithheld Numero Imposta sul reddito federale trattenuta in USD. Campo W-2 IRS 2 1234567.89
SocialSecurityWages Numero Importo dei salari per la previdenza sociale in USD. Campo IRS W-2 3 1234567.89
SocialSecurityTaxWithheld Numero Imposta sulla previdenza sociale trattenuta in USD. Campo IRS W-2 4 1234567.89
MedicareWagesAndTips Numero Salari e mance Medicare in USD. Campo W-2 IRS 5 1234567.89
MedicareTaxWithheld Numero Imposta su Medicare trattenuta in USD. Campo IRS W-2 6 1234567.89
SocialSecurityTips Numero Importo delle mance per la previdenza sociale in USD. Campo IRS W-2 7 1234567.89
AllocatedTips Numero Mance allocate in USD. Campo IRS W-2 8 1234567.89
VerificationCode Numero Codice di verifica W-2. Campo W-2 IRS 9 1234567.89
DependentCareBenefits Numero Importo dei benefici dell'assistenza dipendente in USD. Campo IRS W-2 10 1234567.89
NonQualifiedPlans Numero Importo dei piani non qualificati in USD. Campo IRS W-2 11 1234567.89
IsStatutoryEmployee String Parte del campo IRS W-2 13. Può essere True o False true
IsRetirementPlan String Parte del campo IRS W-2 13. Può essere True o False true
IsThirdPartySickPay String Parte del campo IRS W-2 13. Può essere True o False true
Other String Contenuto del campo IRS W-2 14 SALARI LV MALATI SBJT A $511/GIORNO LIMITE 1356
StateTaxInfos Matrice Informazioni relative alle imposte statali. contenuto del campo IRS W-2 da 15 a 17
LocaleTaxInfos Matrice Informazioni relative alle imposte locali. Contenuto del campo W-2 IRS da 18 a 20

Estrazione di campi 1098

Di seguito sono riportati i campi estratti da un modulo 1098 nella risposta di output JSON. Sono supportati anche i moduli 1098-T e 1098-E.

Nome Tipo Descrizione Output di esempio
TaxYear Numero Anno fiscale modulo 2021
Mutuatario Object Oggetto che contiene il TIN, il nome, l'indirizzo e l'accountNumber del debitore
Prestatore Object Oggetto che contiene il TIN, il nome, l'indirizzo e il telefono del prestatore
MortgageInterest Numero Importo degli interessi ipotecari ricevuti dai pagatori/debitori (casella 1) 1,234,567.89
OutstandingMortgagePrincipal Numero Capitale ipotecario in sospeso (casella 2) 1,234,567.89
MortgageOriginationDate Data Data di origine dell'ipoteca (casella 3) 2022-01-01
OverpaidInterestRefund Numero Importo del rimborso degli interessi pagati (casella 4) 1,234,567.89
MortgageInsurancePremium Numero Importo del premio assicurativo ipotecario (casella 5) 1,234,567.89
PointsPaid Numero Punti pagati all'acquisto di residenza principale (Box 6) 1,234,567.89
IsPropertyAddressSameAsBorrower String Indirizzo della proprietà che protegge il mutuo come l'indirizzo postale del debitore/debitore (casella 7) true
PropertyAddress String Indirizzo o descrizione della proprietà che protegge il mutuo (casella 8) 123 Main St., Redmond WA 98052
MortgagedPropertiesCount Numero Numero di immobili ipotecati (casella 9) 1
Altro String Informazioni aggiuntive da segnalare al pagamento (casella 10)
RealEstateTax Numero Imposta immobiliare (casella 1) 1,234,567.89
AdditionalAssessment String Aggiunte valutazioni effettuate sulla proprietà (casella 10) 1,234,567.89
MortgageAcquisitionDate data Data di acquisizione ipotecaria (casella 11) 2022-01-01

Estrazione campi 1099-NEC

Di seguito sono riportati i campi estratti da un modulo 1099 nella risposta di output JSON. Sono supportate anche le altre varianti del 1099.

Nome Tipo Descrizione Output di esempio
TaxYear String Anno fiscale estratto dal modulo 1099-NEC. 2021
Payer Object Oggetto che contiene il valore TIN, Nome, Indirizzo e Numero di telefono del pagatore
Recipient Object Oggetto contenente tin, nome, indirizzo e Numero di conto del destinatario
Box1 number Casella 1 estratta dal modulo 1099-NEC. 123456
Box2 boolean Casella 2 estratta dal modulo 1099-NEC. true
Box4 number Casella 4 estratta dal modulo 1099-NEC. 123456
StateTaxesWithheld array Imposte statali trattenute estratte dal modulo 1099-NEC (caselle 5, 6 e 7)

Modulo fiscale 1040 estrazione campi

Di seguito sono riportati i campi estratti da un modulo 1040 nella risposta di output JSON. Sono supportate anche le altre varianti di 1040.

Nome Tipo Descrizione Output di esempio
TaxPayer Object Oggetto che contiene le informazioni del contribuente, ad esempio SSN, Cognome e Indirizzo
Spouse Object Oggetto contenente le informazioni del coniuge, ad esempio SSN, cognome, nome e iniziali
Dependents array Matrice che contiene un elenco di dipendenti, incluse informazioni quali Nome, SSN e Tipo di credito
ThirdPartyDesignee oggetto Oggetto che contiene informazioni sull'oggetto di progettazione di terze parti
SignatureDetails oggetto Oggetto che contiene informazioni sull'accesso, ad esempio numeri di telefono e messaggi di posta elettronica
PaidPreparer oggetto Oggetto che contiene informazioni sul preparatore.
FillingStatus String Value può essere uno di noSelection, single, marriedFilingJointly, marriedFillingSeparately, headOfHousehold, qualifyingSurvivingSpouse o multiSelection. singolo
FilingStatusDetails oggetto Oggetto che contiene informazioni sullo stato di archiviazione.
NameOfSpouseOrQualifyingPerson String Nome del coniuge o persona idonea estratta dal modulo 1040. Giorgio Cavaglieri
PresidentialElectionCampaign String Il valore può essere uno di noSelection, contribuente, coniuge o multiSelection. Contribuente
PresidentialElectionCampaignDetails oggetto Oggetto che contiene informazioni dettagliate sulla campagna elettorale presidenziale.
DigitalAssets String Il valore può essere uno di noSelection, sì, no o multiSelection. yes
DigitalAssetsDetails oggetto Oggetto che contiene informazioni dettagliate sugli asset digitali.
ClaimStatus String Il valore può essere uno di noSelection, contribuentAsDependent, spouseAsDependent, spouseItemizesSeparatelyOrDualStatusAlien o multiSelection. taxpayerAsDependent
ClaimStatusDetails oggetto Oggetto che contiene informazioni dettagliate sullo stato dell'attestazione.
TaxpayerAgeBlindness String Il valore può essere uno dei valori noSelection, above64, blind o multiSelection. above64
TaxPayerAgeBlindnessDetails oggetto Oggetto che contiene informazioni dettagliate sulla cecità dell'età del contribuente.
SpouseAgeBlindness String Il valore può essere uno dei valori noSelection, above64, blind o multiSelection. above64
TaxPayerAgeBlindnessDetails oggetto Oggetto che contiene dettagli sull'età della cecità del coniuge.
MoreThanFourDependents boolean Più di quattro dipendenti estratti dal modulo 1040. true
Box1a number Scatola 1a estratta da 1040. 123456
In base alla struttura JSON fornita e alla conversione nello stesso formato di tabella richiesto, il risultato è il seguente:
Box1b number Scatola 1b estratta da 1040. 123456
Box1c number Scatola 1c estratta da 1040. 123456
Box1d number Scatola 1d estratta da 1040. 123456
Box1e number Scatola 1e estratta da 1040. 123456
Box1f number Scatola 1f estratta da 1040. 123456
Box1g number Scatola 1g estratta da 1040. 123456
Box1h number Scatola 1h estratta da 1040. 123456
Box1i number Scatola 1i estratta da 1040. 123456
Box1z number Scatola 1z estratta da 1040. 123456
Box2a number Scatola 2a estratta da 1040. 123456
Box2b number Scatola 2b estratta da 1040. 123456
Box3a number Scatola 3a estratta da 1040. 123456
Box3b number Scatola 3b estratta da 1040. 123456
Box4a number Scatola 4a estratta da 1040. 123456
Box4b number Scatola 4b estratta da 1040. 123456
Box5a number Scatola 5a estratta da 1040. 123456
Box5b number Scatola 5b estratta da 1040. 123456
Box6a number Scatola 6a estratta da 1040. 123456
Box6b number Scatola 6b estratta da 1040. 123456
Box6cCheckbox boolean Casella 6c di controllo Estratta da 1040. true
Box7Checkbox boolean Casella di controllo 7 estratta da 1040. true
Box7 number Casella 7 estratta da 1040. 123456
Box8 number Casella 8 estratta da 1040. 123456
Box9 number Casella 9 estratta da 1040. 123456
Box10 number Casella 10 estratta da 1040. 123456
Box11 number Casella 11 estratta da 1040. 123456
Box12 number Casella 12 estratta da 1040. 123456
Box13 number Casella 13 estratta da 1040. 123456
Box14 number Casella 14 estratta da 1040. 123456
Box15 number Casella 15 estratta da 1040. 123456
Box16FromForm string Il valore può essere uno di noSelection, 8814, 4972, altro o multiSelection. 8814
Box16FromFormDetails oggetto Oggetto che contiene informazioni dettagliate sulla Casella 16
Box16OtherFormNumber string Casella 16 Altro numero modulo estratto da 1040. 8888
Box16 number Casella 16 estratta da 1040. 123456
Box17 number Casella 17 estratta da 1040. 123456
Box18 number Casella 18 estratta da 1040. 123456
Box19 number Casella 19 estratta da 1040. 123456
Box20 number Casella 20 estratta da 1040. 123456
Box21 number Casella 21 estratta da 1040. 123456
Box22 number Casella 22 estratta da 1040. 123456
Box23 number Casella 23 estratta da 1040. 123456
Box24 number Casella 24 estratta da 1040. 123456
Box25a number Scatola 25a estratta da 1040. 123456
Box25b number Scatola 25b estratta da 1040. 123456
Box25c number Scatola 25c estratta da 1040. 123456
Box25d number Scatola 25d estratta da 1040. 123456
Box26 number Casella 26 estratta da 1040. 123456
Box27 number Casella 27 estratta da 1040. 123456
Box28 number Casella 28 estratta da 1040. 123456
Box29 number Casella 29 estratta da 1040. 123456
Box31 number Casella 31 estratta da 1040. 123456
Box32 number Casella 32 estratta da 1040. 123456
Box33 number Casella 33 estratta da 1040. 123456
Box34 number Casella 34 estratta da 1040. 123456
Box35Checkbox boolean Casella di controllo 35 estratta da 1040. true
Box35a number Scatola 35a estratta da 1040. 123456
Box35b number Scatola 35b estratta da 1040. 123456
Box35c string Il valore può essere uno di noSelection, il controllo, il risparmio o la selezione multipla. controllo
Box35cDetails oggetto Oggetto che contiene dettagli su Box 35c
Box35d number Scatola 35d estratta da 1040. 123456
Box36 number Casella 36 estratta da 1040. 123456
Box37 number Casella 37 estratta da 1040. 123456
Box38 number Casella 38 estratta da 1040. 123456
HasAssignedThirdPartyDesignee string Il valore può essere uno di noSelection, sì, no o multiSelection. yes
HasAssignedThirdPartyDesigneeDetails oggetto Oggetto che contiene informazioni su ciò che è stato selezionato per l'utente di progettazione di terze parti assegnato

Le coppie chiave-valore dei documenti fiscali e gli elementi di riga estratti si trovano nella sezione documentResults dell'output JSON.

Passaggi successivi