Modelli di documenti fiscali degli Stati Uniti di Informazioni sui documenti
Importante
- Le versioni di anteprima pubblica di Informazioni sui documenti consentono l'accesso anticipato alle funzionalità in fase di sviluppo attivo.
- Le funzionalità, gli approcci e i processi possono cambiare prima della disponibilità generale, a seconda del feedback degli utenti.
- Per impostazione predefinita, la versione di anteprima pubblica delle librerie client di Informazioni sui documenti è la versione dell'API REST 2024-02-29-preview.
- La versione di anteprima pubblica 2024-02-29-preview è attualmente disponibile solo nelle aree di Azure seguenti:
- Stati Uniti orientali
- Stati Uniti occidentali 2
- Europa occidentale
Questo contenuto si applica a: v4.0 (anteprima) | Versioni precedenti:
v3.1 (disponibilità generale)
Questo contenuto si applica a: v3.1 (disponibilità generale) | Ultime versioni:
v4.0 (anteprima)
Il modello di contratto di Informazioni sui documenti usa potenti funzionalità di riconoscimento ottico dei caratteri (OCR) per analizzare ed estrarre campi chiave e voci da un gruppo selezionato di documenti fiscali. I documenti fiscali possono essere di vari formati e qualità, tra cui immagini acquisite dal telefono, documenti digitalizzati e PDF digitali. L'API consente di analizzare il testo dei documenti, estrarre informazioni chiave, ad esempio nome cliente, indirizzo di fatturazione, scadenza e importo dovuto, e restituire una rappresentazione dei dati JSON strutturati. Il modello supporta attualmente determinati formati di documenti fiscali in inglese.
Tipi di documenti supportati:
- W-2
- 1098
- 1098-E
- 1098-T
- 1099 e varianti (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB)
- 1040 e variazioni (Schedule 1, Schedule 2, Schedule 3, Schedule 8812, Schedule A, Schedule B, Schedule C, Schedule D, Schedule E, Schedule
EIC
, Schedule F, Schedule H, Schedule J, Schedule R, Schedule SE e Schedule Senior)
Elaborazione automatica dei documenti fiscali
L'elaborazione automatica dei documenti fiscali è il processo di estrazione dei campi chiave dai documenti fiscali. Storicamente, i documenti fiscali sono stati elaborati manualmente. Questo modello consente di automatizzare facilmente gli scenari fiscali.
Opzioni di sviluppo
Informazioni sui documenti v4.0 (2023-10-31-preview) supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modelli di modulo fiscale degli Stati Uniti | • Informazioni sui documenti Studio • API REST • SDK C# • SDK Python • SDK Java • SDK JavaScript |
• precompilt-tax.us.W-2• prebuilt-tax.us.1098 • prebuilt-tax.us.1098E • prebuilt-tax.us.1098T • prebuilt-tax.us.1099A • prebuilt-tax.us.1099B • precompilt-tax.us.1099C • prebuilt-tax.us.1099CAP • prebuilt-tax.us.1099DIV • prebuilt-tax.us.1099G • precompilt-tax.us.1099H • prebuilt-tax.us.1099INT • prebuilt-tax.us.1099K • prebuilt-tax.us.1099LS • precompilt-tax.us.1099LTC • prebuilt-tax.us.1099MISC • prebuilt-tax.us.1099NEC• prebuilt-tax.us.1099OID • precompilt-tax.us.1099PATR • precompilt-tax.us.1099Q • prebuilt-tax.us.1099QA • precompilt-tax.us.1099R • prebuilt-tax.us.1099S • precompilt-tax.us 1099SA • prebuilt-tax.us.1099SB • prebuilt-tax.us.1040 • prebuilt-tax.us.1040Schedule1 • precompiltbuilt-tax.us.1040Schedule2 • prebuilt-tax.us.1040Schedule3 • prebuilt-tax.us.1040Schedule8812 • prebuilt-tax.us.1040ScheduleA • prebuilt-tax.us.1040ScheduleB • prebuilt-tax.us.1040ScheduleC • precompiltbuilt-tax.us.1040ScheduleD • prebuilt-tax.us.1040ScheduleE • prebuilt-tax.us.1040ScheduleEIC • prebuilt-tax.us.1040ScheduleF • prebuilt-tax.us.1040ScheduleH • prebuilt-tax.us.1040ScheduleJ • prebuilt-tax.us.1040ScheduleR • prebuilt-tax.us.1040ScheduleSE • prebuilt-tax.us.1040Senior |
Informazioni sui documenti v3. 1 supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modelli di modulo fiscale degli Stati Uniti | • Informazioni sui documenti Studio • API REST • SDK C# • SDK Python • SDK Java • SDK JavaScript |
• precompilt-tax.us.W-2 • prebuilt-tax.us.1098 • precompilt-tax.us.1098E • prebuilt-tax.us.1098T |
Informazioni sui documenti v3.0 supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modelli di modulo fiscale degli Stati Uniti | • Informazioni sui documenti Studio • API REST • SDK C# • SDK Python • SDK Java • SDK JavaScript |
• precompilt-tax.us.W-2 • prebuilt-tax.us.1098 • precompilt-tax.us.1098E • prebuilt-tax.us.1098T |
Requisiti di input
Per risultati ottimali, fornire una foto chiara o una scansione di alta qualità per ogni documento.
Formati di file supportati:
Modello PDF Immagine:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTMLLettura ✔ ✔ ✔ Layout ✔ ✔ ✔ (29-02-2024-anteprima, 31-10-2023-anteprima) Documento generale ✔ ✔ Predefinito ✔ ✔ Estrazione personalizzata ✔ ✔ Classificazione personalizzata ✔ ✔ ✔ (2024-02-29-anteprima) Per i formati PDF e TIFF, possono essere elaborate fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).
La dimensione del file per l'analisi dei documenti è di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
Per le immagini, le dimensioni devono essere comprese tra 50 x 50 pixel e 10.000 x 10.000 pixel.
Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
L'altezza minima del testo da estrarre è di 12 pixel per un'immagine 1024 x 768 pixel. Queste dimensioni corrispondono approssimativamente a un testo con dimensioni di
8
punti e 150 punti per pollice (DPI).Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello personalizzato e 50.000 per il modello neurale personalizzato.
Per il training di modelli di estrazione personalizzati, le dimensioni totali dei dati di training sono di 50 MB per il modello e 1G MB per il modello neurale.
Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono
1GB
con un massimo di 10.000 pagine.
Provare l'estrazione dei dati dei documenti fiscali
Vedere in che modo i dati, incluse le informazioni sul cliente, i dettagli del fornitore e le voci, vengono estratti dalle fatture. Sono necessarie le risorse seguenti:
Sottoscrizione di Azure: è possibile crearne una gratuitamente.
Un'istanza di Informazioni sui documenti nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (
F0
). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per recuperare la chiave e l'endpoint.
Document Intelligence Studio
Nella home page di Studio di Informazioni sui documenti, selezionare il modello di documento fiscale supportato.
È possibile analizzare un documento fiscale di esempio o caricare i propri file.
Selezionare il pulsante Esegui analisi e, se necessario, configurare Analizza opzioni:
Lingue e impostazioni locali supportate
Vedere la pagina Lingue supportate - modelli predefiniti per una lista completa delle lingue supportate.
Estrazione di campi W-2
Di seguito sono riportati i campi estratti da un modulo fiscale W-2 nella risposta di output JSON.
Nome | Tipo | Descrizione | Output di esempio | dipendenti |
---|---|---|---|---|
W-2FormVariant |
String | Variante del modulo IR W-2. Questo campo può avere uno dei valori seguenti: W-2 , W-2AS , W-2CM , W-2GU o W-2VI |
W-2 | |
TaxYear |
Numero | Anno fiscale modulo | 2021 | |
W2Copy |
String | Versione della copia fiscale W-2 insieme all'istruzione stampata correlata a questa copia | Copia A per la Previdenza sociale | |
Employee |
oggetto | Oggetto contenente il numero di previdenza sociale, il nome e l'indirizzo | ||
ControlNumber |
string | Numero di controllo W-2. Campo IRS W-2 d | 0AB12 D345 7890 | |
Employer |
Object | Oggetto contenente il numero di identificazione, il nome e l'indirizzo del datore di lavoro | ||
WagesTipsAndOtherCompensation |
Numero | Salari, mance e altri importi di compensazione in USD. Campo W-2 IRS 1 | 1234567.89 | |
FederalIncomeTaxWithheld |
Numero | Imposta sul reddito federale trattenuta in USD. Campo W-2 IRS 2 | 1234567.89 | |
SocialSecurityWages |
Numero | Importo dei salari per la previdenza sociale in USD. Campo IRS W-2 3 | 1234567.89 | |
SocialSecurityTaxWithheld |
Numero | Imposta sulla previdenza sociale trattenuta in USD. Campo IRS W-2 4 | 1234567.89 | |
MedicareWagesAndTips |
Numero | Salari e mance Medicare in USD. Campo W-2 IRS 5 | 1234567.89 | |
MedicareTaxWithheld |
Numero | Imposta su Medicare trattenuta in USD. Campo IRS W-2 6 | 1234567.89 | |
SocialSecurityTips |
Numero | Importo delle mance per la previdenza sociale in USD. Campo IRS W-2 7 | 1234567.89 | |
AllocatedTips |
Numero | Mance allocate in USD. Campo IRS W-2 8 | 1234567.89 | |
VerificationCode |
Numero | Codice di verifica W-2. Campo W-2 IRS 9 | 1234567.89 | |
DependentCareBenefits |
Numero | Importo dei benefici dell'assistenza dipendente in USD. Campo IRS W-2 10 | 1234567.89 | |
NonQualifiedPlans |
Numero | Importo dei piani non qualificati in USD. Campo IRS W-2 11 | 1234567.89 | |
IsStatutoryEmployee |
String | Parte del campo IRS W-2 13. Può essere True o False | true | |
IsRetirementPlan |
String | Parte del campo IRS W-2 13. Può essere True o False | true | |
IsThirdPartySickPay |
String | Parte del campo IRS W-2 13. Può essere True o False | true | |
Other |
String | Contenuto del campo IRS W-2 14 | SALARI LV MALATI SBJT A $511/GIORNO LIMITE 1356 | |
StateTaxInfos |
Matrice | Informazioni relative alle imposte statali. contenuto del campo IRS W-2 da 15 a 17 | ||
LocaleTaxInfos |
Matrice | Informazioni relative alle imposte locali. Contenuto del campo W-2 IRS da 18 a 20 |
Estrazione di campi 1098
Di seguito sono riportati i campi estratti da un modulo 1098 nella risposta di output JSON. Sono supportati anche i moduli 1098-T e 1098-E.
Nome | Tipo | Descrizione | Output di esempio |
---|---|---|---|
TaxYear | Numero | Anno fiscale modulo | 2021 |
Mutuatario | Object | Oggetto che contiene il TIN, il nome, l'indirizzo e l'accountNumber del debitore | |
Prestatore | Object | Oggetto che contiene il TIN, il nome, l'indirizzo e il telefono del prestatore | |
MortgageInterest | Numero | Importo degli interessi ipotecari ricevuti dai pagatori/debitori (casella 1) | 1,234,567.89 |
OutstandingMortgagePrincipal | Numero | Capitale ipotecario in sospeso (casella 2) | 1,234,567.89 |
MortgageOriginationDate | Data | Data di origine dell'ipoteca (casella 3) | 2022-01-01 |
OverpaidInterestRefund | Numero | Importo del rimborso degli interessi pagati (casella 4) | 1,234,567.89 |
MortgageInsurancePremium | Numero | Importo del premio assicurativo ipotecario (casella 5) | 1,234,567.89 |
PointsPaid | Numero | Punti pagati all'acquisto di residenza principale (Box 6) | 1,234,567.89 |
IsPropertyAddressSameAsBorrower | String | Indirizzo della proprietà che protegge il mutuo come l'indirizzo postale del debitore/debitore (casella 7) | true |
PropertyAddress | String | Indirizzo o descrizione della proprietà che protegge il mutuo (casella 8) | 123 Main St., Redmond WA 98052 |
MortgagedPropertiesCount | Numero | Numero di immobili ipotecati (casella 9) | 1 |
Altro | String | Informazioni aggiuntive da segnalare al pagamento (casella 10) | |
RealEstateTax | Numero | Imposta immobiliare (casella 1) | 1,234,567.89 |
AdditionalAssessment | String | Aggiunte valutazioni effettuate sulla proprietà (casella 10) | 1,234,567.89 |
MortgageAcquisitionDate | data | Data di acquisizione ipotecaria (casella 11) | 2022-01-01 |
Estrazione campi 1099-NEC
Di seguito sono riportati i campi estratti da un modulo 1099 nella risposta di output JSON. Sono supportate anche le altre varianti del 1099.
Nome | Tipo | Descrizione | Output di esempio |
---|---|---|---|
TaxYear |
String | Anno fiscale estratto dal modulo 1099-NEC. | 2021 |
Payer |
Object | Oggetto che contiene il valore TIN, Nome, Indirizzo e Numero di telefono del pagatore | |
Recipient |
Object | Oggetto contenente tin, nome, indirizzo e Numero di conto del destinatario | |
Box1 |
number | Casella 1 estratta dal modulo 1099-NEC. | 123456 |
Box2 |
boolean | Casella 2 estratta dal modulo 1099-NEC. | true |
Box4 |
number | Casella 4 estratta dal modulo 1099-NEC. | 123456 |
StateTaxesWithheld |
array | Imposte statali trattenute estratte dal modulo 1099-NEC (caselle 5, 6 e 7) |
Modulo fiscale 1040 estrazione campi
Di seguito sono riportati i campi estratti da un modulo 1040 nella risposta di output JSON. Sono supportate anche le altre varianti di 1040.
Nome | Tipo | Descrizione | Output di esempio |
---|---|---|---|
TaxPayer |
Object | Oggetto che contiene le informazioni del contribuente, ad esempio SSN, Cognome e Indirizzo | |
Spouse |
Object | Oggetto contenente le informazioni del coniuge, ad esempio SSN, cognome, nome e iniziali | |
Dependents |
array | Matrice che contiene un elenco di dipendenti, incluse informazioni quali Nome, SSN e Tipo di credito | |
ThirdPartyDesignee |
oggetto | Oggetto che contiene informazioni sull'oggetto di progettazione di terze parti | |
SignatureDetails |
oggetto | Oggetto che contiene informazioni sull'accesso, ad esempio numeri di telefono e messaggi di posta elettronica | |
PaidPreparer |
oggetto | Oggetto che contiene informazioni sul preparatore. | |
FillingStatus |
String | Value può essere uno di noSelection, single, marriedFilingJointly, marriedFillingSeparately, headOfHousehold, qualifyingSurvivingSpouse o multiSelection. | singolo |
FilingStatusDetails |
oggetto | Oggetto che contiene informazioni sullo stato di archiviazione. | |
NameOfSpouseOrQualifyingPerson |
String | Nome del coniuge o persona idonea estratta dal modulo 1040. | Giorgio Cavaglieri |
PresidentialElectionCampaign |
String | Il valore può essere uno di noSelection, contribuente, coniuge o multiSelection. | Contribuente |
PresidentialElectionCampaignDetails |
oggetto | Oggetto che contiene informazioni dettagliate sulla campagna elettorale presidenziale. | |
DigitalAssets |
String | Il valore può essere uno di noSelection, sì, no o multiSelection. | yes |
DigitalAssetsDetails |
oggetto | Oggetto che contiene informazioni dettagliate sugli asset digitali. | |
ClaimStatus |
String | Il valore può essere uno di noSelection, contribuentAsDependent, spouseAsDependent, spouseItemizesSeparatelyOrDualStatusAlien o multiSelection. | taxpayerAsDependent |
ClaimStatusDetails |
oggetto | Oggetto che contiene informazioni dettagliate sullo stato dell'attestazione. | |
TaxpayerAgeBlindness |
String | Il valore può essere uno dei valori noSelection, above64 , blind o multiSelection. |
above64 |
TaxPayerAgeBlindnessDetails |
oggetto | Oggetto che contiene informazioni dettagliate sulla cecità dell'età del contribuente. | |
SpouseAgeBlindness |
String | Il valore può essere uno dei valori noSelection, above64 , blind o multiSelection. |
above64 |
TaxPayerAgeBlindnessDetails |
oggetto | Oggetto che contiene dettagli sull'età della cecità del coniuge. | |
MoreThanFourDependents |
boolean | Più di quattro dipendenti estratti dal modulo 1040. | true |
Box1a |
number | Scatola 1a estratta da 1040. |
123456 |
In base alla struttura JSON fornita e alla conversione nello stesso formato di tabella richiesto, il risultato è il seguente: | |||
Box1b |
number | Scatola 1b estratta da 1040. |
123456 |
Box1c |
number | Scatola 1c estratta da 1040. |
123456 |
Box1d |
number | Scatola 1d estratta da 1040. |
123456 |
Box1e |
number | Scatola 1e estratta da 1040. |
123456 |
Box1f |
number | Scatola 1f estratta da 1040. |
123456 |
Box1g |
number | Scatola 1g estratta da 1040. |
123456 |
Box1h |
number | Scatola 1h estratta da 1040. |
123456 |
Box1i |
number | Scatola 1i estratta da 1040. |
123456 |
Box1z |
number | Scatola 1z estratta da 1040. |
123456 |
Box2a |
number | Scatola 2a estratta da 1040. |
123456 |
Box2b |
number | Scatola 2b estratta da 1040. |
123456 |
Box3a |
number | Scatola 3a estratta da 1040. |
123456 |
Box3b |
number | Scatola 3b estratta da 1040. |
123456 |
Box4a |
number | Scatola 4a estratta da 1040. |
123456 |
Box4b |
number | Scatola 4b estratta da 1040. |
123456 |
Box5a |
number | Scatola 5a estratta da 1040. |
123456 |
Box5b |
number | Scatola 5b estratta da 1040. |
123456 |
Box6a |
number | Scatola 6a estratta da 1040. |
123456 |
Box6b |
number | Scatola 6b estratta da 1040. |
123456 |
Box6cCheckbox |
boolean | Casella 6c di controllo Estratta da 1040. |
true |
Box7Checkbox |
boolean | Casella di controllo 7 estratta da 1040. | true |
Box7 |
number | Casella 7 estratta da 1040. | 123456 |
Box8 |
number | Casella 8 estratta da 1040. | 123456 |
Box9 |
number | Casella 9 estratta da 1040. | 123456 |
Box10 |
number | Casella 10 estratta da 1040. | 123456 |
Box11 |
number | Casella 11 estratta da 1040. | 123456 |
Box12 |
number | Casella 12 estratta da 1040. | 123456 |
Box13 |
number | Casella 13 estratta da 1040. | 123456 |
Box14 |
number | Casella 14 estratta da 1040. | 123456 |
Box15 |
number | Casella 15 estratta da 1040. | 123456 |
Box16FromForm |
string | Il valore può essere uno di noSelection, 8814, 4972, altro o multiSelection. | 8814 |
Box16FromFormDetails |
oggetto | Oggetto che contiene informazioni dettagliate sulla Casella 16 | |
Box16OtherFormNumber |
string | Casella 16 Altro numero modulo estratto da 1040. | 8888 |
Box16 |
number | Casella 16 estratta da 1040. | 123456 |
Box17 |
number | Casella 17 estratta da 1040. | 123456 |
Box18 |
number | Casella 18 estratta da 1040. | 123456 |
Box19 |
number | Casella 19 estratta da 1040. | 123456 |
Box20 |
number | Casella 20 estratta da 1040. | 123456 |
Box21 |
number | Casella 21 estratta da 1040. | 123456 |
Box22 |
number | Casella 22 estratta da 1040. | 123456 |
Box23 |
number | Casella 23 estratta da 1040. | 123456 |
Box24 |
number | Casella 24 estratta da 1040. | 123456 |
Box25a |
number | Scatola 25a estratta da 1040. |
123456 |
Box25b |
number | Scatola 25b estratta da 1040. |
123456 |
Box25c |
number | Scatola 25c estratta da 1040. |
123456 |
Box25d |
number | Scatola 25d estratta da 1040. |
123456 |
Box26 |
number | Casella 26 estratta da 1040. | 123456 |
Box27 |
number | Casella 27 estratta da 1040. | 123456 |
Box28 |
number | Casella 28 estratta da 1040. | 123456 |
Box29 |
number | Casella 29 estratta da 1040. | 123456 |
Box31 |
number | Casella 31 estratta da 1040. | 123456 |
Box32 |
number | Casella 32 estratta da 1040. | 123456 |
Box33 |
number | Casella 33 estratta da 1040. | 123456 |
Box34 |
number | Casella 34 estratta da 1040. | 123456 |
Box35Checkbox |
boolean | Casella di controllo 35 estratta da 1040. | true |
Box35a |
number | Scatola 35a estratta da 1040. |
123456 |
Box35b |
number | Scatola 35b estratta da 1040. |
123456 |
Box35c |
string | Il valore può essere uno di noSelection, il controllo, il risparmio o la selezione multipla. | controllo |
Box35cDetails |
oggetto | Oggetto che contiene dettagli su Box 35c |
|
Box35d |
number | Scatola 35d estratta da 1040. |
123456 |
Box36 |
number | Casella 36 estratta da 1040. | 123456 |
Box37 |
number | Casella 37 estratta da 1040. | 123456 |
Box38 |
number | Casella 38 estratta da 1040. | 123456 |
HasAssignedThirdPartyDesignee |
string | Il valore può essere uno di noSelection, sì, no o multiSelection. | yes |
HasAssignedThirdPartyDesigneeDetails |
oggetto | Oggetto che contiene informazioni su ciò che è stato selezionato per l'utente di progettazione di terze parti assegnato |
Le coppie chiave-valore dei documenti fiscali e gli elementi di riga estratti si trovano nella sezione documentResults
dell'output JSON.
Passaggi successivi
Provare a elaborare moduli e documenti personalizzati con Studio di Informazioni sui documenti.
Completare una Guida introduttiva di Informazioni sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per