Dokumentumintelligencia – amerikai adódokumentum-modellek

Fontos

  • A Document Intelligence nyilvános előzetes verziójú kiadásai korai hozzáférést biztosítanak az aktív fejlesztés alatt lévő funkciókhoz.
  • A funkciók, a megközelítések és a folyamatok az általános rendelkezésre állás (GA) előtt változhatnak a felhasználói visszajelzések alapján.
  • A Document Intelligence ügyfélkódtárak nyilvános előzetes verziója alapértelmezés szerint a REST API 2024-02-29-preview verziója.
  • A nyilvános előzetes verzió 2024-02-29 előzetes verziója jelenleg csak a következő Azure-régiókban érhető el:
  • USA keleti régiója
  • USA2 nyugati régiója
  • Nyugat-Európa

Ez a tartalom a következőre vonatkozik::Sakkv4.0 (előzetes verzió) | Korábbi verziók:kék pipav3.1 (GA)

Ez a tartalom a következőre vonatkozik::Sakkv3.1 (GA) | Legújabb verzió:lila pipav4.0 (előzetes verzió)

A dokumentumintelligencia-szerződésmodell hatékony optikai karakterfelismerési (OCR) képességeket használ a kulcsmezők és sorelemek elemzéséhez és kinyeréséhez az adódokumentumok kiválasztott csoportjából. Az adódokumentumok különböző formátumúak és minőségűek lehetnek, beleértve a telefonon rögzített képeket, a beolvasott dokumentumokat és a digitális PDF-eket. Az API elemzi a dokumentum szövegét; kinyeri a legfontosabb információkat, például az ügyfél nevét, a számlázási címet, a határidőt és az esedékes összeget; és strukturált JSON-adatábrázolást ad vissza. A modell jelenleg bizonyos angol adódokumentum-formátumokat támogat.

Támogatott dokumentumtípusok:

  • W-2-nyomtatványok
  • 1098
  • 1098-E
  • 1098-T
  • 1099 és variációk (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, Q, QA, R, S, SA, SB)
  • 1040 és változatok (1. ütemezés, 2. ütemezés, 3. ütemezés, 8812. ütemezés, A. ütemezés, B. ütemezés, C. ütemezés, D. ütemezés, E. ütemezés, ütemezésEIC, F. ütemezés, H. ütemezés, J. ütemezés, R. ütemezés, ütemezési Standard kiadás és vezető beosztás)

Automatizált adódokumentum-feldolgozás

Az automatikus adódokumentum-feldolgozás a kulcsmezők adózási dokumentumokból való kinyerésének folyamata. Az adódokumentumokat korábban manuálisan dolgozták fel. Ez a modell lehetővé teszi az adóforgatókönyvek egyszerű automatizálását.

Fejlesztési lehetőségek

A Document Intelligence v4.0 (2023-10-31 előzetes verzió) a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Amerikai adóűrlap-modellek Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-tax.us.W-2• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T
• prebuilt-tax.us.1099A
• prebuilt-tax.us.1099B
• prebuilt-tax.us.1099C
• prebuilt-tax.us.1099CAP
• prebuilt-tax.us.1099DIV
• prebuilt-tax.us.1099G
• prebuilt-tax.us.1099H
• prebuilt-tax.us.1099INT
• előre összeállítottt-tax.us.1099K
• prebuilt-tax.us.1099LS
• prebuilt-tax.us.1099LTC
• prebuilt-tax.us.1099MISC

prebuilt-tax.us.1099NEC• prebuilt-tax.us.1099OID
• prebuilt-tax.us.1099PATR
• prebuilt-tax.us.1099Q
• prebuilt-tax.us.1099QA
• prebuilt-tax.us.1099R
• prebuilt-tax.us.1099S
• prebuilt-tax.us. 1099SA
• prebuilt-tax.us.1099SB
• prebuilt-tax.us.1040
• prebuilt-tax.us.1040Schedule1
• prebu 1040Schedule2
• prebuilt-tax.us.1040Schedule3
• prebuilt-tax.us.1040Schedule8812

prebuilt-tax.us.1040ScheduleA• prebuilt-tax.us.1040ScheduleB
• prebuilt-tax.us.1040ScheduleC
• prebuilt-tax.us.1040ScheduleD
• prebuilt-tax.us.1040ScheduleE
• prebuilt-tax.us.1040ScheduleEIC
• prebuilt-tax.us.1040ScheduleF
• prebuilt-tax.us.1040ScheduleH
• prebuilt-tax.us.1040ScheduleJ
• prebuilt-tax.us.1040ScheduleR
• prebuilt-tax.us.1040Schedule Standard kiadás

prebuilt-tax.us.1040Senior

A Document Intelligence v3.1 a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Amerikai adóűrlap-modellek Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-tax.us.W-2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

A Document Intelligence 3.0-s verzió a következő eszközöket, alkalmazásokat és kódtárakat támogatja:

Szolgáltatás Források Modellazonosító
Amerikai adóűrlap-modellek Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-tax.us.W-2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

Bemeneti követelmények

  • A legjobb eredmény érdekében dokumentumonként egy tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.

  • Támogatott fájlformátumok:

    Modell PDF Kép:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) és HTML
    Olvasás
    Elrendezés ✔ (2024-02-29-preview, 2023-10-31-preview)
    Általános dokumentum
    Előre összeállított
    Egyéni kinyerés
    Egyéni besorolás ✔ (2024-02-29-preview)
  • PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).

  • A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) és 4 MB az ingyenes (F0) szint esetén.

  • A képméreteknek 50 x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.

  • Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.

  • A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül 8150 pont/hüvelyk (DPI) pont szövegnek felel meg.

  • Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.

    • Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete sablonmodell esetén 50 MB, a neurális modell esetében pedig 1G-MB.

    • Egyéni besorolási modell betanítása esetén a betanítási adatok 1GB teljes mérete legfeljebb 10 000 oldal lehet.

Adódokumentumok adatkinyerésének kipróbálása

Megtudhatja, hogyan nyerik ki az adatokat, beleértve az ügyféladatokat, a szállító adatait és a sorelemeket a számlákból. A következő erőforrásokra van szüksége:

  • Azure-előfizetés – ingyenesen létrehozhat egyet.

  • Dokumentumintelligencia-példány az Azure Portalon. A szolgáltatás kipróbálásához használhatja az ingyenes tarifacsomagot (F0). Az erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget a kulcs és a végpont lekéréséhez.

Képernyőkép a kulcsok és a végpontok helyéről az Azure Portalon.

Document Intelligence Studio

  1. A Document Intelligence Studio kezdőlapján válassza ki a támogatott adódokumentum-modellt.

  2. Elemezhet egy adódokumentummintát, vagy feltöltheti saját fájljait.

  3. Válassza a Futtatás elemzés gombot, és szükség esetén konfigurálja az Elemzési beállításokat :

    Képernyőkép a Document Intelligence Studio Elemzés és elemzés beállításai gombjairól.

Támogatott nyelvek és területi beállítások

A támogatott nyelvek teljes listájáért tekintse meg a Nyelvi támogatás – előre összeállított modellek lapját.

Mező kinyerése W-2

A JSON-kimenet válaszában az alábbi mezők származnak egy W-2 adóűrlapról.

Név Típus Leírás Példakimenet Eltartottak
W-2FormVariant Sztring IR W-2 űrlapvariáns. Ez a mező a következő értékek egyikével rendelkezhet: W-2, W-2AS, W-2CM, , W-2GUvagy W-2VI W-2-nyomtatványok
TaxYear Szám Űrlapadó éve 2021
W2Copy Sztring A W-2 adómásolat verziója és a másolathoz kapcsolódó nyomtatott utasítások A másolása – Társadalombiztosítási Rendszergazda istration esetén
Employee object Társadalombiztosítási számot, nevet és címet tartalmazó objektum
ControlNumber húr W-2 vezérlőszám. IRS W-2 mező d 0AB12 D345 7890
Employer Objektum Munkáltatói azonosító számot, nevet és címet tartalmazó objektum
WagesTipsAndOtherCompensation Szám Bérek, tippek és egyéb kompenzációs összeg USD-ben. IRS W-2 mező 1 1234567.89
FederalIncomeTaxWithheld Szám A szövetségi jövedelemadó visszatartott összege USD-ben. IRS W-2 mező 2 1234567.89
SocialSecurityWages Szám A társadalombiztosítási bérek összege USD-ben. IRS W-2 mező 3 1234567.89
SocialSecurityTaxWithheld Szám A társadalombiztosítási adó visszatartott összege USD-ben. IRS W-2 mező 4 1234567.89
MedicareWagesAndTips Szám Medicare bérek és tippek összege USD. IRS W-2 mező 5 1234567.89
MedicareTaxWithheld Szám Medicare adó visszatartott összege USD. IRS W-2 mező 6 1234567.89
SocialSecurityTips Szám A társadalombiztosítási tippek összege USD-ben. IRS W-2 mező 7 1234567.89
AllocatedTips Szám Kiosztott tippek USD-ben. IRS W-2 mező 8 1234567.89
VerificationCode Szám W-2 ellenőrző kód. IRS W-2 mező 9 1234567.89
DependentCareBenefits Szám A függő ápolási ellátások összege USD-ben. IRS W-2 mező 10 1234567.89
NonQualifiedPlans Szám Nem minősített csomagok összege USD-ben. IRS W-2 mező 11 1234567.89
IsStatutoryEmployee Sztring Az IRS W-2 mező 13 része. Lehet igaz vagy hamis true
IsRetirementPlan Sztring Az IRS W-2 mező 13 része. Lehet igaz vagy hamis true
IsThirdPartySickPay Sztring Az IRS W-2 mező 13 része. Lehet igaz vagy hamis true
Other Sztring Az IRS W-2 mező tartalma 14 BETEG LV BÉREK SBJT A $ 511/DAY LIMIT 1356
StateTaxInfos Tömb Állami adóval kapcsolatos információk. A 15–17. számú IRS W-2 mező tartalma
LocaleTaxInfos Tömb Helyi adóval kapcsolatos információk. Az IRS W-2 mező tartalma 18–20

Mező kinyerése 1098

A JSON kimeneti válaszában az 1098-at tartalmazó adóűrlapból kinyert mezők a következők. Az 1098-T és az 1098-E űrlapok is támogatottak.

Név Típus Leírás Példakimenet
TaxYear Szám Űrlapadó éve 2021
Hitelfelvevő Objektum Olyan objektum, amely a hitelfelvevő TIN-jét, nevét, címét és AccountNumber-azonosítóját tartalmazza
Hitelező Objektum A hitelező TIN-jét, nevét, címét és telefonját tartalmazó objektum
MortgageInterest Szám A kifizetőktől/hitelfelvevőktől kapott jelzálog-kamat összege (1. keret) 1,234,567.89
OutstandingMortgagePrincipal Szám Kinnlévő jelzáloghitel-tőke (2. keret) 1,234,567.89
MortgageOriginationDate Dátum A jelzálog keletkezésének dátuma (3. rovat) 2022-01-01
OverpaidInterestRefund Szám Túlfizetett kamat visszatérítése (4. rovat) 1,234,567.89
MortgageInsurancePremium Szám Jelzálog-biztosítási díj összege (5. rovat) 1,234,567.89
PointsPaid Szám A fő lakóhely vásárlása után fizetett pontok (6. rovat) 1,234,567.89
IsPropertyAddressSameAsBorrower Sztring A jelzálogot biztosító ingatlan címe megegyezik-e a kifizető/hitelfelvevő levelezési címével (7. rovat) true
PropertyAddress Sztring A jelzálogot biztosító ingatlan címe vagy leírása (8. rovat) 123 Main St., Redmond WA 98052
MortgagedPropertiesCount Szám Jelzáloggal terhelt ingatlanok száma (9. rovat) 0
Egyéb Sztring További információk a kifizetőnek való jelentéshez (10. rovat)
RealEstateTax Szám Ingatlanadó (1. rovat) 1,234,567.89
További információk Sztring Hozzáadott értékelések a tulajdonságon (10. rovat) 1,234,567.89
MortgageAcquisitionDate dátum: Jelzáloghitel-szerzés dátuma (11. rovat) 2022-01-01

Mező kinyerése 1099-NEC

A JSON kimeneti válaszában az 1099-nec adóűrlapból kinyert mezők a következők. Az 1099-ben szereplő többi változat is támogatott.

Név Típus Leírás Példakimenet
TaxYear Sztring Az 1099-NEC űrlapból kinyert adóév. 2021
Payer Objektum A kifizető TIN-jét, nevét, címét és Telefon Number azonosítóját tartalmazó objektum
Recipient Objektum A címzett TIN-jét, nevét, címét és AccountNumber azonosítóját tartalmazó objektum
Box1 szám 1. doboz, kinyerve az 1099-NEC űrlapból. 123456
Box2 Logikai 2. doboz, kinyerve az 1099-NEC űrlapból. true
Box4 szám 4. doboz, kinyerve az 1099-NEC űrlapból. 123456
StateTaxesWithheld array Az 1099-NEKC űrlapból kivont államadók (5., 6. és 7. mező)

Mezőkinyerés 1040 adóűrlap

A JSON kimeneti válaszában az 1040 adóűrlapból kinyert mezők a következők. Az 1040 többi változata is támogatott.

Név Típus Leírás Példakimenet
TaxPayer Objektum Olyan objektum, amely tartalmazza az adófizető adatait, például az SSN-t, a vezetéknevet és a címet
Spouse Objektum Olyan objektum, amely tartalmazza a házastárs adatait, például az SSN-t, a vezetéknevet, az utónevet és a monogram nevét
Dependents array Olyan tömb, amely a függők listáját tartalmazza, beleértve az olyan információkat, mint a Név, az SSN és a hitel típusa
ThirdPartyDesignee object Olyan objektum, amely információt tartalmaz a külső tervezőről
SignatureDetails object Az aláíróval kapcsolatos információkat, például telefonszámokat és e-maileket tartalmazó objektum
PaidPreparer object Egy objektum, amely információkat tartalmaz a előkészítőről.
FillingStatus Sztring Az érték lehet noSelection, single, marriedFilingJointly, marriedFillingSeparately, headOfHousehold, qualifyingSurvivingSpouse vagy multiSelection. Egyetlen
FilingStatusDetails object Egy objektum, amely információkat tartalmaz a iktatási állapotról.
NameOfSpouseOrQualifyingPerson Sztring Az 1040-ből kinyert házastárs vagy jogosult személy neve. John Smith
PresidentialElectionCampaign Sztring Az érték lehet a noSelection, az adózó, a házastárs vagy a multiSelection egyike. Adófizető
PresidentialElectionCampaignDetails object Egy objektum, amely részleteket tartalmaz az elnökválasztási kampányról.
DigitalAssets Sztring Az érték lehet az egyik noSelection, igen, nem vagy multiSelection. igen
DigitalAssetsDetails object A digitális eszközökkel kapcsolatos részleteket tartalmazó objektum.
ClaimStatus Sztring Az érték lehet noSelection, taxpayerAsDependent, spouseAsDependent, spouseItemizesSeparatelyOrDualStatusAlien vagy multiSelection. taxpayerAsDependent
ClaimStatusDetails object Egy objektum, amely a jogcím állapotának részleteit tartalmazza.
TaxpayerAgeBlindness Sztring Az érték lehet a noSelection, above64a blind vagy a multiSelection egyik értéke. fenti64
TaxPayerAgeBlindnessDetails object Olyan objektum, amely az adózó korának vakságával kapcsolatos részleteket tartalmazza.
SpouseAgeBlindness Sztring Az érték lehet a noSelection, above64a blind vagy a multiSelection egyik értéke. fenti64
TaxPayerAgeBlindnessDetails object Olyan tárgy, amely a házastárs életkorának vakságával kapcsolatos részleteket tartalmazza.
MoreThanFourDependents Logikai Az 1040-ből kinyert négynél több függő. true
Box1a szám 1040-ből kinyert doboz 1a . 123456
A megadott JSON-struktúra alapján és a kért táblázatformátumba való konvertálással az eredmény a következő:
Box1b szám 1040-ből kinyert doboz 1b . 123456
Box1c szám 1040-ből kinyert doboz 1c . 123456
Box1d szám 1040-ből kinyert doboz 1d . 123456
Box1e szám 1040-ből kinyert doboz 1e . 123456
Box1f szám 1040-ből kinyert doboz 1f . 123456
Box1g szám 1040-ből kinyert doboz 1g . 123456
Box1h szám 1040-ből kinyert doboz 1h . 123456
Box1i szám 1040-ből kinyert doboz 1i . 123456
Box1z szám 1040-ből kinyert doboz 1z . 123456
Box2a szám 1040-ből kinyert doboz 2a . 123456
Box2b szám 1040-ből kinyert doboz 2b . 123456
Box3a szám 1040-ből kinyert doboz 3a . 123456
Box3b szám 1040-ből kinyert doboz 3b . 123456
Box4a szám 1040-ből kinyert doboz 4a . 123456
Box4b szám 1040-ből kinyert doboz 4b . 123456
Box5a szám 1040-ből kinyert doboz 5a . 123456
Box5b szám 1040-ből kinyert doboz 5b . 123456
Box6a szám 1040-ből kinyert doboz 6a . 123456
Box6b szám 1040-ből kinyert doboz 6b . 123456
Box6cCheckbox Logikai 1040-ből kinyert jelölőnégyzet 6c jelölőnégyzet. true
Box7Checkbox Logikai Box 7 Checkbox extracted from 1040. true
Box7 szám 7. doboz, kinyerve 1040-ből. 123456
Box8 szám 1040-ből kinyert 8. doboz. 123456
Box9 szám 9. doboz, kinyerve 1040-ből. 123456
Box10 szám 10. doboz, kinyerve 1040-ből. 123456
Box11 szám 11. doboz, kinyerve 1040-ből. 123456
Box12 szám 12. doboz, kinyerve 1040-ből. 123456
Box13 szám 13. doboz, kinyerve 1040-ből. 123456
Box14 szám 14. doboz, kinyerve 1040-ből. 123456
Box15 szám 15. doboz, kinyerve 1040-ből. 123456
Box16FromForm húr Az érték lehet a noSelection, a 8814, a 4972, az egyéb vagy a multiSelection egyik. 8814
Box16FromFormDetails object A 16. doboz adatait tartalmazó objektum
Box16OtherFormNumber húr 16. doboz– 1040-ből kinyert egyéb űrlapszám. 8888
Box16 szám 16. doboz, kinyerve 1040-ből. 123456
Box17 szám 17. doboz, kinyerve 1040-ből. 123456
Box18 szám 18. doboz, kinyerve 1040-ből. 123456
Box19 szám 19. doboz, kinyerve 1040-ből. 123456
Box20 szám 1040-ből kinyert 20. doboz. 123456
Box21 szám 21. doboz, kinyerve 1040-ből. 123456
Box22 szám 22. doboz, kinyerve 1040-ből. 123456
Box23 szám 1040-ből kinyert 23. doboz. 123456
Box24 szám 1040-ből kinyert 24. doboz. 123456
Box25a szám 1040-ből kinyert doboz 25a . 123456
Box25b szám 1040-ből kinyert doboz 25b . 123456
Box25c szám 1040-ből kinyert doboz 25c . 123456
Box25d szám 1040-ből kinyert doboz 25d . 123456
Box26 szám Doboz 26 kinyerve 1040. 123456
Box27 szám 27. doboz, kinyerve 1040-ből. 123456
Box28 szám 1040-ből kinyert 28. doboz. 123456
Box29 szám Doboz 29 kinyerve 1040. 123456
Box31 szám 1040-ből kinyert 31. doboz. 123456
Box32 szám 32. doboz, kinyerve 1040-ből. 123456
Box33 szám 33. doboz, kinyerve 1040-ből. 123456
Box34 szám Doboz 34 kinyerve 1040. 123456
Box35Checkbox Logikai Box 35 Checkbox extracted from 1040. true
Box35a szám 1040-ből kinyert doboz 35a . 123456
Box35b szám 1040-ből kinyert doboz 35b . 123456
Box35c húr Az érték lehet a noSelection, az ellenőrzés, a megtakarítás vagy a multiSelection egyik értéke. Ellenőrzése
Box35cDetails object A Box részleteit tartalmazó objektum 35c
Box35d szám 1040-ből kinyert doboz 35d . 123456
Box36 szám 36. doboz, kinyerve 1040-ből. 123456
Box37 szám 37. doboz, kinyerve 1040-ből. 123456
Box38 szám 38. doboz, kinyerve 1040-ből. 123456
HasAssignedThirdPartyDesignee húr Az érték lehet az egyik noSelection, igen, nem vagy multiSelection. igen
HasAssignedThirdPartyDesigneeDetails object A hozzárendelt külső tervező számára kijelölt adatokra vonatkozó információkat tartalmazó objektum

Az adódokumentum kulcs-érték párjai és a kinyert sorelemek a documentResults JSON-kimenet szakaszában találhatók.

Következő lépések