Share via


Belge Zekası ABD vergi belgesi modelleri

Önemli

  • Document Intelligence genel önizleme sürümleri, etkin geliştirme aşamasında olan özelliklere erken erişim sağlar.
  • Genel Kullanılabilirlik (GA) öncesinde kullanıcı geri bildirimlerine göre özellikler, yaklaşımlar ve süreçler değişebilir.
  • Belge Zekası istemci kitaplıklarının genel önizleme sürümü varsayılan olarak REST API sürüm 2024-02-29-preview'dır.
  • Genel önizleme sürümü 2024-02-29-preview şu anda yalnızca aşağıdaki Azure bölgelerinde kullanılabilir:
  • Doğu ABD
  • Batı ABD2
  • Batı Avrupa

Bu içerik şunlar için geçerlidir:Checkmarkv4.0 (önizleme) | Önceki sürümler:mavi onay işaretiv3.1 (GA)

Bu içerik:Checkmarkv3.1 (GA) | En son sürüm:mor onay işaretiv4.0 (önizleme) için geçerlidir

Belge Yönetim Bilgileri sözleşme modeli, belirli bir vergi belgesi grubundan önemli alanları ve satır öğelerini analiz etmek ve ayıklamak için güçlü Optik Karakter Tanıma (OCR) özelliklerini kullanır. Vergi belgeleri telefon tarafından yakalanan görüntüler, taranan belgeler ve dijital PDF'ler dahil olmak üzere çeşitli biçimlerde ve kalitede olabilir. API belge metnini analiz eder; müşteri adı, fatura adresi, son tarih ve vadesi gelen tutar gibi önemli bilgileri ayıklar; ve yapılandırılmış bir JSON veri gösterimi döndürür. Model şu anda belirli İngilizce vergi belgesi biçimlerini desteklemektedir.

Desteklenen belge türleri:

  • W-2
  • 1098
  • 1098-E
  • 1098-T
  • 1099 ve varyasyonları (A, B, C, CAP, DIV, G, H, INT, K, LS, LTC, MISC, NEC, OID, PATR, Q, QA, R, S, SA, SB)
  • 1040 ve varyasyonlar (Zamanlama 1, Zamanlama 2, Zamanlama 3, Zamanlama 8812, Zamanlama A, Zamanlama B, Zamanlama C, Zamanlama D, Zamanlama E, Zamanlama EIC, Zamanlama F, Zamanlama H, Zamanlama J, Zamanlama R, Zamanlama SE ve Kıdemli Zamanlama)

Otomatik vergi belgesi işleme

Otomatik vergi belgesi işleme, vergi belgelerinden önemli alanları ayıklama işlemidir. Geçmişte vergi belgeleri el ile işlenmiştir. Bu model, vergi senaryolarının kolay otomasyonunu sağlar.

Dağıtım seçenekleri

Document Intelligence v4.0 (2023-10-31-preview) aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar Model Kimliği
ABD vergi formu modelleri Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-tax.us.W-2• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T• prebuilt-tax.us.1098T
• önceden oluşturulmuşt-tax.us.1099A
• prebuilt-tax.us.1099B
• prebuilt-tax.us.1099C
• prebuilt-tax.us.1099CAP
• önceden oluşturulmuşt-tax.us.1099DIV
• prebuilt-tax.us.1099G
• prebuilt-tax.us.1099H
• prebuilt-tax.us.1099INT
• önceden oluşturulmuşt-tax.us.1099K
• prebuilt-tax.us.1099LS
• prebuilt-tax.us.1099LTC
• prebuilt-tax.us.1099MISC

prebuilt-tax.us.1099NEC• prebuilt-tax.us.1099OID
• prebuilt-tax.us.1099PATR
• prebuilt-tax.us.1099Q
• prebuilt-tax.us.1099QA
• prebuilt-tax.us.1099R
• prebuilt-tax.us.1099S
• prebuilt-tax.tax.us.1099SA
• prebuilt-tax.us.1099SB
• prebuilt-tax.us.1040
• prebuilt-tax.us.1040Schedule1
• önbuilt-tax.us.1040Schedule2
• prebuilt-tax.us.1040Schedule3
• prebuilt-tax.us.1040Schedule8812

prebuilt-tax.us.1040ScheduleA
• prebuilt-tax.us.1040ScheduleB
• prebuilt-tax.us.1040ScheduleC
• önbuilt-tax.us.1040ScheduleD
• prebuilt-tax.us.1040ScheduleE
• prebuilt-tax.us.1040ScheduleEIC
• prebuilt-tax.us.1040ScheduleF
• prebuilt-tax.us.1040ScheduleH
• prebuilt-tax.us.1040ScheduleJ
• prebuilt-tax.us.1040ScheduleR
• prebuilt-tax.us.1040ScheduleSE
• prebuilt-tax.us.1040Senior

Document Intelligence v3.1 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar Model Kimliği
ABD vergi formu modelleri Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-tax.us.W-2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

Document Intelligence v3.0 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar Model Kimliği
ABD vergi formu modelleri Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
• prebuilt-tax.us.W-2
• prebuilt-tax.us.1098
• prebuilt-tax.us.1098E
• prebuilt-tax.us.1098T

Giriş gereksinimleri

  • En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.

  • Desteklenen dosya biçimleri:

    Model PDF Resim:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) ve HTML
    Okundu
    Düzen ✔ (2024-02-29-preview, 2023-10-31-preview)
    Genel Belge
    Önceden oluşturulmuş
    Özel ayıklama
    Özel sınıflandırma ✔ (2024-02-29-preview)
  • PDF ve TIFF için en fazla 2000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).

  • Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve ücretsiz (F0) katmanı için 4 MB'tır.

  • Görüntü boyutları 50 x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.

  • PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.

  • Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, inç başına 150 nokta (DPI) olan yaklaşık 8noktalı metne karşılık gelir.

  • Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.

    • Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve sinir modeli için 1G-MB'tır.

    • Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfadır 1GB .

Vergi belgesi veri ayıklamayı deneyin

Müşteri bilgileri, satıcı ayrıntıları ve satır öğeleri dahil olmak üzere verilerin faturalardan nasıl ayıklandığına bakın. Aşağıdaki kaynaklara ihtiyacınız vardır:

Azure portalında anahtarların ve uç nokta konumunun ekran görüntüsü.

Belge Makine Zekası Stüdyosu

  1. Document Intelligence Studio giriş sayfasında desteklenen vergi belgesi modelini seçin.

  2. Bir örnek vergi belgesini analiz edebilir veya kendi dosyalarınızı karşıya yükleyebilirsiniz.

  3. Analizi çalıştır düğmesini seçin ve gerekirse Çözümle seçeneklerini yapılandırın:

    Document Intelligence Studio'da Çözümlemeyi çalıştır ve Çözümle seçenekleri düğmelerinin ekran görüntüsü.

Desteklenen diller ve yerel ayarlar

Desteklenen dillerin tam listesi için Dil Desteği— önceden oluşturulmuş modeller sayfamıza bakın.

Alan ayıklama W-2

Aşağıda, JSON çıktı yanıtında W-2 vergi formundan ayıklanan alanlar yer alır.

Adı Tür Açıklama Örnek çıkış Bağımlı
W-2FormVariant String IR W-2 Form çeşidi. Bu alan şu değerlerden birine sahip olabilir: W-2, W-2AS, W-2CM, W-2GUveya W-2VI W-2
TaxYear Sayı Form vergi yılı 2021
W2Copy String W-2 vergi kopyası sürümü ve bu kopyayla ilgili basılı yönergeler Kopyalama A—Sosyal Güvenlik Yönetici için
Employee nesne Sosyal güvenlik numarası, adı ve adresi içeren nesne
ControlNumber Dize W-2 kontrol numarası. IRS W-2 alanı d 0AB12 D345 7890
Employer Object İşveren kimlik numarası, adı ve adresi içeren nesne
WagesTipsAndOtherCompensation Sayı Ücretler, ipuçları ve diğer tazminat tutarı ABD Doları. IRS W-2 alan 1 1234567.89
FederalIncomeTaxWithheld Sayı Abd Doları olarak ödenmiş federal gelir vergisi. IRS W-2 alan 2 1234567.89
SocialSecurityWages Sayı Sosyal güvenlik ücreti tutarı ABD Doları. IRS W-2 alan 3 1234567.89
SocialSecurityTaxWithheld Sayı Abd Doları olarak tutulan sosyal güvenlik vergisi. IRS W-2 alan 4 1234567.89
MedicareWagesAndTips Sayı Medicare ücretleri ve ipuçları TUTARı ABD Doları. IRS W-2 alan 5 1234567.89
MedicareTaxWithheld Sayı Medicare vergi abd doları olarak ödenmiş tutar. IRS W-2 alan 6 1234567.89
SocialSecurityTips Sayı Sosyal güvenlik ipuçları ABD Doları tutarındadır. IRS W-2 alan 7 1234567.89
AllocatedTips Sayı Abd Doları olarak ayrılmış ipuçları. IRS W-2 alanı 8 1234567.89
VerificationCode Sayı W-2 doğrulama kodu. IRS W-2 alan 9 1234567.89
DependentCareBenefits Sayı Abd Doları olarak bağımlı bakım avantajları tutarı. IRS W-2 alan 10 1234567.89
NonQualifiedPlans Sayı Abd Doları olarak nitelenmemiş planlar tutarı. IRS W-2 alanı 11 1234567.89
IsStatutoryEmployee String IRS W-2 alan 13'ün bir parçası. Doğru veya yanlış olabilir true
IsRetirementPlan String IRS W-2 alan 13'ün bir parçası. Doğru veya yanlış olabilir true
IsThirdPartySickPay String IRS W-2 alan 13'ün bir parçası. Doğru veya yanlış olabilir true
Other String IRS W-2 alanı 14'ün içeriği HASTA LV ÜCRET SBJT $511/GÜN LIMIT 1356
StateTaxInfos Dizi Vergiyle ilgili eyalet bilgileri. IRS W-2 alanı 15 - 17'nin içeriği
LocaleTaxInfos Dizi Vergiyle ilgili yerel bilgiler. IRS W-2 alanı 18 ile 20 arası alanın içeriği

Alan ayıklama 1098

JSON çıkış yanıtında 1098 vergi formundan ayıklanan alanlar aşağıdadır. 1098-T ve 1098-E formları da desteklenir.

Adı Tür Açıklama Örnek çıkış
TaxYear Sayı Form vergi yılı 2021
Borçlu Object Ödünç alan TIN, Name, Address ve AccountNumber değerlerini içeren bir nesne
Borç veren Object Ödünç verenin TIN, Name, Address ve Telephone'unu içeren bir nesne
MortgageInterest Sayı Alacaklılardan/borç alanlardan alınan ipotek faizi tutarı (kutu 1) 1,234,567.89
OutstandingMortgagePrincipal Sayı Ödenmemiş ipotek anaparası (kutu 2) 1,234,567.89
MortgageOriginationDate Tarih konut kredisinin başlangıç tarihi (kutu 3) 2022-01-01
OverpaidInterestRefund Sayı Fazla ödenen faizin para iadesi tutarı (kutu 4) 1,234,567.89
MortgageInsurancePremium Sayı ipotek sigortası prim tutarı (kutu 5) 1,234,567.89
PointsPaid Sayı Ana konağın satın alınmasıyla ödenen puanlar (Kutu 6) 1,234,567.89
IsPropertyAddressSameAsBorrower String Konut kredisini güvence altına alan özelliğin adresi, alacaklının/ödünç alanın posta adresiyle aynı mı (kutu 7) true
PropertyAddress String Konut kredisini güvenli hale getirme özelliğinin adresi veya açıklaması (kutu 8) 123 Main St., Redmond WA 98052
MortgagedPropertiesCount Sayı ipotekli mülk sayısı (kutu 9) 1
Diğer String Ödemeye rapor vermek için ek bilgiler (kutu 10)
RealEstateTax Sayı Emlak vergisi (kutu 1) 1,234,567.89
AdditionalAssessment String Özelliğinde yapılan değerlendirmeler eklendi (kutu 10) 1,234,567.89
MortgageAcquisitionDate tarih ipotek alım tarihi (kutu 11) 2022-01-01

Alan ayıklama 1099-NEC

Aşağıda, JSON çıkış yanıtında 1099-nec vergi formundan ayıklanan alanlar yer alır. 1099'un diğer varyasyonları da desteklenir.

Adı Tür Açıklama Örnek çıkış
TaxYear String Vergi Yılı, Form 1099-NEC'den ayıklandı. 2021
Payer Object Payerin TIN, Name, Address ve Telefon Number'ını içeren bir nesne
Recipient Object Alıcının TIN, Name, Address ve AccountNumber değerlerini içeren bir nesne
Box1 Numara Kutu 1, Form 1099-NEC'den ayıklandı. 123456
Box2 boolean Kutu 2, Form 1099-NEC'den ayıklandı. true
Box4 Numara Kutu 4, Form 1099-NEC'den ayıklandı. 123456
StateTaxesWithheld dizi Form 1099-NEC'den ayıklanan Devlet Vergileri (kutu 5, 6 ve 7)

Alan ayıklama 1040 vergi formu

Aşağıda, JSON çıktı yanıtında 1040 vergi formundan ayıklanan alanlar yer alır. 1040'ın diğer varyasyonları da desteklenir.

Adı Tür Açıklama Örnek çıkış
TaxPayer Object Vergi mükellefinin SSN, Soyadı ve Adres gibi bilgilerini içeren bir nesne
Spouse Object Eşin SSN, soyadı, ad ve baş harf Adı gibi bilgilerini içeren bir nesne
Dependents dizi Ad, SSN ve Kredi Türü gibi bilgiler de dahil olmak üzere bağımlıların listesini içeren bir dizi
ThirdPartyDesignee nesne Üçüncü taraf tasarım öğesi hakkında bilgi içeren bir nesne
SignatureDetails nesne İmzalayan kişi hakkında telefon numaraları ve e-postalar gibi bilgiler içeren bir nesne
PaidPreparer nesne Hazırlayıcı hakkında bilgi içeren bir nesne.
FillingStatus String Değer noSelection, single, marriedFilingJointly, marriedFillingSeparately, headOfHousehold, qualifyingSurvivingSpouse veya multiSelection olabilir. single
FilingStatusDetails nesne Dosyalama durumu hakkında bilgi içeren bir nesne.
NameOfSpouseOrQualifyingPerson String Form 1040'tan çıkarılan eş veya uygun kişinin adı. John Smith
PresidentialElectionCampaign String Değer noSelection, vergi mükellefi, eş veya multiSelection olabilir. Vergi mükellefi
PresidentialElectionCampaignDetails nesne Başkanlık seçim kampanyasıyla ilgili ayrıntıları içeren bir nesne.
DigitalAssets String Değer noSelection, evet, hayır veya multiSelection olabilir. evet
DigitalAssetsDetails nesne Dijital varlıklar hakkındaki ayrıntıları içeren bir nesne.
ClaimStatus String Değer noSelection, taxpayerAsDependent, eşiAsDependent, eşiItemizesSeparatelyOrDualStatusAlien veya multiSelection olabilir. taxpayerAsDependent
ClaimStatusDetails nesne Talep durumuyla ilgili ayrıntıları içeren bir nesne.
TaxpayerAgeBlindness String Değer noSelection, above64, blind veya multiSelection'lardan biri olabilir. above64
TaxPayerAgeBlindnessDetails nesne Vergi mükellefi yaş körlüğü hakkındaki ayrıntıları içeren bir nesne.
SpouseAgeBlindness String Değer noSelection, above64, blind veya multiSelection'lardan biri olabilir. above64
TaxPayerAgeBlindnessDetails nesne Eşin yaş körlüğüyle ilgili ayrıntıları içeren bir nesne.
MoreThanFourDependents boolean Form 1040'tan ayıklanan Dörtten Fazla Bağımlı. true
Box1a Numara Kutu 1a 1040'tan ayıklandı. 123456
Sağlanan JSON yapısına bağlı olarak ve istenen tablo biçimine dönüştürüldüğünde, sonuç aşağıdaki gibidir:
Box1b Numara Kutu 1b 1040'tan ayıklandı. 123456
Box1c Numara Kutu 1c 1040'tan ayıklandı. 123456
Box1d Numara Kutu 1d 1040'tan ayıklandı. 123456
Box1e Numara Kutu 1e 1040'tan ayıklandı. 123456
Box1f Numara Kutu 1f 1040'tan ayıklandı. 123456
Box1g Numara Kutu 1g 1040'tan ayıklandı. 123456
Box1h Numara Kutu 1h 1040'tan ayıklandı. 123456
Box1i Numara Kutu 1i 1040'tan ayıklandı. 123456
Box1z Numara Kutu 1z 1040'tan ayıklandı. 123456
Box2a Numara Kutu 2a 1040'tan ayıklandı. 123456
Box2b Numara Kutu 2b 1040'tan ayıklandı. 123456
Box3a Numara Kutu 3a 1040'tan ayıklandı. 123456
Box3b Numara Kutu 3b 1040'tan ayıklandı. 123456
Box4a Numara Kutu 4a 1040'tan ayıklandı. 123456
Box4b Numara Kutu 4b 1040'tan ayıklandı. 123456
Box5a Numara Kutu 5a 1040'tan ayıklandı. 123456
Box5b Numara Kutu 5b 1040'tan ayıklandı. 123456
Box6a Numara Kutu 6a 1040'tan ayıklandı. 123456
Box6b Numara Kutu 6b 1040'tan ayıklandı. 123456
Box6cCheckbox boolean 1040'tan ayıklanan Kutu 6c Onay Kutusu. true
Box7Checkbox boolean 1040'tan ayıklanan Kutu 7 Onay Kutusu. true
Box7 Numara Kutu 7, 1040'tan ayıklandı. 123456
Box8 Numara Box 8, 1040'tan ayıklandı. 123456
Box9 Numara Box 9, 1040'tan ayıklandı. 123456
Box10 Numara Kutu 10, 1040'tan ayıklandı. 123456
Box11 Numara Kutu 11, 1040'tan ayıklandı. 123456
Box12 Numara Kutu 12, 1040'tan ayıklandı. 123456
Box13 Numara Kutu 13, 1040'tan ayıklandı. 123456
Box14 Numara Kutu 14, 1040'tan ayıklandı. 123456
Box15 Numara Kutu 15, 1040'tan ayıklandı. 123456
Box16FromForm Dize Değer noSelection, 8814, 4972, diğer veya multiSelection'lardan biri olabilir. 8814
Box16FromFormDetails nesne Box 16 hakkındaki ayrıntıları içeren nesne
Box16OtherFormNumber Dize Kutu 16 1040'tan ayıklanan Diğer Form Numarası. 8888
Box16 Numara Kutu 16, 1040'tan ayıklandı. 123456
Box17 Numara Kutu 17, 1040'tan ayıklandı. 123456
Box18 Numara Kutu 18, 1040'tan ayıklandı. 123456
Box19 Numara Kutu 19, 1040'tan ayıklandı. 123456
Box20 Numara Kutu 20, 1040'tan ayıklandı. 123456
Box21 Numara Kutu 21, 1040'tan ayıklandı. 123456
Box22 Numara Kutu 22, 1040'tan ayıklandı. 123456
Box23 Numara Kutu 23, 1040'tan ayıklandı. 123456
Box24 Numara Kutu 24, 1040'tan ayıklandı. 123456
Box25a Numara Kutu 25a 1040'tan ayıklandı. 123456
Box25b Numara Kutu 25b 1040'tan ayıklandı. 123456
Box25c Numara Kutu 25c 1040'tan ayıklandı. 123456
Box25d Numara Kutu 25d 1040'tan ayıklandı. 123456
Box26 Numara Kutu 26, 1040'tan ayıklandı. 123456
Box27 Numara Kutu 27, 1040'tan ayıklandı. 123456
Box28 Numara Kutu 28, 1040'tan ayıklandı. 123456
Box29 Numara Kutu 29, 1040'tan ayıklandı. 123456
Box31 Numara Kutu 31, 1040'tan ayıklandı. 123456
Box32 Numara Kutu 32, 1040'tan ayıklandı. 123456
Box33 Numara Kutu 33, 1040'tan ayıklandı. 123456
Box34 Numara Kutu 34, 1040'tan ayıklandı. 123456
Box35Checkbox boolean 1040'tan ayıklanan Kutu 35 Onay Kutusu. true
Box35a Numara Kutu 35a 1040'tan ayıklandı. 123456
Box35b Numara Kutu 35b 1040'tan ayıklandı. 123456
Box35c Dize Değer noSelection, checking, savings veya multiSelection olabilir. denetleme
Box35cDetails nesne Box ile ilgili ayrıntıları içeren nesne 35c
Box35d Numara Kutu 35d 1040'tan ayıklandı. 123456
Box36 Numara Kutu 36, 1040'tan ayıklandı. 123456
Box37 Numara Kutu 37, 1040'tan ayıklandı. 123456
Box38 Numara Kutu 38, 1040'tan ayıklandı. 123456
HasAssignedThirdPartyDesignee Dize Değer noSelection, evet, hayır veya multiSelection olabilir. evet
HasAssignedThirdPartyDesigneeDetails nesne Atanan üçüncü taraf tasarım öğesi için seçilenler hakkında bilgi içeren nesne

Ayıklanan vergi belgeleri anahtar-değer çiftleri ve satır öğeleri JSON çıkışının bölümünde yer alır documentResults .

Sonraki adımlar