Belge Yönetim Bilgileri Kimliği belge modeli

Önemli

  • Document Intelligence genel önizleme sürümleri, etkin geliştirme aşamasında olan özelliklere erken erişim sağlar.
  • Genel Kullanılabilirlik (GA) öncesinde kullanıcı geri bildirimlerine göre özellikler, yaklaşımlar ve süreçler değişebilir.
  • Belge Zekası istemci kitaplıklarının genel önizleme sürümü varsayılan olarak REST API sürüm 2024-02-29-preview'dır.
  • Genel önizleme sürümü 2024-02-29-preview şu anda yalnızca aşağıdaki Azure bölgelerinde kullanılabilir:
  • Doğu ABD
  • Batı ABD2
  • Batı Avrupa

Bu içerik şunlar için geçerlidir:Checkmarkv4.0 (önizleme) | Önceki sürümler:mavi onay işaretiv3.1 (GA)mavi onay işaretiv3.0 (GA)mavi onay işaretiv2.1 (GA)

Bu içerik:Checkmarkv3.1 (GA) | En son sürüm:mor onay işaretiv4.0 (önizleme) | Önceki sürümler:mavi onay işaretiv3.0mavi onay işaretiv2.1 için geçerlidir

Bu içerik:Checkmarkv3.0 (GA) | En son sürümler:mor onay işaretiv4.0 (önizleme)mor onay işaretiv3.1 | Önceki sürüm:mavi onay işaretiv2.1 için geçerlidir

Bu içerik:Checkmarkv2.1 | En son sürüm:mavi onay işaretiv4.0 (önizleme) için geçerlidir

Belge Zekası Kimliği belgesi (ID) modeli, kimlik belgelerindeki önemli bilgileri analiz etmek ve ayıklamak için Optik Karakter Tanıma (OCR) ile derin öğrenme modellerini birleştirir. API, kimlik belgelerini (aşağıdakiler dahil) analiz eder ve yapılandırılmış bir JSON veri gösterimi döndürür:

  • Dünya çapında pasaport defteri, pasaport kartı
  • Birleşik Devletler, Avrupa, Hindistan, Kanada ve Avustralya'dan sürücü belgesi
  • Birleşik Devletler kimlik kartları, oturma izni (yeşil kart), sosyal güvenlik kartı, askeri kimlik
  • Avrupa kimlik kartları, ikamet izinleri
  • Hindistan PAN kart, Aadhaar kart
  • Kanada kimlik kartları, ikamet izni (akçaağaç kartı)
  • Avustralya fotoğraf kartı, anahtar geçişi kimliği (dijital sürüm dahil)

Belge Zekası, önceden oluşturulmuş kimlik modelini kullanarak kamu tarafından verilen kimlik belgelerini (kimlikler) analiz edebilir ve bu belgelerden bilgi ayıklayabilir. Güçlü Optik Karakter Tanıma (OCR) özelliklerimizi kimlik tanıma özellikleriyle birleştirerek Dünya Çapında Pasaportlar ve ABD Sürücü Lisanslarından (50 eyaletin tamamı ve D.C.) önemli bilgileri ayıklar. Kimlikler API'si bu kimlik belgelerinden ad, soyadı, doğum tarihi, belge numarası ve daha fazlası gibi önemli bilgileri ayıklar. Bu API, Belge Zekası v2.1'de bulut hizmeti olarak kullanılabilir.

Kimlik belgesi işleme

Kimlik belgesi işleme, kimlik belgelerinden verileri el ile veya OCR tabanlı teknoloji kullanarak ayıklamayı içerir. Kimlik belgesi işleme, kimlik kanıtı gerektiren tüm iş operasyonlarında önemli bir adımdır. Örnek olarak bankalarda ve diğer finansal kurumlarda müşteri doğrulaması, ipotek uygulamaları, tıbbi ziyaretler, talep işleme, konaklama sektörü ve daha fazlası verilebilir. Kişiler ehliyetler, pasaportlar ve diğer benzer belgeler aracılığıyla kimliklerinin bazı kanıtlarını sağlar, böylece işletme hizmetleri ve avantajları sağlamadan önce bunları verimli bir şekilde doğrulayabilir.

Document Intelligence Studio ile işlenen örnek ABD Sürücü Lisansı

Örnek bir sürücü lisansının görüntüsü.

Veri ayıklama

Önceden oluşturulmuş kimlikler hizmeti, dünya çapındaki pasaportlardan ve ABD Sürücü Lisanslarından önemli değerleri ayıklar ve bunları düzenli bir yapılandırılmış JSON yanıtında döndürür.

Sürücü belgesi örneği

Örnek Sürücü Lisansı

Passport örneği

Örnek Passport

Dağıtım seçenekleri

Document Intelligence v4.0 (2024-02-29-preview, 2023-10-31-preview) aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar Model Kimliği
Kimlik belgesi modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

Document Intelligence v3.1 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar Model Kimliği
Kimlik belgesi modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

Document Intelligence v3.0 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar Model Kimliği
Kimlik belgesi modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

Document Intelligence v2.1 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özellik Kaynaklar
Kimlik belgesi modeli Belge Yönetim Bilgileri etiketleme aracı
REST API
İstemci kitaplığı SDK'sı
Belge Yönetim Bilgileri Docker kapsayıcısı

Giriş gereksinimleri

  • En iyi sonuçları elde için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.

  • Desteklenen dosya biçimleri:

    Model PDF Resim:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) ve HTML
    Okundu
    Düzen ✔ (2024-02-29-preview, 2023-10-31-preview)
    Genel Belge
    Önceden oluşturulmuş
    Özel ayıklama
    Özel sınıflandırma ✔ (2024-02-29-preview)
  • PDF ve TIFF için en fazla 2000 sayfa işlenebilir (ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir).

  • Belgeleri analiz etmek için dosya boyutu ücretli (S0) katman için 500 MB ve ücretsiz (F0) katmanı için 4 MB'tır.

  • Görüntü boyutları 50 x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.

  • PDF’leriniz parola korumalıysa göndermeden önce kilidi kaldırmanız gerekir.

  • Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, inç başına 150 nokta (DPI) olan yaklaşık 8noktalı metne karşılık gelir.

  • Özel model eğitimi için eğitim verileri için en fazla sayfa sayısı özel şablon modeli için 500, özel sinir modeli için 50.000'dir.

    • Özel ayıklama modeli eğitimi için eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve sinir modeli için 1G-MB'tır.

    • Özel sınıflandırma modeli eğitimi için eğitim verilerinin toplam boyutu en fazla 10.000 sayfadır 1GB .

  • Desteklenen dosya biçimleri: JPEG, PNG, PDF ve TIFF.

  • PDF ve TIFF dosyaları için desteklenen sayfa sayısı: 2.000 sayfaya kadar veya serbest katmanlı aboneler için yalnızca ilk iki sayfa.

  • Desteklenen dosya boyutu: TOPLAM 50 MB'tan az; minimum piksel: 50 x 50 piksel; maksimum piksel 10.000 x 10.000 piksel.

Kimlik belgesi modeli veri ayıklama

Kimlik belgelerinden ad, doğum tarihi ve son kullanma tarihi gibi verileri ayıklayın. Aşağıdaki kaynaklara ihtiyacınız vardır:

Azure portalında anahtarların ve uç nokta konumunun ekran görüntüsü.

Not

Document Intelligence Studio, v3.1 ve v3.0 API'leri ve sonraki sürümlerle kullanılabilir.

  1. Document Intelligence Studio giriş sayfasında Kimlik belgeleri'ni seçin.

  2. Örnek faturayı analiz edebilir veya kendi dosyalarınızı karşıya yükleyebilirsiniz.

  3. Analizi çalıştır düğmesini seçin ve gerekirse Çözümle seçeneklerini yapılandırın:

    Document Intelligence Studio'da Çözümlemeyi çalıştır ve Çözümle seçenekleri düğmelerinin ekran görüntüsü.

Belge Yönetim Bilgileri Örnek Etiketleme aracı

  1. Belge Yönetim Bilgileri Örnek Aracı'na gidin.

  2. Örnek araç giriş sayfasında, Veri almak için önceden oluşturulmuş modeli kullan kutucuğunu seçin.

    Düzen modeli sonuçları analiz etme işleminin ekran görüntüsü.

  3. Açılan menüden analiz etmek için Form Türü'nü seçin.

  4. Aşağıdaki seçeneklerden analiz etmek istediğiniz dosya için bir URL seçin:

  5. Kaynak alanında açılan menüden URL'yi seçin, seçili URL'yi yapıştırın ve Getir düğmesini seçin.

    Kaynak konumu açılan menüsünün ekran görüntüsü.

  6. Belge Yönetim Bilgileri hizmeti uç noktası alanına, Elde ettiğiniz uç noktayı Belge Yönetim Bilgileri aboneliğinizle yapıştırın.

  7. Anahtar alanına, Belge Yönetim Bilgileri kaynağınızdan aldığınız anahtarı yapıştırın.

    Belge türü seç açılan menüsünün ekran görüntüsü.

  8. Analizi çalıştır'ı seçin. Belge Yönetim Bilgileri Örnek Etiketleme aracı, Önceden Oluşturulmuş Api'yi Çözümle api'sini çağırır ve belgeyi analiz eder.

  9. Sonuçları görüntüleyin- ayıklanan anahtar-değer çiftlerine, satır öğelerine, ayıklanan vurgulanmış metne ve algılanan tablolara bakın.

    Kimlik modeli sonuçları analiz etme işleminin ekran görüntüsü.

  10. Ayrıntılı sonuçları görüntülemek için JSON çıkış dosyasını indirin.

    • "readResults" düğümü, sayfada ilgili sınırlayıcı kutu yerleşimine sahip her metin satırını içerir.
    • "selectionMarks" düğümü her seçim işaretini (onay kutusu, radyo işareti) ve durumunun seçili mi yoksa seçilmemiş mi olduğunu gösterir.
    • "pageResults" bölümü ayıklanan tabloları içerir. Belge Yönetim Bilgileri her tablo için metin, satır ve sütun dizini, yayılan satır ve sütun, sınırlayıcı kutu ve daha fazlasını ayıklar.
    • "documentResults" alanı, belgenin en ilgili bölümleri için anahtar/değer çiftleri bilgilerini ve satır öğeleri bilgilerini içerir.

Not

Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Bu, Belge Yönetim Bilgileri Hizmeti'nin değil aracın bir sınırlamasıdır.

Desteklenen belge türleri

Bölge Belge türleri
Dünya Pasaport Defteri, Pasaport Kartı
Birleşik Devletler Sürücü Belgesi, Kimlik Kartı, İkamet İzni (Yeşil kart), Sosyal Güvenlik Kartı, Askeri Kimlik
Avrupa Sürücü Belgesi, Kimlik Kartı, İkamet İzni
Hindistan Sürücü Belgesi, PAN Kartı, Aadhaar Kartı
Kanada Sürücü Belgesi, Kimlik Kartı, İkamet İzni (Akçaağaç Kartı)
Avustralya Sürücü Lisansı, Fotoğraf Kartı, Anahtar geçişi kimliği (dijital sürüm dahil)

Alan ayıklamaları

Belge türü başına ayıklanan alanlar aşağıdadır. Belge Yönetim Bilgileri Kimliği modeli prebuilt-idDocument içinde documents.*.fieldsaşağıdaki alanları ayıklar. JSON çıktısı, belgelerde, sözcüklerde, satırlarda ve stillerde ayıklanan tüm metni içerir.

idDocument.driverLicense

Alan Tür Açıklama Örnek
CountryRegion countryRegion Ülke veya bölge kodu ABD
Region string Eyalet veya bölge Washington
DocumentNumber string Sürücü belgesi numarası WDLABCD456DG
DocumentDiscriminator string Sürücü belgesi ayrımcı 12645646464554646456464544
FirstName string Varsa verilen ad ve ikinci baş harf LIAM R.
LastName string Surname TAŞ
Address address Adres 123 SOKAK ADRESİ ŞEHİr WA 99999-1234
DateOfBirth date Doğum tarihi 01/06/1958
DateOfExpiration date Son kullanma tarihi 08/12/2020
DateOfIssue date Düzenleme tarihi 08/12/2012
EyeColor string Göz rengi Mavi
HairColor string Saç rengi Kahverengi
Height string Height 5'11"
Weight string Weight 185LB
Sex string Cinsiyet M
Endorsements string Onaylar L
Restrictions string Kısıtlamalar K
VehicleClassifications string Araç sınıflandırması D

idDocument.passport

Alan Tür Açıklama Örnek
DocumentNumber string Pasaport numarası 340020013
FirstName string Varsa verilen ad ve ikinci baş harf JENNIFER
MiddleName string Verilen ad ve soyadı arasındaki ad REYES
LastName string Surname BROOKS
Aliases array
Aliases.* string Olarak da bilinir MAT LIN
DateOfBirth date Doğum tarihi 01.01.1980
DateOfExpiration date Son kullanma tarihi 2019-05-05
DateOfIssue date Düzenleme tarihi 2014-05-06
Sex string Cinsiyet F
CountryRegion countryRegion Veren ülke veya kuruluş ABD
DocumentType string Document type P
Nationality countryRegion Uyruk ABD
PlaceOfBirth string Doğum yeri MASSACHUSETTS, ABD
PlaceOfIssue string Sorunun yeri LİZBON
IssuingAuthority string Veren yetkili Birleşik Devletler Dışişleri Bakanlığı
PersonalNumber string Kişisel Kimlik. Hayır A234567893
MachineReadableZone object Makine tarafından okunabilir bölge (MRZ) P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816
MachineReadableZone.FirstName string Varsa verilen ad ve ikinci baş harf JENNIFER
MachineReadableZone.LastName string Surname BROOKS
MachineReadableZone.DocumentNumber string Pasaport numarası 340020013
MachineReadableZone.CountryRegion countryRegion Veren ülke veya kuruluş ABD
MachineReadableZone.Nationality countryRegion Uyruk ABD
MachineReadableZone.DateOfBirth date Doğum tarihi 01.01.1980
MachineReadableZone.DateOfExpiration date Son kullanma tarihi 2019-05-05
MachineReadableZone.Sex string Cinsiyet F

idDocument.nationalIdentityCard

Alan Tür Açıklama Örnek
CountryRegion countryRegion Ülke veya bölge kodu ABD
Region string Eyalet veya bölge Washington
DocumentNumber string Ulusal kimlik kartı numarası WDLABCD456DG
DocumentDiscriminator string Ulusal kimlik kartı belge ayrımcı 12645646464554646456464544
FirstName string Varsa verilen ad ve ikinci baş harf LIAM R.
LastName string Surname TAŞ
Address address Adres 123 SOKAK ADRESİ ŞEHİr WA 99999-1234
DateOfBirth date Doğum tarihi 01/06/1958
DateOfExpiration date Son kullanma tarihi 08/12/2020
DateOfIssue date Düzenleme tarihi 08/12/2012
EyeColor string Göz rengi MAVİ
HairColor string Saç rengi KAHVERENGİ
Height string Height 5'11"
Weight string Weight 185LB
Sex string Cinsiyet M

idDocument.residencePermit

Alan Tür Açıklama Örnek
CountryRegion countryRegion Ülke veya bölge kodu ABD
DocumentNumber string İkamet izni numarası WDLABCD456DG
FirstName string Varsa verilen ad ve ikinci baş harf LIAM R.
LastName string Surname TAŞ
DateOfBirth date Doğum tarihi 01/06/1958
DateOfExpiration date Son kullanma tarihi 08/12/2020
DateOfIssue date Düzenleme tarihi 08/12/2012
Sex string Cinsiyet M
PlaceOfBirth string Doğum yeri Almanya
Category string İzin kategorisi DV2
Address string Adres 123 SOKAK ADRESİ ŞEHİr WA 99999-1234

idDocument.usSocialSecurityCard

Alan Tür Açıklama Örnek
DocumentNumber string Sosyal güvenlik kartı numarası WDLABCD456DG
FirstName string Varsa verilen ad ve ikinci baş harf LIAM R.
LastName string Surname TAŞ
DateOfIssue date Düzenleme tarihi 08/12/2012

idDocument

Alan Tür Açıklama Örnek
Address address Adres 123 SOKAK ADRESİ ŞEHİr WA 99999-1234
DocumentNumber string Sürücü belgesi numarası WDLABCD456DG
FirstName string Varsa verilen ad ve ikinci baş harf LIAM R.
LastName string Surname TAŞ
DateOfBirth date Doğum tarihi 01/06/1958
DateOfExpiration date Son kullanma tarihi 08/12/2020

Desteklenen belge türleri

Kimlik belgesi modeli şu anda ABD sürücü lisanslarını ve uluslararası pasaportlardan (vize ve diğer seyahat belgeleri hariç) çıkarma biyografi sayfasını destekler.

Ayıklanan alanlar

Adı Tür Açıklama Değer
Country ülke ISO 3166 standardıyla uyumlu ülke kodu "ABD"
DateOfBirth tarih YYYY-AA-GG biçiminde DOB "1980-01-01"
DateOfExpiration tarih YYYY-AA-GG biçiminde son kullanma tarihi "2019-05-05"
DocumentNumber Dize İlgili pasaport numarası, ehliyet numarası vb. "340020013"
FirstName Dize Varsa verilen ad ve ikinci baş harf ayıklandı "JENNIFER"
LastName Dize Ayıklanan soyadı "BROOKS"
Uyruk ülke ISO 3166 standardıyla uyumlu ülke kodu "ABD"
Cinsiyet cinsiyet Ayıklanan olası değerler şunlardır: "M" "F" "X" "F"
MachineReadableZone nesne Her biri 44 karakterden oluşan iki satır içeren ayıklanmış Passport MRZ "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
DocumentType Dize Belge türü, örneğin, Passport, Sürücü Lisansı "Pasaport"
Adres Dize Ayıklanan adres (yalnızca Sürücü Lisansı) "123 SOKAK ADRESİ ŞEHİr WA 99999-1234"
Bölge Dize Ayıklanan bölge, eyalet, il vb. (Yalnızca Sürücü Lisansı) "Washington"

Geçiş kılavuzu

  • Uygulamalarınızda ve iş akışlarınızda v3.0 sürümünü kullanmayı öğrenmek için Belge Zekası v3.1 geçiş kılavuzumuzu izleyin.

Sonraki adımlar