Belge Zekası Kimliği belge modeli

Bu içerik için geçerlidir:onay işaretiv4.0 (GA) | Önceki sürümler:mavi onay işaretiv3.1 (GA)kırmızı onay işaretiv3.0 (kullanımdan kaldırılıyor)kırmızı onay işaretiv2.1 (kullanımdan kaldırılıyor)

::: moniker-end

Bu içerik şunlar için geçerlidir:onay işaretiv3.1 (GA) | En son sürüm:purple-checkmarkv4.0 (GA) | Önceki sürümler:blue-checkmarkv3.0blue-checkmarkv2.1

Bu içerik şunlar için geçerlidir:red-checkmarkv3.0 (kullanımdan kaldırılıyor) | Latest versions:purple-checkmarkv4.0 (GA)purple-checkmarkv3.1 | Önceki sürüm:blue-checkmarkv2.1 (kullanımdan kaldırılıyor)

Bu içerik için geçerlidir:red-checkmarkv2.1 | En son sürüm:blue-checkmarkv4.0 (GA)

Not

Önceden oluşturulmuş Kimlik belgesi (ID) modeli için Belge Zekası v4.0 2024-11-30 (GA) API'si artık Kuzey Amerika, Güney Amerika, Asya, Avrupa, Afrika ve Okyanusya genelinde genişletilmiş kapsam dahil olmak üzere dünya çapındaki tüm bölgelerdeki kimlik belgelerini destekliyor.

Belge Zekası Kimliği belgesi (ID) modeli, kimlik belgelerindeki önemli bilgileri analiz etmek ve ayıklamak için Optik Karakter Tanıma (OCR) ile derin öğrenme modellerini birleştirir. API, kimlik belgelerini (aşağıdakiler dahil) analiz eder ve yapılandırılmış bir JSON veri gösterimi döndürür.

Bölge Belge türleri
Dünya çap -ında Pasaport Defteri, Pasaport Kartı
Birleşik Devletler Sürücü Belgesi, Kimlik Kartı, İkamet İzni (Yeşil kart), Sosyal Güvenlik Kartı, Askeri Kimlik
Hindistan Sürücü Belgesi, PAN Kartı, Aadhaar Kartı
Avustralya Sürücü Lisansı, Fotoğraf Kartı, Anahtar Kartı Kimliği (dijital sürüm dahil)
Diğer Sürücü Belgesi, Kimlik Kartı, İkamet İzni

Belge Zekası, önceden oluşturulmuş kimlik modelini kullanarak kamu tarafından verilen kimlik belgelerini (kimlikler) analiz edebilir ve bu belgelerden bilgi ayıklayabilir. Güçlü Optik Karakter Tanıma (OCR) özelliklerimizi kimlik tanıma özellikleriyle birleştirerek Dünya Çapında Pasaportlar ve ABD Sürücü Lisanslarından (50 eyaletin tamamı ve D.C.) önemli bilgileri ayıklar. Kimlikler API'si bu kimlik belgelerinden ad, soyadı, doğum tarihi, belge numarası ve daha fazlası gibi önemli bilgileri ayıklar. Bu API, Belge Zekası v2.1'de bulut hizmeti olarak kullanılabilir.

Kimlik belgesi işleme

Kimlik belgesi işleme, kimlik belgelerinden verileri el ile veya OCR tabanlı teknoloji kullanarak ayıklamayı içerir. Kimlik belgesi işleme, kimlik kanıtı gerektiren tüm iş operasyonlarında önemli bir adımdır. Örnek olarak bankalarda ve diğer finansal kurumlarda müşteri doğrulaması, ipotek uygulamaları, tıbbi ziyaretler, talep işleme, konaklama sektörü ve daha fazlası verilebilir. Kişiler ehliyetler, pasaportlar ve diğer benzer belgeler aracılığıyla kimliklerinin bazı kanıtlarını sağlar, böylece işletme hizmetleri ve avantajları sağlamadan önce bunları verimli bir şekilde doğrulayabilir.

Document Intelligence Studio ile işlenen örnek ABD Sürücü Lisansı

Örnek bir sürücü lisansının görüntüsü.

Veri ayıklama

Önceden oluşturulmuş kimlikler hizmeti, dünya çapındaki pasaportlardan ve ABD Sürücü Lisanslarından önemli değerleri ayıklar ve bunları düzenli bir yapılandırılmış JSON yanıtında döndürür.

Sürücü belgesi örneği

Örnek Sürücü Lisansı

Passport örneği

Örnek Pasaport

Geliştirme seçenekleri

Belge Yönetim Bilgileri v4.0: 2024-11-30 (GA) aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özelliği Kaynak Model Kimliği
Kimlik belgesi modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

Document Intelligence v3.1 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özelliği Kaynak Model Kimliği
Kimlik belgesi modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

Document Intelligence v3.0 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özelliği Kaynak Model Kimliği
Kimlik belgesi modeli Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-idDocument

Document Intelligence v2.1 aşağıdaki araçları, uygulamaları ve kitaplıkları destekler:

Özelliği Kaynak
Kimlik belgesi modeli Belge Yönetim Bilgileri etiketleme aracı
REST API
İstemci kitaplığı SDK'sı
Belge Yönetim Bilgileri Docker kapsayıcısı

Giriş gereksinimleri

Aşağıdaki dosya biçimleri desteklenir.

Modeli PDF Resim:
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Okuma
Düzen
Genel belge
Önceden oluşturulmuş
Özel ayıklama
Özel sınıflandırma
  • Fotoğraflar ve taramalar: En iyi sonuçlar için belge başına tek bir net fotoğraf veya yüksek kaliteli tarama sağlayın.
  • PDF'ler ve TIFF'ler: PDF'ler ve TIFF'ler için en fazla 2.000 sayfa işlenebilir. (Ücretsiz katman aboneliğiyle yalnızca ilk iki sayfa işlenir.)
  • Dosya boyutu: Belgeleri analiz etmek için dosya boyutu ücretli (S0) katmanı için 500 MB ve ücretsiz (F0) katmanı için 4 MB'tır.
  • Görüntü boyutları: Boyutlar 50 piksel x 50 piksel ile 10.000 piksel x 10.000 piksel arasında olmalıdır.
  • Parola kilitleri: PDF'leriniz parola kilitliyse, göndermeden önce kilidi kaldırmanız gerekir.
  • Metin yüksekliği: Ayıklanacak metnin en düşük yüksekliği 1024 x 768 piksel görüntü için 12 pikseldir. Bu boyut, inç başına 150 nokta olan yaklaşık 8 noktalı metne karşılık gelir.
  • Özel model eğitimi: Eğitim verileri için en fazla sayfa sayısı, özel şablon modeli için 500 ve özel sinir modeli için 50.000'dir.
  • Özel ayıklama modeli eğitimi: Eğitim verilerinin toplam boyutu şablon modeli için 50 MB ve sinir modeli için 1 GB'tır.
  • Özel sınıflandırma modeli eğitimi: Eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile 1 GB'tır. 2024-11-30 (GA) için eğitim verilerinin toplam boyutu en fazla 10.000 sayfa ile 2 GB'tır.
  • Office dosya türleri (DOCX, XLSX, PPTX): En fazla dize uzunluğu sınırı 8 milyon karakterdir.
  • Desteklenen dosya biçimleri: JPEG, PNG, PDF ve TIFF.

  • PDF ve TIFF dosyaları için desteklenen sayfa sayısı: 2.000 sayfaya kadar veya serbest katmanlı aboneler için yalnızca ilk iki sayfa.

  • Desteklenen dosya boyutu: TOPLAM 50 MB'tan az; minimum piksel: 50 x 50 piksel; maksimum piksel 10.000 x 10.000 piksel.

Kimlik belgesi modeli veri ayıklama

Kimlik belgelerinden ad, doğum tarihi ve son kullanma tarihi gibi verileri ayıklayın. Aşağıdaki kaynaklara ihtiyacınız vardır:

  • Azure aboneliği: ücretsiz oluşturabilirsiniz.

  • Azure portalında Document Intelligence örneği. Hizmeti denemek için ücretsiz fiyatlandırma katmanını (F0) kullanabilirsiniz. Kaynağınız dağıtıldıktan sonra anahtarınızı ve uç noktanızı almak için Kaynağa git'i seçin.

 Azure portalında anahtarların ve uç nokta konumunun ekran görüntüsü.

Not

Document Intelligence Studio, v3.1 ve v3.0 API'leri ve sonraki sürümlerle kullanılabilir.

  1. Document Intelligence Studio giriş sayfasındaKimlik belgeleri'ni seçin.

  2. Örnek faturayı analiz edebilir veya kendi dosyalarınızı karşıya yükleyebilirsiniz.

  3. Analizi çalıştır düğmesini seçin ve gerekirse Çözümle seçeneklerini yapılandırın:

    Document Intelligence Studio'da Çözümlemeyi çalıştır ve Çözümle seçenekleri düğmelerinin ekran görüntüsü.

Belge Zekası Örnek Etiketleme Aracı

  1. Belge Zekası Örnek Aracı'na gidin.

  2. Örnek araç giriş sayfasında, Veri almak için önceden oluşturulmuş modeli kullan kutucuğunu seçin.

    Düzen modeli sonuçları analiz etme işleminin ekran görüntüsü.

  3. Açılan menüden analiz etmek için Form Türü'nü seçin.

  4. Aşağıdaki seçeneklerden analiz etmek istediğiniz dosya için bir URL seçin:

  5. Kaynak alanında açılan menüden URL'yi seçin, seçili URL'yi yapıştırın ve Getir düğmesini seçin.

    Kaynak konumu açılan menüsünün ekran görüntüsü.

  6. Belge Yönetim Bilgileri hizmeti uç noktası alanına, Elde ettiğiniz uç noktayı Belge Yönetim Bilgileri aboneliğinizle yapıştırın.

  7. Anahtar alanına, Belge Yönetim Bilgileri kaynağınızdan aldığınız anahtarı yapıştırın.

    Belge türü seç açılan menüsünün ekran görüntüsü.

  8. Analizi çalıştır'ı seçin. Belge Zekası Örnek Etiketleme aracı, Prebuilt Analyze API'sini çağırır ve belgeyi analiz eder.

  9. Sonuçları görüntüleyin- ayıklanan anahtar-değer çiftlerine, satır öğelerine, ayıklanan vurgulanmış metne ve algılanan tablolara bakın.

    Kimlik modeli sonuçları analiz etme işleminin ekran görüntüsü.

  10. Ayrıntılı sonuçları görüntülemek için JSON çıkış dosyasını indirin.

    • "readResults" düğümü, sayfadaki her metin satırını ve ilgili bağlayıcı kutu yerleşimini içerir.
    • "selectionMarks" düğümü her seçim işaretini (onay kutusu, radyo işareti) ve durumunun seçili mi yoksa seçilmemiş mi olduğunu gösterir.
    • "pageResults" bölümü ayıklanan tabloları içerir. Belge Zekası her tablo için metni, satır ve sütun dizinlerini, satır ve sütun kapsamını, dış çerçeveyi ve daha fazlasını ayıklar.
    • "documentResults" alanı, belgenin en ilgili bölümleri için anahtar/değer çiftleri bilgilerini ve satır öğeleri bilgilerini içerir.

Not

Örnek Etiketleme aracı BMP dosya biçimini desteklemez. Bu kısıtlama, Belge Yönetim Bilgileri Hizmeti'nin değil aracın bir sınırlamasıdır.

Alan çıkarımları

Desteklenen belge ayıklama alanları için GitHub örnek depomuzda yer alan ID belge modeli şeması sayfasını inceleyin.

Desteklenen belge türleri

Kimlik belgesi modeli şu anda ABD sürücü lisanslarının ve uluslararası pasaportların (vize ve diğer seyahat belgeleri hariç) kimlik bilgileri sayfasının çıkarılmasını destekler.

Çıkarılan alanlar

Adı Türü Açıklama Değer
Ülke Ülke ISO 3166 standardıyla uyumlu ülke kodu "ABD"
DoğumTarihi Tarih Doğum Tarihi YYYY-AA-GG biçiminde "1980-01-01"
Son Kullanma Tarihi Tarih YYYY-MM-DD biçiminde son kullanma tarihi "2019-05-05"
BelgeNumarası Dize İlgili pasaport numarası, ehliyet numarası vb. "340020013"
İsim Dize Varsa verilen ad ve ikinci baş harf ayıklandı "JENNIFER"
Soyadı Dize Ayıklanan soyadı "BROOKS"
Milliyet Ülke ISO 3166 standardıyla uyumlu ülke kodu "ABD"
Seks Cinsiyet Ayıklanan olası değerler şunlardır: "M" "F" "X" "F"
Makineyle Okunabilir Bölge Obje MRZ iki satırdan oluşan ayıklanmış pasaport, her biri 44 karakter. "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816"
Belge Türü Dize Belge türü, örneğin, Passport, Sürücü Lisansı Pasaport
Adres Dize Ayıklanan adres (sadece Sürücü Belgesi) "123 SOKAK ADRESİ ŞEHİr WA 99999-1234"
Bölge Dize Çıkarılan bölge, eyalet vb. (Yalnızca Sürücü Belgesi) "Washington"

Geçiş kılavuzu

Sonraki adımlar