Model dokumen ID Kecerdasan Dokumen
Penting
- Rilis pratinjau publik Kecerdasan Dokumen menyediakan akses awal ke fitur yang sedang dalam pengembangan aktif.
- Fitur, pendekatan, dan proses dapat berubah, sebelum Ketersediaan Umum (GA), berdasarkan umpan balik pengguna.
- Versi pratinjau publik pustaka klien Kecerdasan Dokumen default ke REST API versi 2024-02-29-preview.
- Pratinjau publik versi 2024-02-29-preview saat ini hanya tersedia di wilayah Azure berikut:
- US Timur
- US Barat2
- Eropa Barat
Konten ini berlaku untuk: v4.0 (pratinjau) | Versi sebelumnya: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Konten ini berlaku untuk: v3.1 (GA) | Versi terbaru: v4.0 (pratinjau) | Versi sebelumnya: v3.0 v2.1
Konten ini berlaku untuk: v3.0 (GA) | Versi terbaru: v4.0 (pratinjau) v3.1 | Versi sebelumnya: v2.1
Konten ini berlaku untuk: v2.1 | Versi terbaru: v4.0 (pratinjau)
Model Dokumen Identitas Kecerdasan Dokumen (ID) menggabungkan Pengenalan Karakter Optik (OCR) dengan model pembelajaran mendalam untuk menganalisis dan mengekstrak informasi utama dari dokumen identitas. API menganalisis dokumen identitas (termasuk yang berikut) dan mengembalikan representasi data JSON terstruktur:
- Buku paspor, kartu paspor di seluruh dunia
- SURAT IZIN MENGEMUDI dari Amerika Serikat, Eropa, India, Kanada, dan Australia
- Amerika Serikat kartu identifikasi, izin residensi (kartu hijau), kartu jaminan sosial, ID militer
- Kartu identifikasi Eropa, izin residensi
- Kartu PAN India, kartu Aadhaar
- Kartu identifikasi Kanada, izin residensi (kartu maple)
- Kartu foto Australia, ID kunci-pass (termasuk versi digital)
Kecerdasan Dokumen dapat menganalisis dan mengekstrak informasi dari dokumen identifikasi (ID) yang dikeluarkan pemerintah menggunakan model ID bawaannya. Ini menggabungkan kemampuan Optical Character Recognition (OCR) kami yang canggih dengan kemampuan pengenalan ID untuk mengekstrak informasi utama dari Paspor di Seluruh Dunia dan SIM AS (semua 50 negara bagian dan D.C.). ID API mengekstrak informasi utama dari dokumen identitas ini, seperti nama depan, nama keluarga, tanggal lahir, nomor dokumen, dan banyak lagi. API ini tersedia di Kecerdasan Dokumen v2.1 sebagai layanan cloud.
Pemrosesan dokumen identitas
Pemrosesan dokumen identitas melibatkan ekstraksi data dari dokumen identitas baik secara manual atau dengan menggunakan teknologi berbasis OCR. Pemrosesan dokumen ID adalah langkah penting dalam operasi bisnis apa pun yang memerlukan bukti identitas. Contohnya termasuk verifikasi pelanggan di bank dan lembaga keuangan lainnya, aplikasi hipotek, kunjungan medis, pemrosesan klaim, industri perhotelan, dan banyak lagi. Individu memberikan beberapa bukti identitas mereka melalui SIM, paspor, dan dokumen serupa lainnya sehingga bisnis dapat memverifikasinya secara efisien sebelum memberikan layanan dan manfaat.
Contoh SIM A.S. yang diproses dengan Document Intelligence Studio
Ekstraksi data
Layanan ID bawaan mengekstrak nilai-nilai utama dari paspor di seluruh dunia dan SIM AS serta mengembalikannya dalam respons JSON terstruktur yang terkelola.
Contoh SIM
Contoh paspor
Opsi pengembangan
Kecerdasan Dokumen v4.0 (2024-02-29-preview, 2023-10-31-preview) mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber | ID Model |
---|---|---|
Model dokumen ID | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
Kecerdasan Dokumen v3.1 mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber | ID Model |
---|---|---|
Model dokumen ID | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
Kecerdasan Dokumen v3.0 mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber | ID Model |
---|---|---|
Model dokumen ID | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
Kecerdasan Dokumen v2.1 mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber |
---|---|
Model dokumen ID | • Alat pelabelan Kecerdasan Dokumen• REST API • SDK pustaka klien• Kontainer Docker Kecerdasan Dokumen |
Persyaratan input
Untuk hasil terbaik, berikan satu foto yang jelas atau pemindaian berkualitas tinggi per dokumen.
Format file yang didukung:
Model PDF Gambar:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), dan HTMLRead ✔ ✔ ✔ Tata letak ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Dokumen Umum ✔ ✔ Bawaan ✔ ✔ Ekstraksi kustom ✔ ✔ Klasifikasi kustom ✔ ✔ ✔ (Pratinjau 2024-02-29) Untuk PDF dan TIFF, hingga 2000 halaman yang dapat diproses (dengan langganan tingkat gratis, hanya dua halaman pertama yang diproses).
Ukuran file untuk menganalisis dokumen adalah 500 MB untuk tingkat berbayar (S0) dan 4 MB secara gratis (F0).
Dimensi gambar harus antara 50 x 50 piksel dan 10.000 piksel x 10.000 piksel.
Jika PDF Anda dikunci dengan kata sandi, Anda harus menghapus kunci sebelum pengiriman.
Tinggi minimum teks yang akan diekstrak adalah 12 piksel untuk gambar piksel 1024 x 768. Dimensi ini sesuai dengan teks sekitar
8
-point pada 150 titik per inci (DPI).Untuk pelatihan model kustom, jumlah maksimum halaman untuk data pelatihan adalah 500 untuk model template kustom dan 50.000 untuk model neural kustom.
Untuk pelatihan model ekstraksi kustom, ukuran total data pelatihan adalah 50 MB untuk model templat dan 1G-MB untuk model neural.
Untuk pelatihan model klasifikasi kustom, ukuran total data pelatihan adalah
1GB
dengan maksimum 10.000 halaman.
Format file yang didukung: JPEG, PNG, PDF, dan TIFF.
Jumlah halaman yang didukung untuk file PDF dan TIFF: hingga 2.000 halaman atau hanya dua halaman pertama untuk pelanggan tingkat gratis.
Ukuran file yang didukung: kurang dari 50 MB TOTAL; piksel minimum: 50 x 50 px; piksel maksimum 10.000 x 10.000 px.
Ekstraksi data model dokumen ID
Ekstrak data, termasuk nama, tanggal lahir, dan tanggal kedaluwarsa, dari dokumen ID. Anda membutuhkan sumber daya berikut:
Langganan Azure—Anda dapat membuatnya secara gratis.
Instans Kecerdasan Dokumen di portal Azure. Anda dapat menggunakan tingkat harga gratis (
F0
) untuk mencoba layanan. Setelah sumber daya Anda disebarkan, pilih Buka sumber daya untuk mendapatkan kunci dan titik akhir Anda.
Catatan
Document Intelligence Studio tersedia dengan API v3.1 dan v3.0 dan versi yang lebih baru.
Pada beranda Studio Kecerdasan Dokumen, pilih Dokumen identitas.
Anda dapat menganalisis faktur sampel atau mengunggah file Anda sendiri.
Pilih tombol Jalankan analisis dan, jika perlu, konfigurasikan opsi Analisis:
Coba Studio Kecerdasan Dokumen.
Alat Pelabelan Sampel Kecerdasan Dokumen
Navigasikan ke Alat Sampel Kecerdasan Dokumen.
Pada beranda alat sampel, pilih gunakan model bawaan untuk mendapatkan petak data .
Pilih Jenis Formulir untuk dianalisis dari menu dropdown.
Pilih URL untuk {i>file
Pada bidang Sumber, pilih URL dari menu drop down, tempel URL yang dipilih, dan pilih tombol Ambil.
Di bidang titik akhir layanan Inteligensi Dokumen, tempelkan titik akhir yang Anda peroleh dengan langganan Kecerdasan Dokumen Anda.
Di bidang kunci, tempelkan kunci yang Anda peroleh dari sumber daya Kecerdasan Dokumen Anda.
Pilih Jalankan analisis. Alat Pelabelan Sampel Kecerdasan Dokumen memanggil API Analisis Bawaan dan menganalisis dokumen.
Lihat hasilnya - lihat pasangan kunci-nilai yang diekstrak, item baris, teks yang disorot diekstrak, dan tabel terdeteksi.
Unduh {i>file output
- Simpul "readResults" berisi setiap baris teks dengan penempatan kotak pembatasnya masing-masing pada halaman.
- Simpul "selectionMarks" memperlihatkan setiap tanda pilihan (kotak centang, tanda radio) dan apakah statusnya dipilih atau tidak dipilih.
- Bagian "pageResults" mencakup tabel yang diekstrak. Untuk setiap tabel, Kecerdasan Dokumen mengekstrak indeks teks, baris, dan kolom, rentang baris dan kolom, kotak pembatas, dan lainnya.
- Bidang "documentResults" berisi informasi pasangan kunci/nilai dan informasi item baris untuk bagian dokumen yang paling relevan.
Catatan
Alat pelabelan sampel tidak mendukung format file BMP. Ini adalah batasan alat bukan Document Intelligence Service.
Jenis dokumen yang didukung
Wilayah | Jenis dokumen |
---|---|
Di seluruh dunia | Buku Paspor, Kartu Paspor |
Amerika Serikat | SIM, Kartu Identifikasi, Izin Tinggal (Kartu Hijau), Kartu Jaminan Sosial, KTP |
Eropa | SIM, Kartu Identifikasi, Izin Tinggal |
India | SIM, Kartu PAN, Kartu Aadhaar |
Kanada | SIM, Kartu Identifikasi, Izin Tinggal (Kartu Maple) |
Australia | SIM, Kartu Foto, ID Key-pass (termasuk versi digital) |
Ekstraksi bidang
Berikut ini adalah bidang yang diekstrak per jenis dokumen. Model prebuilt-idDocument
ID Kecerdasan Dokumen mengekstrak bidang berikut di documents.*.fields
. Output json mencakup semua teks yang diekstrak dalam dokumen, kata, baris, dan gaya.
idDocument.driverLicense
Bidang | Jenis | Deskripsi | Contoh |
---|---|---|---|
CountryRegion |
countryRegion |
Kode negara atau wilayah | AS |
Region |
string |
Negara bagian atau provinsi | Washington |
DocumentNumber |
string |
Nomor surat izin mengemudi | WDLABCD456DG |
DocumentDiscriminator |
string |
Diskriminator dokumen SIM | 12645646464554646456464544 |
FirstName |
string |
Nama yang diberikan dan inisial tengah jika berlaku | LIAM R. |
LastName |
string |
Nama Belakang | TALBOT |
Address |
address |
Alamat | 123 ALAMAT JALAN KOTA ANDA WA 99999-1234 |
DateOfBirth |
date |
Tanggal lahir | 01/06/1958 |
DateOfExpiration |
date |
Tanggal kedaluwarsa | 08/12/2020 |
DateOfIssue |
date |
Tanggal masalah | 08/12/2012 |
EyeColor |
string |
Warna mata | Biru |
HairColor |
string |
Warna rambut | Cokelat |
Height |
string |
Height | 5'11" |
Weight |
string |
Beban | 185LB |
Sex |
string |
Jenis Kelamin | M |
Endorsements |
string |
Dukungan | L |
Restrictions |
string |
Batasan | B |
VehicleClassifications |
string |
Klasifikasi kendaraan | D |
idDocument.passport
Bidang | Jenis | Deskripsi | Contoh |
---|---|---|---|
DocumentNumber |
string |
Nomor paspor | 340020013 |
FirstName |
string |
Nama yang diberikan dan inisial tengah jika berlaku | JENNIFER |
MiddleName |
string |
Nama antara nama yang diberikan dan nama keluarga | REYES |
LastName |
string |
Nama Belakang | BROOKS |
Aliases |
array |
||
Aliases.* |
string |
Juga disebut | LIN TIANG |
DateOfBirth |
date |
Tanggal lahir | 1980-01-01 |
DateOfExpiration |
date |
Tanggal kedaluwarsa | 2019-05-05 |
DateOfIssue |
date |
Tanggal masalah | 2014-05-06 |
Sex |
string |
Jenis Kelamin | F |
CountryRegion |
countryRegion |
Mengeluarkan negara atau organisasi | AS |
DocumentType |
string |
Jenis dokumen | P |
Nationality |
countryRegion |
Kebangsaan | AS |
PlaceOfBirth |
string |
Tempat kelahiran | MASSACHUSETTS, A.S.A. |
PlaceOfIssue |
string |
Tempat masalah | LISBON |
IssuingAuthority |
string |
Otoritas penerbit | Departemen Luar Negeri Amerika Serikat |
PersonalNumber |
string |
ID Pribadi. Tidak. | A234567893 |
MachineReadableZone |
object |
Zona yang dapat dibaca mesin (MRZ) | P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816 |
MachineReadableZone.FirstName |
string |
Nama yang diberikan dan inisial tengah jika berlaku | JENNIFER |
MachineReadableZone.LastName |
string |
Nama Belakang | BROOKS |
MachineReadableZone.DocumentNumber |
string |
Nomor paspor | 340020013 |
MachineReadableZone.CountryRegion |
countryRegion |
Mengeluarkan negara atau organisasi | AS |
MachineReadableZone.Nationality |
countryRegion |
Kebangsaan | AS |
MachineReadableZone.DateOfBirth |
date |
Tanggal lahir | 1980-01-01 |
MachineReadableZone.DateOfExpiration |
date |
Tanggal kedaluwarsa | 2019-05-05 |
MachineReadableZone.Sex |
string |
Jenis Kelamin | F |
idDocument.nationalIdentityCard
Bidang | Jenis | Deskripsi | Contoh |
---|---|---|---|
CountryRegion |
countryRegion |
Kode negara atau wilayah | AS |
Region |
string |
Negara bagian atau provinsi | Washington |
DocumentNumber |
string |
Nomor kartu identitas nasional | WDLABCD456DG |
DocumentDiscriminator |
string |
Diskriminator dokumen kartu identitas nasional | 12645646464554646456464544 |
FirstName |
string |
Nama yang diberikan dan inisial tengah jika berlaku | LIAM R. |
LastName |
string |
Nama Belakang | TALBOT |
Address |
address |
Alamat | 123 ALAMAT JALAN KOTA ANDA WA 99999-1234 |
DateOfBirth |
date |
Tanggal lahir | 01/06/1958 |
DateOfExpiration |
date |
Tanggal kedaluwarsa | 08/12/2020 |
DateOfIssue |
date |
Tanggal masalah | 08/12/2012 |
EyeColor |
string |
Warna mata | BIRU |
HairColor |
string |
Warna rambut | COKLAT |
Height |
string |
Height | 5'11" |
Weight |
string |
Beban | 185LB |
Sex |
string |
Jenis Kelamin | M |
idDocument.residencePermit
Bidang | Jenis | Deskripsi | Contoh |
---|---|---|---|
CountryRegion |
countryRegion |
Kode negara atau wilayah | AS |
DocumentNumber |
string |
Nomor izin tinggal | WDLABCD456DG |
FirstName |
string |
Nama yang diberikan dan inisial tengah jika berlaku | LIAM R. |
LastName |
string |
Nama Belakang | TALBOT |
DateOfBirth |
date |
Tanggal lahir | 01/06/1958 |
DateOfExpiration |
date |
Tanggal kedaluwarsa | 08/12/2020 |
DateOfIssue |
date |
Tanggal masalah | 08/12/2012 |
Sex |
string |
Jenis Kelamin | M |
PlaceOfBirth |
string |
Tempat kelahiran | Jerman |
Category |
string |
Kategori izin | DV2 |
Address |
string |
Alamat | 123 ALAMAT JALAN KOTA ANDA WA 99999-1234 |
idDocument.usSocialSecurityCard
Bidang | Jenis | Deskripsi | Contoh |
---|---|---|---|
DocumentNumber |
string |
Nomor kartu jaminan sosial | WDLABCD456DG |
FirstName |
string |
Nama yang diberikan dan inisial tengah jika berlaku | LIAM R. |
LastName |
string |
Nama Belakang | TALBOT |
DateOfIssue |
date |
Tanggal masalah | 08/12/2012 |
idDocument
Bidang | Jenis | Deskripsi | Contoh |
---|---|---|---|
Address |
address |
Alamat | 123 ALAMAT JALAN KOTA ANDA WA 99999-1234 |
DocumentNumber |
string |
Nomor surat izin mengemudi | WDLABCD456DG |
FirstName |
string |
Nama yang diberikan dan inisial tengah jika berlaku | LIAM R. |
LastName |
string |
Nama Belakang | TALBOT |
DateOfBirth |
date |
Tanggal lahir | 01/06/1958 |
DateOfExpiration |
date |
Tanggal kedaluwarsa | 08/12/2020 |
Jenis dokumen yang didukung
Model dokumen ID saat ini mendukung SIM AS dan halaman biografis dari paspor internasional (tidak termasuk visa dan dokumen perjalanan lainnya).
Bidang diekstrak
Nama | Tipe | Deskripsi | Nilai |
---|---|---|---|
Negara | negara | Kode negara yang sesuai dengan standar ISO 3166 | "AS" |
DateOfBirth | date | Tanggal Lahir dalam format YYYY-MM-DD | "1980-01-01" |
DateOfExpiration | date | Tanggal kedaluwarsa dalam format YYYY-MM-DD | "2019-05-05" |
DocumentNumber | string | Nomor paspor yang relevan, nomor SIM, dll. | "340020013" |
FirstName | string | Nama pemberian diekstrak dan inisial tengah jika berlaku | "JENNIFER" |
LastName | string | Nama keluarga yang diekstrak | "BROOKS" |
Kebangsaan | negara | Kode negara yang sesuai dengan standar ISO 3166 | "AS" |
Jenis Kelamin | gender | Kemungkinan nilai yang diekstrak termasuk "M" "F" "X" | "F" |
MachineReadableZone | object | MRZ Paspor yang Diekstrak termasuk dua baris masing-masing 44 karakter | "P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816" |
DocumentType | string | Jenis dokumen, misalnya, Paspor, SIM | "passport" |
Alamat | string | Alamat yang diekstrak (hanya SIM) | "123 ALAMAT JALAN KOTA ANDA WA 99999-1234" |
Wilayah | string | Wilayah yang diekstrak, negara bagian, provinsi, dll. (Hanya SIM) | "Washington" |
Panduan migrasi
- Ikuti panduan migrasi Kecerdasan Dokumen v3.1 kami untuk mempelajari cara menggunakan versi v3.0 di aplikasi dan alur kerja Anda.
Langkah berikutnya
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk