Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Konten ini berlaku untuk:
v4.0 (GA) | Versi sebelumnya:
v3.1 (GA)
v3.0 (menghentikan)
v2.1 (menghentikan)
::: moniker-end
Konten ini berlaku untuk:
v3.0 (pensiun) | Versi terbaru:
v4.0 (GA)
v3.1 | Versi sebelumnya:
v2.1 (pensiun)
Konten ini berlaku untuk:
v2.1 | Versi terbaru:
v4.0 (GA)
Catatan
DOCUMENT Intelligence v4.0 2024-11-30 (GA) API untuk model dokumen Identitas (ID) bawaan sekarang mendukung dokumen identifikasi dari semua wilayah di seluruh dunia, termasuk cakupan yang diperluas di Amerika Utara, Amerika Selatan, Asia, Eropa, Afrika, dan Oseania.
Model Dokumen Identitas Kecerdasan Dokumen (ID) menggabungkan Pengenalan Karakter Optik (OCR) dengan model pembelajaran mendalam untuk menganalisis dan mengekstrak informasi utama dari dokumen identitas. API menganalisis dokumen identitas (termasuk yang berikut) dan mengembalikan representasi data JSON terstruktur.
| Wilayah | Jenis dokumen |
|---|---|
| Sedunia | Buku Paspor, Kartu Paspor |
| Amerika Serikat | SIM, Kartu Identifikasi, Izin Tinggal (Kartu Hijau), Kartu Jaminan Sosial, KTP |
| India | SIM, Kartu PAN, Kartu Aadhaar |
| Australia | SIM, Kartu Foto, ID Key-pass (termasuk versi digital) |
| Lain | SIM, Kartu Identifikasi, Izin Tinggal |
Kecerdasan Dokumen dapat menganalisis dan mengekstrak informasi dari dokumen identifikasi (ID) yang dikeluarkan pemerintah menggunakan model ID bawaannya. Ini menggabungkan kemampuan Optical Character Recognition (OCR) kami yang kuat dengan kemampuan pengenalan ID untuk mengekstrak informasi utama dari Paspor Di Seluruh Dunia dan SIM AS (semua 50 negara bagian dan D.C.). ID API mengekstrak informasi utama dari dokumen identitas ini, seperti nama depan, nama keluarga, tanggal lahir, nomor dokumen, dan banyak lagi. API ini tersedia di Kecerdasan Dokumen v2.1 sebagai layanan cloud.
Pemrosesan dokumen identitas
Pemrosesan dokumen identitas melibatkan ekstraksi data dari dokumen identitas baik secara manual atau dengan menggunakan teknologi berbasis OCR. Pemrosesan dokumen ID adalah langkah penting dalam operasi bisnis apa pun yang memerlukan bukti identitas. Contohnya termasuk verifikasi pelanggan di bank dan lembaga keuangan lainnya, aplikasi hipotek, kunjungan medis, pemrosesan klaim, industri perhotelan, dan banyak lagi. Individu memberikan beberapa bukti identitas mereka melalui SIM, paspor, dan dokumen serupa lainnya sehingga bisnis dapat memverifikasinya secara efisien sebelum memberikan layanan dan manfaat.
Contoh SIM A.S. yang diproses dengan Document Intelligence Studio
Ekstraksi data
Layanan ID bawaan mengekstrak nilai kunci dari paspor di seluruh dunia dan SIM A.S. dan mengembalikannya dalam respons JSON terstruktur yang terorganisir.
Contoh SIM
Contoh paspor
Opsi pengembangan
Kecerdasan Dokumen v4.0: 2024-11-30 (GA) mendukung alat, aplikasi, dan pustaka berikut:
| Fitur | Sumber daya | Model ID |
|---|---|---|
| Model dokumen identitas | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
Kecerdasan Dokumen v3.1 mendukung alat, aplikasi, dan pustaka berikut:
| Fitur | Sumber daya | Model ID |
|---|---|---|
| Model dokumen identitas | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
Kecerdasan Dokumen v3.0 mendukung alat, aplikasi, dan pustaka berikut:
| Fitur | Sumber daya | Model ID |
|---|---|---|
| Model dokumen identitas | • Document Intelligence Studio • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-idDocument |
Kecerdasan Dokumen v2.1 mendukung alat, aplikasi, dan pustaka berikut:
| Fitur | Sumber daya |
|---|---|
| Model dokumen identitas | • Alat pelabelan Kecerdasan Dokumen • REST API • SDK pustaka klien • Kontainer Docker Kecerdasan Dokumen |
Persyaratan input
Format file berikut didukung.
| Model | Gambar: JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Baca | ✔ | ✔ | ✔ |
| Tata letak | ✔ | ✔ | ✔ |
| Dokumen umum | ✔ | ✔ | |
| Prabangun | ✔ | ✔ | |
| Ekstraksi kustom | ✔ | ✔ | |
| Klasifikasi kustom | ✔ | ✔ | ✔ |
- Foto dan pemindaian: Untuk hasil terbaik, berikan satu foto yang jelas atau pemindaian berkualitas tinggi per dokumen.
- PDF dan TIFF: Untuk PDF dan TIFF, hingga 2.000 halaman dapat diproses. (Dengan langganan tingkat gratis, hanya dua halaman pertama yang diproses.)
- Ukuran file: Ukuran file untuk menganalisis dokumen adalah 500 MB untuk tingkat berbayar (S0) dan 4 MB untuk tingkat gratis (F0).
- Dimensi gambar: Dimensi harus antara 50 piksel x 50 piksel dan 10.000 piksel x 10.000 piksel.
- Kunci sandi: Jika PDF Anda dikunci dengan sandi, Anda harus membukanya dulu sebelum pengiriman.
- Tinggi teks: Tinggi minimum teks yang akan diekstrak adalah 12 piksel untuk gambar 1024 x 768 piksel. Dimensi ini sesuai dengan teks berukuran sekitar 8 poin pada 150 titik per inci.
- Pelatihan model kustom: Jumlah maksimum halaman untuk data pelatihan adalah 500 untuk model templat kustom dan 50.000 untuk model neural kustom.
- Pelatihan model ekstraksi kustom: Ukuran total data pelatihan adalah 50 MB untuk model templat dan 1 GB untuk model neural.
- Pelatihan model klasifikasi kustom: Ukuran total data pelatihan adalah 1 GB dengan maksimum 10.000 halaman. Untuk 2024-11-30 (GA), ukuran total data pelatihan adalah 2 GB dengan maksimum 10.000 halaman.
- Jenis file Office (DOCX, XLSX, PPTX): Batas panjang string maksimum adalah 8 juta karakter.
Format file yang didukung: JPEG, PNG, PDF, dan TIFF.
Jumlah halaman yang didukung untuk file PDF dan TIFF: hingga 2.000 halaman atau hanya dua halaman pertama untuk pelanggan tingkat gratis.
Ukuran file yang didukung: kurang dari 50 MB TOTAL; piksel minimum: 50 x 50 px; piksel maksimum 10.000 x 10.000 px.
Ekstraksi data model dokumen ID
Ekstrak data, termasuk nama, tanggal lahir, dan tanggal kedaluwarsa, dari dokumen ID. Anda memerlukan sumber daya berikut:
Langganan Azure—Anda dapat buat langganan secara gratis.
Instans Document Intelligence di portal Azure. Anda dapat menggunakan tingkat harga gratis (
F0) untuk mencoba layanan. Setelah sumber daya Anda disebarkan, pilih Akses sumber daya untuk mendapatkan kunci dan titik akhir Anda.
Catatan
Document Intelligence Studio tersedia dengan API v3.1 dan v3.0 dan versi yang lebih baru.
Pada beranda Studio Kecerdasan Dokumen, pilih Dokumen identitas.
Anda dapat menganalisis faktur sampel atau mengunggah file Anda sendiri.
Pilih tombol Jalankan analisis dan, jika perlu, konfigurasikan opsi Analisis:
Alat Pelabelan Sampel untuk Kecerdasan Dokumen
Navigasikan ke Alat Sampel Kecerdasan Dokumen.
Pada beranda alat sampel, pilih gunakan model bawaan untuk mendapatkan petak data.
Pilih Jenis Formulir untuk dianalisis dari menu dropdown.
Pilih URL untuk file yang ingin Anda analisis dari opsi di bawah ini:
Di bidang Sumber , pilih URL dari menu dropdown, tempelkan URL yang dipilih, dan pilih tombol Ambil .
Di bidang titik akhir layanan Kecerdasan Dokumen, tempelkan titik akhir yang Anda peroleh dengan langganan Kecerdasan Dokumen Anda.
Di bidang kunci , tempelkan kunci yang Anda peroleh dari sumber daya Kecerdasan Dokumen Anda.
Pilih Jalankan analisis. Alat Pelabelan Sampel Kecerdasan Dokumen memanggil API Analisis Bawaan dan menganalisis dokumen.
Lihat hasilnya - lihat pasangan kunci-nilai yang diekstrak, item baris, teks yang disorot diekstrak, dan tabel terdeteksi.
Unduh file output JSON untuk melihat hasil terperinci.
- Simpul "readResults" berisi setiap baris teks dengan penempatan kotak pembatas masing-masing di halaman.
- Simpul "selectionMarks" memperlihatkan setiap tanda pilihan (kotak centang, tanda radio) dan apakah statusnya dipilih atau tidak dipilih.
- Bagian "pageResults" menyertakan tabel yang diekstrak. Untuk setiap tabel, Kecerdasan Dokumen mengekstrak indeks teks, baris, dan kolom, rentang baris dan kolom, kotak pembatas, dan lainnya.
- Bidang "documentResults" berisi informasi pasangan kunci/nilai dan informasi item baris untuk bagian dokumen yang paling relevan.
Catatan
Alat Pelabelan Sampel tidak mendukung format file BMP. Pembatasan ini adalah batasan alat, bukan Document Intelligence Service.
Ekstraksi bidang
Untuk bidang ekstraksi dokumen yang didukung, lihat halaman skema model dokumen ID di repositori sampel GitHub kami.
Jenis dokumen yang didukung
Model dokumen ID saat ini mendukung ekstraksi SIM AS dan halaman biografis dari paspor internasional (tidak termasuk visa dan dokumen perjalanan lainnya).
Bidang yang diekstrak
| Nama | Jenis | Deskripsi | Nilai |
|---|---|---|---|
| Negara | Negara | Kode negara yang sesuai dengan standar ISO 3166 | Amerika Serikat |
| Tanggal Lahir | Tanggal | DOB dalam format YYYY-MM-DD | "1980-01-01" |
| TanggalKedaluwarsa | Tanggal | Tanggal kedaluwarsa dalam formatMM-DD YYYY | "2019-05-05" |
| Nomor Dokumen | string | Nomor paspor yang relevan, nomor SIM, dll. | "340020013" |
| Nama Depan | string | Nama yang diberikan dan inisial tengah yang diekstrak jika berlaku | "JENNIFER" |
| NamaBelakang | string | Nama keluarga yang diekstrak | "BROOKS" |
| Kewarganegaraan | Negara | Kode negara yang sesuai dengan standar ISO 3166 | "AS" |
| Jenis kelamin | jenis kelamin | Kemungkinan nilai yang diekstrak termasuk "M" "F" "X" | "F" |
| MachineReadableZone | objek | Paspor MRZ yang diekstrak termasuk dua baris dengan 44 karakter masing-masing |
"P<USABROOKS<<JENNIFER<<<<<<<<<<<<<<<<<<<<<<< 3400200135USA8001014F1905054710000307<715816" |
| TipeDokumen | string | Jenis dokumen, misalnya, Paspor, SIM | "paspor" |
| Alamat | string | Alamat yang diekstrak (hanya SIM) | "123 ALAMAT JALAN KOTA ANDA WA 99999-1234" |
| Wilayah | string | Wilayah yang diekstrak, negara bagian, provinsi, dll. (hanya SIM) | "Washington" |
Panduan migrasi
- Ikuti panduan migrasi Kecerdasan Dokumen v3.1 kami untuk mempelajari cara menggunakan versi v3.0 di aplikasi dan alur kerja Anda.
Langkah berikutnya
Coba pemrosesan formulir dan dokumen Anda sendiri dengan Studio Kecerdasan Dokumen.
Selesaikan Panduan Mulai Cepat Kecerdasan Dokumen dan mulai membuat aplikasi pemrosesan dokumen dalam bahasa pemrograman pilihan Anda.
Cobalah memproses formulir dan dokumen Anda sendiri dengan Alat Pelabelan Sampel Kecerdasan Dokumen.
Selesaikan Panduan Mulai Cepat Kecerdasan Dokumen dan mulai membuat aplikasi pemrosesan dokumen dalam bahasa pemrograman pilihan Anda.