Model kartu nama Kecerdasan Dokumen
Penting
Dimulai dengan Kecerdasan Dokumen v4.0 (pratinjau), dan ke depannya, model kartu nama (prebuilt-businessCard) tidak digunakan lagi. Untuk mengekstrak data dari format kartu nama, gunakan yang berikut ini:
Fitur | version | ID Model |
---|---|---|
Model kartu nama | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) • v2.1 (GA) |
prebuilt-businessCard |
Konten ini berlaku untuk: v3.0 (GA) | Versi terbaru: v4.0 (pratinjau) v3.1 | Versi sebelumnya: v2.1
[! INCLUDE [berlaku untuk v2.1].. /(includes/applies-to-v21.md)]
Model kartu nama Kecerdasan Dokumen menggabungkan kemampuan Pengenalan Karakter Optik (OCR) yang kuat dengan model pembelajaran mendalam untuk menganalisis dan mengekstrak data dari gambar kartu nama. API menganalisis kartu nama cetak; mengekstrak informasi utama seperti nama depan, nama keluarga, nama perusahaan, alamat email, dan nomor telepon; dan mengembalikan representasi data JSON terstruktur.
Ekstraksi data kartu nama
Kartu nama adalah cara yang bagus untuk mewakili bisnis atau profesional. Logo perusahaan, font, dan gambar latar belakang yang ditemukan dalam kartu nama membantu mempromosikan branding perusahaan dan membedakannya dari yang lain. Menerapkan OCR dan teknik berbasis pembelajaran mesin untuk mengotomatiskan pemindaian kartu nama adalah skenario pemrosesan gambar umum. Sistem perusahaan yang digunakan oleh tim penjualan dan pemasaran biasanya memiliki integrasi kemampuan ekstraksi data kartu nama ke dalamnya untuk kepentingan pengguna mereka.
Contoh kartu nama yang diproses dengan Document Intelligence Studio
Contoh bisnis yang diproses dengan alat Pelabelan Sampel Kecerdasan Dokumen
Opsi pengembangan
Kecerdasan Dokumen v3.1:2023-07-31 (GA) mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber | ID Model |
---|---|---|
Model kartu nama | • Studio Kecerdasan Dokumen • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-businessCard |
Kecerdasan Dokumen v3.0:2022-08-31 (GA) mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber | ID Model |
---|---|---|
Model kartu nama | • Studio Kecerdasan Dokumen • REST API • C# SDK • Python SDK • Java SDK • JavaScript SDK |
prebuilt-businessCard |
Kecerdasan Dokumen v2.1 (GA) mendukung alat, aplikasi, dan pustaka berikut:
Fitur | Sumber |
---|---|
Model kartu nama | • Alat pelabelan Kecerdasan Dokumen • REST API • SDK pustaka klien • Kontainer Docker Kecerdasan Dokumen |
Coba ekstraksi data kartu nama
Lihat bagaimana data, termasuk nama, jabatan, alamat, email, dan nama perusahaan, diekstrak dari kartu nama. Anda membutuhkan sumber daya berikut:
Langganan Azure—Anda dapat membuat langganan gratis
Instans Kecerdasan Dokumen di portal Azure. Anda dapat menggunakan tingkat harga gratis (
F0
) untuk mencoba layanan. Setelah sumber daya Anda disebarkan, pilih Buka sumber daya untuk mendapatkan kunci dan titik akhir Anda.
Studio Kecerdasan Dokumen
Catatan
Document Intelligence Studio tersedia dengan API v3.1 dan v3.0.
Alat Pelabelan Sampel Kecerdasan Dokumen
Navigasikan ke Alat Sampel Kecerdasan Dokumen.
Pada beranda alat sampel, pilih gunakan model bawaan untuk mendapatkan petak data .
Pilih Jenis Formulir untuk dianalisis dari menu dropdown.
Pilih URL untuk {i>file
Pada bidang Sumber, pilih URL dari menu drop down, tempel URL yang dipilih, dan pilih tombol Ambil.
Di bidang titik akhir layanan Inteligensi Dokumen, tempelkan titik akhir yang Anda peroleh dengan langganan Kecerdasan Dokumen Anda.
Di bidang kunci, tempelkan kunci yang Anda peroleh dari sumber daya Kecerdasan Dokumen Anda.
Pilih Jalankan analisis. Alat Pelabelan Sampel Kecerdasan Dokumen memanggil API Analisis Bawaan dan menganalisis dokumen.
Lihat hasilnya - lihat pasangan kunci-nilai yang diekstrak, item baris, teks yang disorot diekstrak, dan tabel terdeteksi.
Catatan
Alat pelabelan sampel tidak mendukung format file BMP. Ini adalah batasan alat bukan Document Intelligence Service.
Persyaratan input
Format file yang didukung:
Model PDF Gambar: JPEG/JPG
, ,BMP
PNG
,TIFF
, ,HEIF
Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLRead ✔ ✔ ✔ Tata letak ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Dokumen Umum ✔ ✔ Bawaan ✔ ✔ Ekstraksi kustom ✔ ✔ Klasifikasi kustom ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview) Untuk hasil terbaik, berikan satu foto yang jelas atau pemindaian berkualitas tinggi per dokumen.
Untuk PDF dan TIFF, hingga 2.000 halaman dapat diproses (dengan langganan tingkat gratis, hanya dua halaman pertama yang diproses).
Ukuran file untuk menganalisis dokumen adalah 500 MB untuk tingkat berbayar (S0) dan
4
MB secara gratis (F0).Dimensi gambar harus antara 50 piksel x 50 piksel dan 10.000 piksel x 10.000 piksel.
Jika PDF Anda dikunci dengan kata sandi, Anda harus menghapus kunci sebelum pengiriman.
Tinggi minimum teks yang akan diekstrak adalah 12 piksel untuk gambar piksel 1024 x 768. Dimensi ini sesuai dengan tentang
8
teks titik pada 150 titik per inci (DPI).Untuk pelatihan model kustom, jumlah maksimum halaman untuk data pelatihan adalah 500 untuk model template kustom dan 50.000 untuk model neural kustom.
Untuk pelatihan model ekstraksi kustom, ukuran total data pelatihan adalah 50 MB untuk model templat dan
1
GB untuk model neural.Untuk pelatihan model klasifikasi kustom, ukuran total data pelatihan adalah
1
GB dengan maksimum 10.000 halaman. Untuk pratinjau 2024-07-31 dan yang lebih baru, ukuran total data pelatihan adalah2
GB dengan maksimum 10.000 halaman.
- Format file yang didukung: JPEG, PNG, PDF, dan TIFF
- PDF dan TIFF, hingga 2.000 halaman diproses. Untuk pelanggan level gratis, hanya dua halaman pertama yang diproses.
- Ukuran file harus kurang dari 50 MB dan dimensi minimal 50 x 50 piksel dan paling banyak 10.000 x 10.000 piksel.
Bahasa dan lokal yang didukung
Untuk daftar lengkap bahasa yang didukung, lihat halaman dukungan bahasa model bawaan kami.
Ekstraksi bidang
Untuk bidang ekstraksi dokumen yang didukung, lihat halaman skema model kartu nama di repositori sampel GitHub kami.
Bidang diekstrak
Nama | Tipe | Deskripsi | SMS |
---|---|---|---|
ContactNames | array objek | Nama kontak yang diekstrak dari kartu nama | [{ "FirstName": "John", "LastName": "Doe" }] |
FirstName | string | Nama (lahir) depan kontak | "John" |
LastName | string | Nama (keluarga) belakang kontak | "Doe" |
CompanyNames | array string | Nama perusahaan yang diekstrak dari kartu nama | ["Contoso"] |
Departments | array string | Departemen atau organisasi kontak | ["R&D"] |
JobTitles | array string | Jabatan Pekerjaan kontak yang terdaftar | ["Insinyur Perangkat Lunak"] |
array string | Email kontak yang diekstrak dari kartu nama | ["johndoe@contoso.com"] | |
Situs Web | array string | Situs web yang diekstrak dari kartu nama | ["https://www.contoso.com"] |
Alamat | array string | Alamat yang diekstrak dari kartu nama | ["123 Main Street, Redmond, Washington 98052"] |
MobilePhones | array nomor telepon | Nomor ponsel yang diekstrak dari kartu nama | ["+19876543210"] |
Faks | array nomor telepon | Nomor faks yang diekstrak dari kartu nama | ["+19876543211"] |
WorkPhone | array nomor telepon | Nomor telepon kerja yang diekstrak dari kartu nama | ["+19876543231"] |
OtherPhones | array nomor telepon | Nomor telepon lain yang diekstrak dari kartu nama | ["+19876543233"] |
Lokal yang didukung
Kartu nama bawaan v2.1 mendukung lokal berikut:
- en-us
- en-au
- en-ca
- en-gb
- en-in
Panduan migrasi dan REST API v3.1
- Ikuti panduan migrasi Kecerdasan Dokumen v3.1 kami untuk mempelajari cara menggunakan versi v3.0 di aplikasi dan alur kerja Anda.
Langkah berikutnya
Coba memproses formulir dan dokumen Anda sendiri dengan Studio Kecerdasan Dokumen
Selesaikan mulai cepat Kecerdasan Dokumen dan mulai membuat aplikasi pemrosesan dokumen dalam bahasa pengembangan pilihan Anda.
Coba pemrosesan formulir dan dokumen Anda sendiri dengan alat Pelabelan Sampel Kecerdasan Dokumen
Selesaikan mulai cepat Kecerdasan Dokumen dan mulai membuat aplikasi pemrosesan dokumen dalam bahasa pengembangan pilihan Anda.