Bagikan melalui


Model kartu nama Kecerdasan Dokumen

Penting

Dimulai dengan Kecerdasan Dokumen v4.0 (pratinjau), dan ke depannya, model kartu nama (prebuilt-businessCard) tidak digunakan lagi. Untuk mengekstrak data dari format kartu nama, gunakan yang berikut ini:

Fitur version ID Model
Model kartu nama • v3.1:2023-07-31 (GA)
• v3.0:2022-08-31 (GA)
• v2.1 (GA)
prebuilt-businessCard

Konten ini berlaku untuk: tanda centang v3.1 (GA) | Versi sebelumnya: tanda centang biru v3.0tanda centang biru v2.1

Konten ini berlaku untuk: tanda centang v3.0 (GA) | Versi terbaru: tanda centang ungu v4.0 (pratinjau) tanda centang unguv3.1 | Versi sebelumnya: tanda centang biru v2.1

[! INCLUDE [berlaku untuk v2.1].. /(includes/applies-to-v21.md)]

Model kartu nama Kecerdasan Dokumen menggabungkan kemampuan Pengenalan Karakter Optik (OCR) yang kuat dengan model pembelajaran mendalam untuk menganalisis dan mengekstrak data dari gambar kartu nama. API menganalisis kartu nama cetak; mengekstrak informasi utama seperti nama depan, nama keluarga, nama perusahaan, alamat email, dan nomor telepon; dan mengembalikan representasi data JSON terstruktur.

Ekstraksi data kartu nama

Kartu nama adalah cara yang bagus untuk mewakili bisnis atau profesional. Logo perusahaan, font, dan gambar latar belakang yang ditemukan dalam kartu nama membantu mempromosikan branding perusahaan dan membedakannya dari yang lain. Menerapkan OCR dan teknik berbasis pembelajaran mesin untuk mengotomatiskan pemindaian kartu nama adalah skenario pemrosesan gambar umum. Sistem perusahaan yang digunakan oleh tim penjualan dan pemasaran biasanya memiliki integrasi kemampuan ekstraksi data kartu nama ke dalamnya untuk kepentingan pengguna mereka.

Contoh kartu nama yang diproses dengan Document Intelligence Studio

Cuplikan layar contoh kartu nama yang dianalisis di Studio Kecerdasan Dokumen.

Contoh bisnis yang diproses dengan alat Pelabelan Sampel Kecerdasan Dokumen

Cuplikan layar contoh kartu nama yang dianalisis dengan alat Pelabelan Sampel Kecerdasan Dokumen.

Opsi pengembangan

Kecerdasan Dokumen v3.1:2023-07-31 (GA) mendukung alat, aplikasi, dan pustaka berikut:

Fitur Sumber ID Model
Model kartu nama Studio Kecerdasan Dokumen
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-businessCard

Kecerdasan Dokumen v3.0:2022-08-31 (GA) mendukung alat, aplikasi, dan pustaka berikut:

Fitur Sumber ID Model
Model kartu nama Studio Kecerdasan Dokumen
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-businessCard

Kecerdasan Dokumen v2.1 (GA) mendukung alat, aplikasi, dan pustaka berikut:

Fitur Sumber
Model kartu nama Alat pelabelan Kecerdasan Dokumen
REST API
SDK pustaka klien
Kontainer Docker Kecerdasan Dokumen

Coba ekstraksi data kartu nama

Lihat bagaimana data, termasuk nama, jabatan, alamat, email, dan nama perusahaan, diekstrak dari kartu nama. Anda membutuhkan sumber daya berikut:

  • Langganan Azure—Anda dapat membuat langganan gratis

  • Instans Kecerdasan Dokumen di portal Azure. Anda dapat menggunakan tingkat harga gratis (F0) untuk mencoba layanan. Setelah sumber daya Anda disebarkan, pilih Buka sumber daya untuk mendapatkan kunci dan titik akhir Anda.

Cuplikan layar di titik akhir di portal Azure.

Studio Kecerdasan Dokumen

Catatan

Document Intelligence Studio tersedia dengan API v3.1 dan v3.0.

  1. Pada beranda Studio Kecerdasan Dokumen, pilih Kartu nama.

  2. Anda dapat menganalisis contoh kartu nama atau mengunggah file Anda sendiri.

  3. Pilih tombol Jalankan analisis dan, jika perlu, konfigurasikan opsi Analisis :

    Cuplikan layar tombol Jalankan analisis dan Analisis opsi di Studio Kecerdasan Dokumen.

Alat Pelabelan Sampel Kecerdasan Dokumen

  1. Navigasikan ke Alat Sampel Kecerdasan Dokumen.

  2. Pada beranda alat sampel, pilih gunakan model bawaan untuk mendapatkan petak data .

    Cuplikan layar model tata letak menganalisis operasi hasil.

  3. Pilih Jenis Formulir untuk dianalisis dari menu dropdown.

  4. Pilih URL untuk {i>file

  5. Pada bidang Sumber, pilih URL dari menu drop down, tempel URL yang dipilih, dan pilih tombol Ambil.

    Cuplikan layar menu dropdown lokasi sumber.

  6. Di bidang titik akhir layanan Inteligensi Dokumen, tempelkan titik akhir yang Anda peroleh dengan langganan Kecerdasan Dokumen Anda.

  7. Di bidang kunci, tempelkan kunci yang Anda peroleh dari sumber daya Kecerdasan Dokumen Anda.

    Cuplikan layar menu dropdown pilih jenis formulir.

  8. Pilih Jalankan analisis. Alat Pelabelan Sampel Kecerdasan Dokumen memanggil API Analisis Bawaan dan menganalisis dokumen.

  9. Lihat hasilnya - lihat pasangan kunci-nilai yang diekstrak, item baris, teks yang disorot diekstrak, dan tabel terdeteksi.

    Cuplikan layar model kartu nama menganalisis operasi hasil.

Catatan

Alat pelabelan sampel tidak mendukung format file BMP. Ini adalah batasan alat bukan Document Intelligence Service.

Persyaratan input

  • Format file yang didukung:

    Model PDF Gambar:
    JPEG/JPG, , BMPPNG, TIFF, ,HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Read
    Tata letak ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Dokumen Umum
    Bawaan
    Ekstraksi kustom
    Klasifikasi kustom ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Untuk hasil terbaik, berikan satu foto yang jelas atau pemindaian berkualitas tinggi per dokumen.

  • Untuk PDF dan TIFF, hingga 2.000 halaman dapat diproses (dengan langganan tingkat gratis, hanya dua halaman pertama yang diproses).

  • Ukuran file untuk menganalisis dokumen adalah 500 MB untuk tingkat berbayar (S0) dan 4 MB secara gratis (F0).

  • Dimensi gambar harus antara 50 piksel x 50 piksel dan 10.000 piksel x 10.000 piksel.

  • Jika PDF Anda dikunci dengan kata sandi, Anda harus menghapus kunci sebelum pengiriman.

  • Tinggi minimum teks yang akan diekstrak adalah 12 piksel untuk gambar piksel 1024 x 768. Dimensi ini sesuai dengan tentang 8 teks titik pada 150 titik per inci (DPI).

  • Untuk pelatihan model kustom, jumlah maksimum halaman untuk data pelatihan adalah 500 untuk model template kustom dan 50.000 untuk model neural kustom.

    • Untuk pelatihan model ekstraksi kustom, ukuran total data pelatihan adalah 50 MB untuk model templat dan 1 GB untuk model neural.

    • Untuk pelatihan model klasifikasi kustom, ukuran total data pelatihan adalah 1 GB dengan maksimum 10.000 halaman. Untuk pratinjau 2024-07-31 dan yang lebih baru, ukuran total data pelatihan adalah 2 GB dengan maksimum 10.000 halaman.

  • Format file yang didukung: JPEG, PNG, PDF, dan TIFF
  • PDF dan TIFF, hingga 2.000 halaman diproses. Untuk pelanggan level gratis, hanya dua halaman pertama yang diproses.
  • Ukuran file harus kurang dari 50 MB dan dimensi minimal 50 x 50 piksel dan paling banyak 10.000 x 10.000 piksel.

Bahasa dan lokal yang didukung

Untuk daftar lengkap bahasa yang didukung, lihat halaman dukungan bahasa model bawaan kami.

Ekstraksi bidang

Untuk bidang ekstraksi dokumen yang didukung, lihat halaman skema model kartu nama di repositori sampel GitHub kami.

Bidang diekstrak

Nama Tipe Deskripsi SMS
ContactNames array objek Nama kontak yang diekstrak dari kartu nama [{ "FirstName": "John", "LastName": "Doe" }]
FirstName string Nama (lahir) depan kontak "John"
LastName string Nama (keluarga) belakang kontak "Doe"
CompanyNames array string Nama perusahaan yang diekstrak dari kartu nama ["Contoso"]
Departments array string Departemen atau organisasi kontak ["R&D"]
JobTitles array string Jabatan Pekerjaan kontak yang terdaftar ["Insinyur Perangkat Lunak"]
Email array string Email kontak yang diekstrak dari kartu nama ["johndoe@contoso.com"]
Situs Web array string Situs web yang diekstrak dari kartu nama ["https://www.contoso.com"]
Alamat array string Alamat yang diekstrak dari kartu nama ["123 Main Street, Redmond, Washington 98052"]
MobilePhones array nomor telepon Nomor ponsel yang diekstrak dari kartu nama ["+19876543210"]
Faks array nomor telepon Nomor faks yang diekstrak dari kartu nama ["+19876543211"]
WorkPhone array nomor telepon Nomor telepon kerja yang diekstrak dari kartu nama ["+19876543231"]
OtherPhones array nomor telepon Nomor telepon lain yang diekstrak dari kartu nama ["+19876543233"]

Lokal yang didukung

Kartu nama bawaan v2.1 mendukung lokal berikut:

  • en-us
  • en-au
  • en-ca
  • en-gb
  • en-in

Panduan migrasi dan REST API v3.1

Langkah berikutnya

  • Coba memproses formulir dan dokumen Anda sendiri dengan Studio Kecerdasan Dokumen

  • Selesaikan mulai cepat Kecerdasan Dokumen dan mulai membuat aplikasi pemrosesan dokumen dalam bahasa pengembangan pilihan Anda.

  • Coba pemrosesan formulir dan dokumen Anda sendiri dengan alat Pelabelan Sampel Kecerdasan Dokumen

  • Selesaikan mulai cepat Kecerdasan Dokumen dan mulai membuat aplikasi pemrosesan dokumen dalam bahasa pengembangan pilihan Anda.