Apa itu pengenalan entitas bernama kustom?

NER Khusus adalah salah satu fitur khusus yang ditawarkan oleh Azure Cognitive Service untuk Bahasa. Ini adalah layanan API berbasis cloud yang menerapkan kecerdasan pembelajaran mesin untuk memungkinkan Anda membangun model kustom untuk tugas pengenalan entitas bernama kustom.

NER Kustom memungkinkan pengguna membuat model AI kustom untuk mengekstrak entitas khusus domain dari teks tidak terstruktur, seperti kontrak atau dokumen keuangan. Dengan membuat proyek NER Kustom, pengembang dapat secara berulang kali melabeli data, melatih, mengevaluasi, dan meningkatkan performa model sebelum membuatnya tersedia untuk penggunaan. Kualitas data yang diberi label sangat mempengaruhi performa model. Untuk menyederhanakan proses membangun dan menyesuaikan model Anda, layanan ini menawarkan portal web khusus yang dapat diakses melalui Language Studio. Anda dapat dengan mudah memulai layanan ini dengan mengikuti langkah-langkah dalam mulai cepat ini.

Dokumentasi ini berisi jenis artikel berikut ini:

  • Mulai Cepat memulai instruksi untuk memandu Anda membuat permintaan ke layanan.
  • Konsep memberikan penjelasan tentang fungsi dan fitur layanan.
  • Panduan berisi instruksi untuk menggunakan layanan dengan cara yang lebih spesifik atau disesuaikan.

Contoh skenario penggunaan

Pengenalan entitas bernama kustom dapat digunakan dalam beberapa skenario di berbagai industri:

Ekstraksi informasi

Banyak organisasi keuangan dan hukum mengekstrak dan menormalkan data dari ribuan sumber teks yang kompleks dan tidak terstruktur setiap hari. Sumber tersebut termasuk laporan bank, perjanjian hukum, atau formulir bank. Misalnya, ekstraksi data aplikasi hipotek yang dilakukan secara manual oleh peninjau manusia mungkin membutuhkan waktu beberapa hari untuk mengekstrak. Mengotomatiskan langkah-langkah ini dengan membangun model NER kustom menyederhanakan proses dan menghemat biaya, waktu, dan upaya.

Penelusuran adalah dasar untuk aplikasi apa pun yang menampilkan konten teks kepada pengguna. Skenario umum termasuk pencarian katalog atau dokumen, pencarian produk ritel, atau penambangan pengetahuan untuk ilmu data. Banyak perusahaan di berbagai industri ingin membangun pengalaman pencarian yang kaya melalui konten pribadi yang heterogen, yang mencakup dokumen terstruktur dan tidak terstruktur. Sebagai bagian dari alur mereka, pengembang dapat menggunakan NER khusus untuk mengekstrak entitas dari teks yang relevan dengan industri mereka. Entitas ini dapat digunakan untuk memperkaya pengindeksan file untuk pengalaman pencarian yang lebih disesuaikan.

Audit dan kepatuhan

Sebagai gantinya meninjau secara manual file teks yang sangat panjang untuk mengaudit dan menerapkan kebijakan, departemen IT perusahaan keuangan atau hukum dapat menggunakan NER kustom untuk membuat solusi otomatis. Solusi ini dapat membantu untuk menegakkan kebijakan kepatuhan, dan menyiapkan aturan bisnis yang diperlukan berdasarkan alur penambangan pengetahuan yang memproses konten terstruktur dan tidak terstruktur.

siklus hidup pengembangan Project

Menggunakan NER khusus biasanya melibatkan beberapa langkah berbeda.

Siklus hidup pengembangan

  1. Tentukan skema Anda: Ketahui data Anda dan identifikasi entitas yang ingin Anda ekstrak. Hindari ambiguitas.

  2. Beri label data Anda: Melabeli data adalah faktor kunci dalam menentukan performa model. Beri label secara tepat, konsisten dan lengkap.

    1. Beri label dengan tepat: Selalu beri label setiap entitas ke jenis yang tepat. Hanya sertakan apa yang ingin Anda ekstrak, hindari data yang tidak perlu di label Anda.
    2. Beri label secara konsisten: Entitas yang sama harus memiliki label yang sama di semua file.
    3. Beri label sepenuhnya: Beri label semua instans entitas di semua file Anda.
  3. Melatih model: Model Anda mulai belajar dari data yang Anda beri label.

  4. Melihat performa model: Setelah pelatihan selesai, lihat detail evaluasi model dan performanya serta bimbingan tentang cara memperbaikinya.

  5. Menyebarkan model: Menyebarkan model membuatnya tersedia untuk digunakan melalui Analyze API.

  6. Ekstrak entitas: Gunakan model kustom Anda untuk tugas ekstraksi entitas.

Dokumentasi referensi dan sampel kode

Saat Anda menggunakan NER kustom, lihat dokumentasi referensi dan contoh berikut untuk Azure Cognitive Service untuk Bahasa:

Opsi pengembangan/bahasa Dokumentasi rujukan Sampel
REST API (Penulisan) Dokumentasi REST API
REST API (Runtime) Dokumentasi REST API
C# (Runtime) Dokumentasi C# Sampel C++
Java (Runtime) Dokumentasi Java Sampel Java
JavaScript (Runtime) Dokumentasi JavaScript Sampel JavaScript
Python (Runtime) Dokumentasi Python Sampel Python

AI yang bertanggung jawab

Sistem AI tidak hanya mencakup teknologi, tetapi juga orang-orang yang akan menggunakannya, orang-orang yang akan terdampak olehnya, dan lingkungan tempat AI disebarkan. Baca catatan transparansi untuk NER khusus untuk mempelajari tentang penggunaan dan penyebaran AI yang bertanggung jawab di sistem Anda. Anda juga membaca artikel berikut untuk mengetahui informasi lebih lanjut:

Langkah berikutnya

  • Gunakan artikel mulai cepat untuk mulai menggunakan pengenalan entitas bernama kustom.

  • Saat Anda melalui siklus hidup pengembangan proyek, tinjau glosarium untuk mempelajari lebih lanjut tentang istilah yang digunakan di seluruh dokumentasi untuk fitur ini.

  • Ingatlah untuk melihat batas layanan untuk informasi seperti ketersediaan wilayah.