Definisi dan istilah pengenalan entitas bernama kustom

Gunakan artikel ini untuk mempelajari tentang beberapa definisi dan istilah yang mungkin Anda temui saat menggunakan NER kustom.

Entitas

Entitas adalah rentang teks yang menunjukkan jenis informasi tertentu. Rentang teks dapat terdiri dari satu atau lebih kata. Dalam cakupan NER kustom, entitas mewakili informasi yang ingin diekstrak pengguna dari teks. Pengembang memberi tag entitas dalam data mereka dengan entitas yang diperlukan sebelum meneruskannya ke model untuk pelatihan. Misalnya "Nomor faktur", "Tanggal mulai", "Nomor pengiriman", "Tempat Kelahiran", "Kota asal", "Nama pemasok" atau "Alamat klien".

Misalnya, dalam kalimat "John meminjam 25.000 USD dari Fred." entitasnya mungkin berupa:

Nama/jenis entitas Entitas
Nama Peminjam John
Nama Pemberi Pinjaman Fred
Jumlah Pinjaman 25.000 USD

f-measure

F-measure adalah fungsi dari Presisi dan Pengenalan. Hal ini diperlukan ketika Anda mencari keseimbangan antara Presisi dan Pengenalan.

Model

Model adalah objek yang dilatih untuk melakukan tugas tertentu dalam kasus ini pengenalan entitas kustom. Model dilatih dengan menyediakan data berlabel untuk dipelajari sehingga nantinya bisa digunakan untuk tugas pengenalan.

  • Pelatihan model adalah proses mengajarkan model Anda apa yang harus diekstraksi berdasarkan data yang diberi label.
  • Evaluasi model adalah proses yang terjadi tepat setelah pelatihan untuk mengetahui seberapa baik performa model Anda.
  • Penyebaran adalah proses menetapkan model Anda ke penyebaran agar membuatnya tersedia untuk digunakan melalui API prediksi.

Presisi

Mengukur seberapa presisi/akurat model Anda. Ini adalah rasio antara positif yang diidentifikasi dengan benar (positif sejati) dan semua positif yang diidentifikasi. Metrik presisi mengungkapkan berapa banyak kelas yang diprediksi diberi label dengan benar.

Project

Proyek adalah area kerja untuk membuat model ML kustom berdasarkan data Anda. Proyek Anda hanya dapat diakses oleh Anda dan orang lain yang memiliki akses kontributor ke sumber daya Azure yang digunakan. Sebagai prasyarat untuk membuat proyek ekstraksi entitas kustom, Anda harus menghubungkan sumber daya Anda ke akun penyimpanan dengan himpunan data Anda ketika Anda membuat proyek baru. Proyek Anda secara otomatis menyertakan semua file .txt yang tersedia di kontainer Anda.

Dalam proyek, Anda dapat melakukan tindakan berikut:

  • Tag data Anda: Proses pemberian pelabelan pada data Anda, sehingga ketika Anda melatih model, ia mempelajari apa yang ingin Anda ekstrak.
  • Membangun dan melatih model: Langkah inti dari proyek Anda, ketka model Anda mulai belajar dari data yang diberi label.
  • Melihat detail evaluasi model: Meninjau performa model Anda untuk memutuskan apakah ada ruang untuk peningkatan kualitas atau Anda puas dengan hasilnya.
  • Deployment: Setelah Anda meninjau performa model dan memutuskannya dapat digunakan di lingkungan, Anda perlu menetapkannya ke penyebaran menggunakannya. Menetapkan model ke penyebaran membuatnya tersedia untuk digunakan melalui API prediksi.
  • Model pengujian: Setelah menyebarkan model Anda, uji penyebaran Anda di Language Studio untuk melihat performanya dalam produksi.

Pengenalan

Mengukur kemampuan model untuk memprediksi kelas positif aktual. Ini adalah rasio antara prediksi positif benar dan yang sebenarnya diberi tag. Metrik pengenalan mengungkapkan berapa banyak kelas yang diprediksi benar.

Langkah berikutnya