Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Pelatihan adalah proses di mana model belajar dari data berlabel Anda. Setelah pelatihan selesai, Anda akan dapat melihat performa model untuk menentukan apakah Anda perlu meningkatkan model Anda.
Untuk melatih model, Anda memulai pekerjaan pelatihan dan hanya pekerjaan yang berhasil diselesaikan yang membuat model. Pekerjaan pelatihan kedaluwarsa setelah tujuh hari, yang berarti Anda tidak akan dapat mengambil detail pekerjaan setelah waktu ini. Jika pekerjaan pelatihan Anda terselesaikan dengan sukses dan model dibuat, maka model tersebut tidak terpengaruh. Anda hanya dapat memiliki satu pekerjaan pelatihan yang berjalan pada satu waktu, dan Anda tidak dapat memulai pekerjaan lain dalam proyek yang sama.
Waktu pelatihan bervariasi. Pelatihan dapat dilakukan dari beberapa menit, saat berhadapan dengan beberapa dokumen, atau beberapa jam, tergantung pada ukuran himpunan data dan kompleksitas skema Anda.
Prasyarat
- Proyek yang berhasil dibuat dengan akun penyimpanan blob Azure yang dikonfigurasi
- Data teks yang diunggah ke akun penyimpanan Anda.
- Data berlabel
Lihat siklus hidup pengembangan proyek.
Pemisahan data
Sebelum Anda memulai proses pelatihan, dokumen berlabel dalam proyek Anda dibagi menjadi set pelatihan dan set pengujian. Masing-masing dari mereka melayani fungsi yang berbeda. Set pelatihan digunakan dalam melatih model. Ini adalah kumpulan yang digunakan oleh model untuk mempelajari entitas berlabel dan menentukan rentang teks yang akan diekstraksi sebagai entitas. Set pengujian adalah set yang tidak terlihat yang tidak diperkenalkan ke model selama pelatihan, namun hanya diperkenalkan saat evaluasi. Setelah pelatihan model berhasil diselesaikan, model digunakan untuk membuat prediksi dari dokumen pengujian dan metrik evaluasi dihitung. Kami menyarankan agar Anda memastikan bahwa semua entitas Anda diwakili secara memadai dalam set pelatihan dan pengujian.
NER Kustom mendukung dua metode untuk pemisahan data:
- Secara otomatis memisahkan set pengujian dari data pelatihan: Sistem membagi data berlabel Anda antara set pelatihan dan pengujian, sesuai dengan persentase yang Anda pilih. Pembagian persentase yang disarankan adalah 80% untuk pelatihan dan 20% untuk pengujian.
Catatan
Jika Anda memilih opsi Pemisahan set pengujian secara otomatis dari data pelatihan , hanya data yang ditetapkan ke set pelatihan yang dipisahkan sesuai dengan persentase yang disediakan.
- Gunakan pemisahan manual data pelatihan dan pengujian: Metode ini memungkinkan pengguna untuk menentukan dokumen berlabel mana yang harus termasuk dalam set mana. Langkah ini hanya diaktifkan jika Anda menambahkan dokumen ke kumpulan pengujian selama pelabelan data.
Melatih model
Untuk mulai melatih model Anda dari dalam Language Studio:
Pilih Pekerjaan pelatihan dari menu sebelah kiri.
Pilih Mulai pekerjaan pelatihan dari menu atas.
Pilih Latih model baru dan ketik nama model di kotak teks. Anda juga dapat mengganti model yang ada dengan mengklik opsi ini dan memilih model yang ingin Anda ganti dari menu drop-down. Mengganti model yang sudah dilatih bersifat permanen, tetapi tidak memengaruhi model yang Anda terapkan sampai Anda menerapkan model baru.
Pilih metode pemisahan data. Anda dapat memilih Memisahkan set pengujian secara otomatis dari data pelatihan di mana sistem membagi data berlabel Anda antara set pelatihan dan pengujian, sesuai dengan persentase yang ditentukan. Atau Anda dapat Menggunakan pemisahan manual data pelatihan dan pengujian, opsi ini hanya diaktifkan jika Anda menambahkan dokumen ke kumpulan pengujian selama pelabelan data. Lihat Cara melatih model untuk informasi tentang pemisahan data.
Pilih tombol Latih.
Jika Anda memilih ID Pekerjaan Pelatihan dari daftar, panel samping muncul di mana Anda dapat memeriksa kemajuan Pelatihan, Status pekerjaan, dan detail lainnya untuk pekerjaan ini.
Catatan
- Hanya pekerjaan pelatihan yang berhasil diselesaikan yang menghasilkan model.
- Pelatihan dapat memakan waktu antara beberapa menit dan beberapa jam berdasarkan ukuran data berlabel Anda.
- Anda hanya dapat memiliki satu pekerjaan pelatihan yang berjalan pada satu waktu. Anda tidak dapat memulai pekerjaan pelatihan lain dalam proyek yang sama sampai pekerjaan yang sedang berjalan selesai.
Membatalkan pekerjaan pelatihan
Untuk membatalkan pekerjaan pelatihan dari Language Studio, buka halaman Pekerjaan pelatihan. Pilih pekerjaan pelatihan yang ingin Anda batalkan dan pilih Batalkan dari menu atas.
Langkah berikutnya
Setelah pelatihan selesai, Anda akan dapat melihat performa model untuk secara opsional meningkatkan model Anda jika diperlukan. Setelah puas dengan model Anda, Anda dapat menyebarkan model tersebut, membuatnya tersedia untuk digunakan untuk mengekstraksi entitas dari teks.