Cara menggunakan pelabelan otomatis untuk Klasifikasi Teks Kustom
Proses pelabelan adalah bagian penting untuk menyiapkan himpunan data Anda. Karena proses ini membutuhkan banyak waktu dan upaya, Anda dapat menggunakan fitur pelabelan otomatis untuk memberi label dokumen Anda secara otomatis dengan kelas yang ingin Anda kategorikan. Saat ini Anda dapat memulai pekerjaan pelabelan otomatis berdasarkan model menggunakan model GPT di mana Anda dapat segera memicu pekerjaan pelabelan otomatis tanpa pelatihan model sebelumnya. Fitur ini dapat menghemat waktu dan upaya pelabelan dokumen Anda secara manual.
Prasyarat
Sebelum Anda dapat menggunakan pelabelan otomatis dengan GPT, Anda memerlukan:
- Proyek yang berhasil dibuat dengan akun penyimpanan blob Azure yang dikonfigurasi.
- Data teks yang telah diunggah ke akun penyimpanan Anda.
- Nama kelas yang bermakna. Model GPT melabeli dokumen berdasarkan nama kelas yang Telah Anda berikan.
- Data berlabel tidak diperlukan.
- Sumber daya dan penyebaran Azure OpenAI.
Memicu pekerjaan pelabelan otomatis
Saat Anda memicu pekerjaan pelabelan otomatis dengan GPT, Anda dikenakan biaya ke sumber daya Azure OpenAI sesuai konsumsi Anda. Anda dikenakan perkiraan jumlah token di setiap dokumen yang diberi label otomatis. Lihat halaman harga Azure OpenAI untuk perincian detail harga per token model yang berbeda.
Dari menu navigasi kiri, pilih Pelabelan data.
Pilih tombol Autolabel di bawah panel Aktivitas di sebelah kanan halaman.
Pilih Autolabel dengan GPT dan pilih Berikutnya.
Pilih sumber daya dan penyebaran Azure OpenAI Anda. Anda harus membuat sumber daya Azure OpenAI dan menyebarkan model untuk melanjutkan.
Pilih kelas yang ingin Anda sertakan dalam pekerjaan pelabelan otomatis. Secara default, semua kelas dipilih. Memiliki nama deskriptif untuk kelas, dan termasuk contoh untuk setiap kelas disarankan untuk mencapai pelabelan berkualitas baik dengan GPT.
Pilih dokumen yang ingin Anda sertakan dalam pelabelan otomatis. Sebaiknya pilih dokumen yang tidak berlabel dari filter.
Catatan
- Jika dokumen diberi label secara otomatis, tetapi label ini sudah ditentukan pengguna, hanya label yang ditentukan pengguna yang digunakan.
- Anda bisa menampilkan dokumen dengan mengklik nama dokumen.
Pilih Mulai pekerjaan untuk memicu pekerjaan pelabelan otomatis. Anda harus diarahkan ke halaman pelabelan otomatis yang menampilkan pekerjaan pelabelan otomatis yang dimulai. Pekerjaan pelabelan otomatis dapat berlangsung dari beberapa detik hingga beberapa menit, tergantung pada jumlah dokumen yang Anda sertakan.
Meninjau dokumen berlabel otomatis
Saat pekerjaan pelabelan otomatis selesai, Anda dapat melihat dokumen output di halaman Pelabelan data Language Studio. Pilih Tinjau dokumen dengan label otomatis untuk menampilkan dokumen dengan filter Dilabeli otomatis.
Dokumen yang telah diklasifikasikan secara otomatis telah menyarankan label di panel aktivitas yang disorot dengan warna ungu. Setiap label yang disarankan memiliki dua pemilih (tanda centang dan ikon batalkan) yang memungkinkan Anda menerima atau menolak label otomatis.
Setelah label diterima, warna ungu berubah menjadi warna biru default, dan label disertakan dalam pelatihan model lebih lanjut menjadi label yang ditentukan pengguna.
Setelah Anda menerima atau menolak label untuk dokumen berlabel otomatis, pilih Simpan label untuk menerapkan perubahan.
Catatan
- Sebaiknya validasi dokumen berlabel secara otomatis sebelum menerimanya.
- Semua label yang tidak diterima akan dihapus saat Anda melatih model Anda.
Langkah berikutnya
- Pelajari lebih lanjut pelabelan data Anda.