Cara menggunakan pelabelan otomatis untuk Pengenal Entitas Karakter Kustom

Proses pelabelan adalah bagian penting untuk menyiapkan himpunan data Anda. Karena proses ini membutuhkan waktu dan upaya, Anda dapat menggunakan fitur pelabelan otomatis untuk memberi label entitas Anda secara otomatis. Anda dapat memulai pekerjaan pelabelan otomatis berdasarkan model yang sebelumnya telah Anda latih atau menggunakan model GPT. Dengan pelabelan otomatis berdasarkan model yang telah Anda latih sebelumnya, Anda dapat mulai melabeli beberapa dokumen Anda, melatih model, lalu membuat pekerjaan pelabelan otomatis untuk menghasilkan label entitas untuk dokumen lain berdasarkan model tersebut. Dengan pelabelan otomatis dengan GPT, Anda dapat segera memicu pekerjaan pelabelan otomatis tanpa pelatihan model sebelumnya. Fitur ini dapat menghemat waktu dan tenaga untuk melabeli entitas Anda secara manual.

Prasyarat

Sebelum Anda dapat menggunakan pelabelan otomatis berdasarkan model yang telah Anda latih, Anda memerlukan:

Memicu pekerjaan pelabelan otomatis

Saat Anda memicu pekerjaan pelabelan otomatis berdasarkan model yang telah Anda latih, ada batas bulanan 5.000 rekaman teks per bulan, per sumber daya. Ini berarti batas yang sama berlaku pada semua proyek dalam sumber daya yang sama.

Tip

Rekaman teks dihitung sebagai batas maksimum (Jumlah karakter dalam file / 1.000). Misalnya, jika file memiliki 8921 karakter, jumlah rekaman teks adalah:

ceil(8921/1000) = ceil(8.921), yaitu 9 rekaman teks.

  1. Dari menu navigasi kiri, pilih Pelabelan data.

  2. Pilih tombol Autolabel di bawah panel Aktivitas di sebelah kanan halaman.

    Cuplikan layar yang menunjukkan cara memicu pekerjaan autotag.

  3. Pilih Autolabel berdasarkan model yang telah Anda latih dan pilih Berikutnya.

    Cuplikan layar memperlihatkan pilihan model untuk pelabelan otomatis.

  4. Pilih model yang terlatih. Disarankan untuk memeriksa performa model sebelum menggunakannya untuk pelabelan otomatis.

    Cuplikan layar yang menunjukkan cara memilih model terlatih untuk pencatatan otomatis.

  5. Pilih entitas yang ingin Anda sertakan dalam pekerjaan pelabelan otomatis. Secara default, semua entitas dipilih. Anda dapat melihat total label, presisi, dan pengenalan dari setiap entitas. Sebaiknya sertakan entitas yang berperforma baik untuk memastikan kualitas entitas yang dilabeli secara otomatis.

    Cuplikan layar yang menunjukkan entitas mana yang akan disertakan dalam pekerjaan autotag.

  6. Pilih dokumen yang ingin Anda sertakan dalam pelabelan otomatis. Jumlah rekaman teks dari setiap dokumen ditampilkan. Saat memilih satu atau beberapa dokumen, Anda akan melihat jumlah rekaman teks yang dipilih. Sebaiknya pilih dokumen yang tidak berlabel dari filter.

    Catatan

    • Jika entitas diberi label secara otomatis, tetapi memiliki label yang ditentukan pengguna, hanya label yang ditentukan pengguna yang digunakan dan terlihat.
    • Anda bisa menampilkan dokumen dengan mengklik nama dokumen.

    Cuplikan layar yang menunjukkan dokumen mana yang akan disertakan dalam pekerjaan autotag.

  7. Pilih Autolabel untuk memicu pekerjaan pelabelan otomatis. Anda akan melihat model yang digunakan, jumlah dokumen yang disertakan dalam pekerjaan pelabelan otomatis, jumlah rekaman teks, dan entitas yang akan diberi label secara otomatis. Pekerjaan pelabelan otomatis dapat berlangsung dari beberapa detik hingga beberapa menit, tergantung pada jumlah dokumen yang Anda sertakan.

    Cuplikan layar memperlihatkan layar ulasan untuk pekerjaan autotag.

Meninjau dokumen berlabel otomatis

Saat pekerjaan pelabelan otomatis selesai, Anda dapat melihat dokumen output di halaman Pelabelan data Language Studio. Pilih Tinjau dokumen dengan label otomatis untuk menampilkan dokumen dengan filter Dilabeli otomatis.

Cuplikan layar memperlihatkan dokumen berlabel otomatis

Entitas yang telah diberi label secara otomatis muncul dengan garis putus-putus. Entitas ini memiliki dua pemilih (tanda centang dan "X") yang memungkinkan Anda menerima atau menolak label otomatis.

Setelah entitas diterima, garis putus-putus berubah menjadi yang solid, dan label disertakan dalam pelatihan model lebih lanjut menjadi label yang ditentukan pengguna.

Atau, Anda dapat menerima atau menolak semua entitas yang dilabeli secara otomatis dalam dokumen, menggunakan Terima semua atau Tolak semua di sudut kanan atas layar.

Setelah Anda menerima atau menolak entitas berlabel, pilih Simpan label untuk menerapkan perubahan.

Catatan

  • Sebaiknya validasi entitas yang dilabeli secara otomatis sebelum menerimanya.
  • Semua label yang tidak diterima akan dihapus saat Anda melatih model Anda.

Cuplikan layar yang menunjukkan cara menerima dan menolak entitas berlabel otomatis.

Langkah berikutnya