Apa itu klasifikasi teks kustom?

Artikel
12/19/2023

Klasifikasi teks kustom adalah salah satu fitur kustom yang ditawarkan oleh Bahasa Azure AI. Ini adalah layanan API berbasis cloud yang menerapkan kecerdasan pembelajaran mesin untuk memungkinkan Anda membangun model khusus untuk tugas klasifikasi teks.

Klasifikasi teks kustom memungkinkan pengguna untuk membangun model AI kustom untuk mengklasifikasikan teks ke dalam kelas khusus yang telah ditentukan sebelumnya oleh pengguna. Dengan membuat proyek klasifikasi teks kustom, pengembang dapat melabeli data secara berulang, melatih, mengevaluasi, dan meningkatkan performa model sebelum membuatnya tersedia untuk penggunaan. Kualitas data yang diberi label sangat mempengaruhi performa model. Untuk menyederhanakan proses membangun dan menyesuaikan model Anda, layanan ini menawarkan portal web khusus yang dapat diakses melalui Language Studio. Anda dapat dengan mudah memulai layanan ini dengan mengikuti langkah-langkah dalam mulai cepat ini.

Klasifikasi teks kustom mendukung dua jenis proyek:

Klasifikasi label tunggal - Anda dapat menetapkan satu kelas untuk setiap dokumen dalam kumpulan data Anda. Misalnya, naskah film hanya dapat diklasifikasikan sebagai "Romansa" atau "Komedi".
Klasifikasi multi-label - Anda dapat menetapkan beberapa kelas untuk setiap dokumen dalam kumpulan data Anda. Misalnya, skrip film dapat diklasifikasikan sebagai "Komedi" atau "Percintaan" dan "Komedi".

Dokumentasi ini berisi jenis artikel berikut:

Mulai Cepat memulai instruksi untuk memandu Anda membuat permintaan ke layanan.
Konsep memberikan penjelasan tentang fungsi dan fitur layanan.
Panduan berisi instruksi untuk menggunakan layanan dengan cara yang lebih spesifik atau disesuaikan.

Contoh skenario penggunaan

Klasifikasi teks kustom dapat digunakan dalam beberapa skenario di berbagai industri:

Triase tiket atau email otomatis

Pusat dukungan dari semua jenis menerima email atau tiket dalam jumlah besar yang berisi teks dan lampiran yang tidak terstruktur dan berbentuk bebas. Peninjauan, pemeriksaan, dan perutean yang tepat waktu untuk para ahli dalam tim internal sangat penting. Triase email pada skala ini mengharuskan orang untuk meninjau dan merutekan ke departemen yang tepat, yang memakan waktu dan sumber daya. Klasifikasi teks kustom dapat digunakan untuk menganalisis teks yang masuk, dan melakukan triase serta mengategorikan konten agar dirutekan ke departemen terkait secara otomatis untuk tindakan lebih lanjut.

Penambangan pengetahuan untuk meningkatkan/memperkaya pencarian semantik

Penelusuran adalah hal mendasar untuk aplikasi apa pun yang menampilkan konten teks kepada pengguna. Skenario umum mencakup penelusuran katalog atau dokumen, penelusuran produk ritel, atau penggalian pengetahuan untuk ilmu data. Banyak perusahaan di berbagai industri berusaha membangun pengalaman penelusuran yang kaya melalui konten pribadi dan heterogen, yang mencakup dokumen terstruktur dan tidak terstruktur. Sebagai bagian dari alur mereka, pengembang dapat menggunakan klasifikasi teks kustom untuk mengategorikan teks mereka ke dalam kelas yang relevan dengan industri mereka. Kelas yang diprediksi dapat digunakan untuk memperkaya pengindeksan file untuk pengalaman penelusuran yang lebih disesuaikan.

siklus hidup pengembangan Project

Membuat proyek klasifikasi teks kustom biasanya melibatkan beberapa langkah yang berbeda.

Ikuti langkah-langkah ini untuk mendapatkan hasil maksimal dari model Anda:

Tentukan skema Anda: Ketahui data Anda dan identifikasi kelas yang ingin Anda bedakan, untuk menghindari ambiguitas.
Melabeli data Anda: Kualitas pelabelan pada data adalah faktor kunci dalam menentukan performa model. Dokumen yang termasuk dalam kelas yang sama harus selalu memiliki kelas yang sama, jika Anda memiliki dokumen yang dapat dibagi menjadi dua kelas, gunakan proyek Klasifikasi multi-label. Hindari ambiguitas kelas, pastikan kelas Anda dapat dipisahkan dengan jelas satu sama lain, terutama dengan proyek klasifikasi label tunggal.
Melatih model: Model Anda mulai belajar dari data berlabel Anda.
Melihat performa model: Lihat detail evaluasi untuk model Anda guna menentukan seberapa baik performanya saat diperkenalkan ke data baru.
Sebarkan model: Menyebarkan model membuatnya tersedia untuk digunakan melalui Analyze API.
Klasifikasikan teks: Gunakan model kustom Anda untuk tugas klasifikasi teks kustom.

Dokumentasi referensi dan sampel kode

Saat Anda menggunakan klasifikasi teks kustom, lihat dokumentasi referensi dan sampel berikut untuk Bahasa Azure AI:

Opsi pengembangan/bahasa	Dokumentasi rujukan	Sampel
REST API (Penulisan)	Dokumentasi REST API
REST API (Runtime)	Dokumentasi REST API
C# (Runtime)	Dokumentasi C#	Sampel C# - Klasifikasi label tunggal Sampel C# - Klasifikasi multi-label
Java (Runtime)	Dokumentasi Java	Sampel Java - Klasifikasi label tunggal Sampel Java - Klasifikasi multi-label
JavaScript (Runtime)	Dokumentasi JavaScript	Sampel JavaScript - Klasifikasi label tunggal Sampel JavaScript - Klasifikasi multi-label
Python (Runtime)	Dokumentasi Python	Sampel Python - Klasifikasi label tunggal Sampel Python - Klasifikasi multi-label

AI yang bertanggung jawab

Sistem AI tidak hanya mencakup teknologi, tetapi juga orang-orang yang akan menggunakannya, orang-orang yang akan terdampak olehnya, dan lingkungan tempat AI disebarkan. Baca catatan transparansi untuk klasifikasi teks kustom untuk mempelajari tentang penggunaan dan penyebaran AI yang bertanggung jawab di sistem Anda. Anda juga membaca artikel berikut untuk mengetahui informasi lebih lanjut:

Langkah berikutnya

Gunakan artikel mulai cepat ini untuk mulai menggunakan klasifikasi teks kustom.
Saat Anda melalui siklus hidup pengembangan proyek, tinjau glosarium untuk mempelajari lebih lanjut tentang istilah yang digunakan di seluruh dokumentasi untuk fitur ini.
Ingatlah untuk melihat batas layanan guna mengetahui informasi seperti ketersediaan wilayah.