Kategori kustom (pratinjau)
Azure AI Content Safety memungkinkan Anda membuat dan mengelola kategori kon mode tenda rasi Anda sendiri untuk moderasi dan pemfilteran yang ditingkatkan yang cocok dengan kebijakan atau kasus penggunaan spesifik Anda.
Jenis kustomisasi
Ada beberapa cara untuk menentukan dan menggunakan kategori kustom, yang dirinci dan dibandingkan di bagian ini.
API | Fungsi |
---|---|
API kategori kustom (standar) | Gunakan model pembelajaran mesin yang dapat disesuaikan untuk membuat, mendapatkan, mengkueri, dan menghapus kategori yang dikustomisasi. Atau, cantumkan semua kategori yang disesuaikan untuk tugas anotasi lebih lanjut. |
API kategori kustom (cepat) | Gunakan model bahasa besar (LLM) untuk mempelajari pola konten tertentu dengan cepat dalam insiden konten yang muncul. |
API kategori kustom (standar)
API Kategori kustom (standar) memungkinkan pelanggan menentukan kategori khusus untuk kebutuhan mereka, menyediakan data sampel, melatih model pembelajaran mesin kustom, dan menggunakannya untuk mengklasifikasikan konten baru sesuai dengan kategori yang dipelajari.
Ini adalah alur kerja standar untuk kustomisasi dengan model pembelajaran mesin. Tergantung pada kualitas data pelatihan, ini dapat mencapai tingkat performa yang sangat baik, tetapi dapat memakan waktu hingga beberapa jam untuk melatih model.
Implementasi ini berfungsi pada konten teks, bukan konten gambar.
API kategori kustom (cepat)
API Kategori kustom (cepat) dirancang agar lebih cepat dan lebih fleksibel daripada metode standar. Ini dimaksudkan untuk digunakan untuk mengidentifikasi, menganalisis, berisi, memberantas, dan memulihkan dari insiden cyber yang melibatkan konten yang tidak pantas atau berbahaya di platform online.
Insiden mungkin melibatkan serangkaian pola konten yang muncul (teks, gambar, atau modalitas lainnya) yang melanggar panduan komunitas Microsoft atau kebijakan dan harapan pelanggan sendiri. Insiden ini perlu dimitigasi dengan cepat dan akurat untuk menghindari potensi masalah situs langsung atau membahayakan pengguna dan komunitas.
Implementasi ini berfungsi pada konten teks dan konten gambar.
Tip
Salah satu cara untuk menangani insiden konten yang muncul adalah dengan menggunakan Daftar Blokir, tetapi itu hanya memungkinkan pencocokan teks yang tepat dan tidak ada pencocokan gambar. API Kategori kustom (cepat) menawarkan kemampuan tingkat lanjut berikut:
- pencocokan teks semantik menggunakan pencarian penyematan dengan pengklasifikasi ringan
- pencocokan gambar dengan model pelacakan objek ringan dan pencarian penyematan.
Cara kerjanya
Fitur kategori kustom Azure AI Content Safety menggunakan proses multi-langkah untuk membuat, melatih, dan menggunakan model klasifikasi konten kustom. Berikut adalah lihat alur kerja:
Langkah 1: Definisi dan penyiapan
Saat Anda menentukan kategori kustom, Anda perlu mengajari AI jenis konten apa yang ingin Anda identifikasi. Ini melibatkan pemberian nama kategori yang jelas dan definisi terperinci yang merangkum karakteristik konten.
Kemudian, Anda mengumpulkan himpunan data seimbang dengan contoh negatif positif dan (opsional) untuk membantu AI mempelajari nuansa kategori Anda. Data ini harus mewakili berbagai konten yang akan ditemui model dalam skenario dunia nyata.
Langkah 2: Pelatihan model
Setelah Anda menyiapkan himpunan data dan menentukan kategori, layanan Azure AI Content Safety melatih model pembelajaran mesin baru. Model ini menggunakan definisi Anda dan himpunan data yang diunggah untuk melakukan augmentasi data menggunakan model bahasa besar. Akibatnya, himpunan data pelatihan dibuat lebih besar dan berkualitas lebih tinggi. Selama pelatihan, model AI menganalisis data dan belajar membedakan antara konten yang selaras dengan kategori dan konten yang ditentukan yang tidak.
Langkah 3: Inferensi model
Setelah pelatihan, Anda perlu mengevaluasi model untuk memastikan model memenuhi persyaratan akurasi Anda. Uji model dengan konten baru yang belum diterima sebelumnya. Fase evaluasi membantu Anda mengidentifikasi potensi penyesuaian yang Anda butuhkan untuk membuat penyebaran model ke lingkungan produksi.
Langkah 4: Penggunaan model
Anda menggunakan ANALYZECustomCategory API untuk menganalisis konten teks dan menentukan apakah cocok dengan kategori kustom yang telah Anda tentukan. Layanan akan mengembalikan Boolean yang menunjukkan apakah konten selaras dengan kategori yang ditentukan
Batasan
Ketersediaan bahasa
API Kategori kustom mendukung semua bahasa yang didukung oleh moderasi teks Keamanan Konten. Lihat Dukungan bahasa komputer.
Batasan input
Lihat tabel berikut untuk batasan input API kategori kustom (standar):
Objek | Pembatasan |
---|---|
Bahasa yang didukung | Hanya bahasa Inggris |
Jumlah kategori per pengguna | 3 |
Jumlah versi per kategori | 3 |
Jumlah build bersamaan (proses) per kategori | 1 |
Operasi inferensi per detik | 5 |
Jumlah sampel dalam versi kategori | Sampel positif(wajib): minimum 50, maksimum 5K Total (sampel negatif dan positif): 10K Tidak ada sampel duplikat yang diizinkan. |
Ukuran file sampel | maksimum 128000 byte |
Panjang sampel teks | maksimum 125K karakter |
Panjang definisi kategori | maksimum 1000 karakter |
Panjang nama kategori | maksimum 128 karakter |
Panjang url blob | maksimum 500 karakter |