Kategori (pratinjau) kustom

2025-01-22

Azure AI Content Safety memungkinkan Anda membuat dan mengelola kategori konten Anda sendiri untuk moderasi dan pemfilteran yang ditingkatkan yang cocok dengan kebijakan atau kasus penggunaan spesifik Anda.

Jenis kustomisasi

Ada beberapa metode untuk menentukan dan menggunakan kategori kustom, terperinci dan dibandingkan di bagian ini.

API	Fungsi
API kategori khusus (standar)	Gunakan model pembelajaran mesin yang dapat disesuaikan untuk membuat, mendapatkan, mengkueri, dan menghapus kategori yang dikustomisasi. Atau, cantumkan semua kategori yang disesuaikan untuk tugas anotasi lebih lanjut.
API kategori khusus (cepat)	Gunakan model bahasa besar (LLM) untuk mempelajari pola konten tertentu dengan cepat dalam insiden konten yang muncul.

API kategori kustom (standar)

API Kategori kustom (standar) memungkinkan pelanggan menentukan kategori khusus untuk kebutuhan mereka, menyediakan data sampel, melatih model pembelajaran mesin kustom, dan menggunakannya untuk mengklasifikasikan konten baru sesuai dengan kategori yang dipelajari.

Ini adalah alur kerja standar untuk kustomisasi dengan model pembelajaran mesin. Tergantung pada kualitas data pelatihan, ini dapat mencapai tingkat performa yang sangat baik, tetapi dapat memakan waktu hingga beberapa jam untuk melatih model.

Implementasi ini berfungsi pada konten teks, bukan konten gambar.

API kategori kustom (cepat)

API Kategori kustom (cepat) dirancang agar lebih cepat dan lebih fleksibel daripada metode standar. Ini dimaksudkan untuk digunakan dalam mengidentifikasi, menganalisis, menahan, memberantas, dan memulihkan dari insiden siber yang melibatkan konten yang tidak pantas atau berbahaya di platform online.

Insiden mungkin melibatkan serangkaian pola konten yang muncul (teks, gambar, atau modalitas lainnya) yang melanggar panduan komunitas Microsoft atau kebijakan dan harapan pelanggan sendiri. Insiden ini perlu dimitigasi dengan cepat dan akurat untuk menghindari potensi masalah situs langsung atau membahayakan pengguna dan komunitas.

Implementasi ini berfungsi pada konten teks dan konten gambar.

Tip

Yang lain untuk menangani insiden konten yang muncul adalah menggunakan Daftar Blokir, tetapi itu hanya memungkinkan pencocokan teks yang tepat dan tidak ada pencocokan gambar. API Kategori kustom (cepat) menawarkan kemampuan tingkat lanjut berikut:

pencocokan teks semantik menggunakan pencarian embedding dengan pengklasifikasi ringan
pemadanan gambar dengan model pelacakan objek ringan dan pencarian embedding.

Fitur kategori kustom Azure AI Content Safety menggunakan proses multi-langkah untuk membuat, melatih, dan menggunakan model klasifikasi konten kustom. Berikut alur kerjanya:

Langkah 1: Definisi dan penyiapan

Saat Anda menentukan kategori kustom, Anda perlu mengajari AI jenis konten apa yang ingin Anda identifikasi. Ini melibatkan pemberian nama kategori yang jelas dan definisi terperinci yang merangkum karakteristik konten.

Kemudian, Anda mengumpulkan himpunan data seimbang dengan contoh positif dan (opsional) contoh negatif untuk membantu AI mempelajari nuansa kategori Anda. Data ini harus mewakili berbagai konten yang akan ditemui model dalam skenario dunia nyata.

Langkah 2: Pelatihan model

Setelah Anda menyiapkan himpunan data dan menentukan kategori, layanan Azure AI Content Safety melatih model pembelajaran mesin baru. Model ini menggunakan definisi Anda dan himpunan data yang diunggah untuk melakukan augmentasi data menggunakan model bahasa besar. Akibatnya, himpunan data pelatihan dibuat lebih besar dan berkualitas lebih tinggi. Selama pelatihan, model AI menganalisis data dan belajar membedakan antara konten yang selaras dengan kategori dan konten yang ditentukan yang tidak.

Langkah 3: Evaluasi model

Setelah pelatihan, Anda perlu mengevaluasi model untuk memastikan model memenuhi persyaratan akurasi Anda. Uji model dengan konten baru yang belum diterima sebelumnya. Fase evaluasi membantu Anda mengidentifikasi potensi penyesuaian yang Anda butuhkan untuk membuat penyebaran model ke lingkungan produksi.

Langkah 4: Penggunaan model

Anda menggunakan ANALYZECustomCategory API untuk menganalisis konten teks dan menentukan apakah cocok dengan kategori kustom yang telah Anda tentukan. Layanan akan mengembalikan Boolean yang menunjukkan apakah konten selaras dengan kategori yang ditentukan

Batasan

Ketersediaan bahasa

API Kategori kustom mendukung semua bahasa yang didukung oleh moderasi teks Keamanan Konten. Lihat Dukungan bahasa komputer.

Batasan input

API kategori khusus (standar)
API kategori khusus (cepat)

Lihat tabel berikut untuk batasan input API kategori kustom (standar):

Objek	Pembatasan
Bahasa yang didukung	Hanya bahasa Inggris
Jumlah kategori per pengguna	3
Jumlah versi per kategori	3
Jumlah proses yang berjalan bersamaan per kategori	1
Operasi inferensi per detik	5
Jumlah sampel dalam versi kategori	Sampel positif (wajib): minimum 50, maksimum 5 ribu Total (sampel negatif dan positif): 10K Tidak ada sampel duplikat yang diizinkan.
Ukuran file sampel	maksimum 128000 byte
Panjang sampel teks	maksimum 125K karakter
Panjang definisi kategori	maksimum 1000 karakter
Panjang nama kategori	maksimum 128 karakter
Panjang URL blob	maksimum 500 karakter

Lihat tabel berikut untuk batasan input api kategori kustom (cepat):

Objek	Pembatasan
Panjang maksimum nama insiden	100 karakter
Jumlah maksimum sampel teks/gambar per insiden	1000
Ukuran maksimum setiap sampel	Teks: 500 karakter Gambar: 4 MB
Jumlah maksimum insiden teks atau gambar per sumber daya	100
Format Gambar yang Didukung	BMP, GIF, JPEG, PNG, TIF, WEBP

Ketersediaan wilayah

Untuk menggunakan API ini, Anda harus membuat sumber daya Azure AI Content Safety di salah satu wilayah yang didukung. Lihat Ketersediaan Wilayah.

Langkah selanjutnya

Ikuti panduan cara menggunakan API Keamanan Konten Azure AI untuk membuat kategori kustom.