Sebelum mulai menggunakan klasifikasi teks kustom, Anda memerlukan sumber daya Bahasa Azure AI. Disarankan untuk membuat sumber daya Bahasa dan menyambungkan akun penyimpanan ke dalamnya di portal Azure. Membuat sumber daya di portal Microsoft Azure memungkinkan Anda membuat akun penyimpanan Azure pada saat yang sama, dengan semua izin yang diperlukan telah dikonfigurasi sebelumnya. Anda juga dapat membaca lebih lanjut di artikel untuk mempelajari cara menggunakan sumber daya yang sudah ada sebelumnya, dan mengonfigurasinya untuk bekerja dengan klasifikasi teks kustom.
Anda juga akan memerlukan akun penyimpanan Azure tempat Anda akan mengunggah dokumen .txt yang akan digunakan untuk melatih model untuk mengklasifikasikan teks.
Catatan
Anda harus memiliki peran pemilik yang ditetapkan pada grup sumber daya untuk membuat sumber daya Bahasa.
Jika akan menyambungkan akun penyimpanan yang sudah ada, Anda harus memiliki peran pemilik yang ditetapkan.
Membuat sumber daya Bahasa dan menyambungkan akun penyimpanan
Catatan
Anda tidak boleh memindahkan akun penyimpanan ke grup sumber daya atau langganan yang berbeda setelah ditautkan dengan sumber daya Bahasa.
Di jendela yang muncul, pilih Klasifikasi teks kustom& pengenalan entitas bernama kustom dari fitur kustom. Pilih Lanjutkan untuk membuat sumber daya Anda di bagian bawah layar.
Buat sumber daya Bahasa dengan detail berikut.
Nama
Nilai yang diperlukan
Langganan
Langganan Azure Anda.
Grup sumber daya
Grup sumber daya yang akan berisi sumber daya Anda. Anda dapat menggunakan ruang kerja yang sudah ada atau membuat baru.
Jika Anda mendapatkan pesan yang mengatakan "akun masuk Anda bukan pemilik grup sumber daya akun penyimpanan yang dipilih", akun Anda harus memiliki peran pemilik yang ditetapkan pada grup sumber daya sebelum Anda dapat membuat sumber daya Bahasa. Hubungi pemilik langganan Azure Anda untuk bantuan.
Anda dapat menentukan pemilik langganan Azure dengan mencari grup sumber daya Anda dan mengikuti tautan ke langganan terkait. lalu:
Pilih tab Access Control (IAM)
Pilih Penetapan peran
Filter menurut Peran:Pemilik.
Di bagian Klasifikasi teks kustom & pengenalan entitas bernama kustom, pilih akun penyimpanan yang sudah ada atau pilih Akun penyimpanan baru. Perhatikan bahwa nilai ini untuk membantu Anda memulai, dan belum tentu nilai akun penyimpanan yang ingin Anda gunakan di lingkungan produksi. Untuk menghindari latensi selama membangun proyek Anda, sambungkan ke akun penyimpanan di wilayah yang sama dengan sumber daya Bahasa Anda.
Nilai akun penyimpanan
Nilai yang direkomendasikan
Nama akun penyimpanan
Nama apa pun
Jenis akun penyimpanan
LRS Standar
Pastikan Pemberitahuan AI yang Bertanggung Jawab diperiksa. Pilih Tinjau + buat di bagian bawah halaman.
Membuat sumber daya Bahasa baru dari Studio Bahasa
Jika ini pertama kalinya Anda masuk, Anda akan melihat jendela di Studio Bahasa yang akan memungkinkan Anda memilih sumber daya Bahasa yang ada atau membuat yang baru. Anda juga dapat membuat sumber daya dengan mengklik ikon pengaturan di sudut kanan atas, memilih Sumber Daya, lalu mengklik Buat sumber daya baru.
Pastikan untuk mengaktifkan Identitas Terkelola saat Anda membuat sumber daya Bahasa.
Membaca dan Mengonfirmasikan pemberitahuan AI yang Bertanggung Jawab
Untuk menggunakan klasifikasi teks kustom, Anda harus menyambungkan sumber daya anda ke akun penyimpanan. Jika belum memilikinya, Anda dapat membuat akun penyimpanan Azure. Gunakan langkah-langkah berikut untuk membuat proyek pertama Anda dan menyambungkan akun penyimpanan Anda.
Masuk ke Studio Bahasa. Sebuah jendela akan muncul yang memungkinkan Anda memilih langganan dan sumber daya Language. Pilih sumber daya Bahasa Anda.
Di bagian Klasifikasi teks di Studio Bahasa, pilih Klasifikasi teks kustom.
Pilih Buat proyek baru dari menu atas di halaman proyek Anda. Membuat proyek akan memungkinkan Anda melabeli data, melatih, mengevaluasi, meningkatkan, dan menyebarkan model Anda.
Setelah Anda mengeklik, Buat proyek baru, layar akan muncul untuk memungkinkan Anda menghubungkan akun penyimpanan Anda. Jika Anda sudah menyambungkan akun penyimpanan, Anda akan melihat akun penyimpanan tersambung. Jika tidak, pilih akun penyimpanan Anda dari menu dropdown yang muncul dan pilih akun penyimpanan Koneksi; ini akan mengatur peran yang diperlukan untuk akun penyimpanan Anda. Langkah ini mungkin akan mengembalikan kesalahan jika Anda tidak ditetapkan sebagai pemilik di akun penyimpanan.
Catatan
Cukup lakukan langkah ini sekali untuk setiap sumber daya baru yang Anda gunakan.
Proses ini tidak dapat diubah, jika Anda menghubungkan akun penyimpanan ke sumber daya Bahasa, Anda tidak dapat memutuskannya nanti.
Anda hanya dapat menghubungkan sumber daya Bahasa Anda ke satu akun penyimpanan.
Pilih jenis proyek. Anda dapat membuat proyek Klasifikasi multi-label yang setiap dokumennya dapat disertakan dalam satu atau beberapa kelas atau proyek Klasifikasi label tunggal yang setiap dokumennya hanya dapat disertakan dalam satu kelas. Jenis yang dipilih tidak dapat diubah nanti. Pelajari selengkapnya jenis proyek
Masukkan informasi proyek, termasuk nama, deskripsi, dan bahasa pemrogram file dalam dokumen di proyek Anda. Jika Anda menggunakan contoh himpunan data, pilih Bahasa Inggris. Anda tidak akan dapat mengubah nama proyek Anda nanti. Pilih Selanjutnya.
Tip
Himpunan data Anda tidak harus sepenuhnya dalam bahasa pemrogram yang sama. Anda dapat memiliki beberapa dokumen, masing-masing dengan bahasa yang didukung berbeda. Jika himpunan data Anda berisi dokumen dari bahasa yang berbeda atau jika Anda mengharapkan teks dari bahasa yang berbeda selama waktu proses, pilih opsi aktifkan himpunan data multi-bahasa saat Anda memasukkan informasi dasar untuk proyek Anda. Opsi ini dapat diaktifkan nanti dari halaman Pengaturan proyek.
Pilih kontainer tempat Anda mengunggah himpunan data Anda.
Catatan
Jika Anda telah memberi label data Anda pastikan data mengikuti format yang didukung dan pilih Ya, dokumen saya sudah diberi label dan saya telah memformat file label JSON dan memilih file label dari menu drop-down di bawah ini.
Jika Anda menggunakan salah satu contoh himpunan data, gunakan file yang disertakan webOfScience_labelsFile atau movieLabels json. Kemudian pilih Berikutnya.
Tinjau data yang Anda masukkan dan pilih Buat Project.
Anda dapat membuat sumber daya baru dan akun penyimpanan menggunakan templat CLI berikut dan file parameter, yang di-host pada GitHub.
Mengedit nilai berikut dalam file parameter:
Nama Parameter
Deskripsi nilai
name
Nama sumber Bahasa Anda
location
Wilayah tempat sumber daya Anda di-hosting. Lihat dukungan wilayah untuk informasi selengkapnya.
sku
Tingkat harga sumber daya Anda. Lihat batas layanan untuk informasi selengkapnya.
Proses menyambungkan akun penyimpanan ke sumber daya Bahasa tidak dapat dibatalkan, tidak dapat diputuskan nanti.
Anda hanya dapat menyambungkan sumber daya bahasa ke satu akun penyimpanan.
Menggunakan sumber daya Bahasa yang sudah ada sebelumnya
Persyaratan
Deskripsi
Wilayah
Pastikan sumber daya Anda yang sudah ada tersedia di salah satu wilayah yang didukung. Jika belum memiliki sumber daya, Anda harus membuat sumber daya baru di wilayah yang didukung.
Pilih Access Control (IAM) di menu panel navigasi kiri.
Pilih Tambahkan untuk Menambahkan Penetapan Peran, dan pilih peran Kontributor data blob penyimpanan di akun penyimpanan.
Dalam Tetapkan akses ke, pilih Identitas terkelola.
Pilih opsi Pilih anggota
Pilih langganan Anda, dan Bahasa sebagai identitas terkelola. Anda dapat mencari nama pengguna di bidang Pilih.
! [PENTING] Jika Anda memiliki jaringan virtual atau titik akhir privat, pastikan untuk memilih Izinkan layanan Azure pada daftar layanan tepercaya untuk mengakses akun penyimpanan ini di portal Azure.
Mengaktifkan CORS untuk akun penyimpanan Anda
Pastikan untuk mengizinkan metode (GET, PUT, DELETE) saat mengaktifkan Berbagi Sumber Daya Lintas Asal (CORS).
Tetapkan bidang asal yang diizinkan ke https://language.cognitive.azure.com. Izinkan semua header dengan menambahkan * ke nilai header yang diizinkan, dan tetapkan usia maksimum ke 500.
Membuat proyek klasifikasi kustom
Setelah sumber daya serta kontainer penyimpanan Anda dikonfigurasi, buat proyek klasifikasi teks baru. Proyek adalah area kerja untuk membangun model AI kustom berdasarkan data Anda. Proyek Anda hanya dapat diakses oleh Anda dan orang lain yang memiliki akses kontributor ke sumber daya Azure yang digunakan. Jika data telah diberi label, Anda dapat mengimpornya untuk memulai.
Masuk ke Studio Bahasa. Sebuah jendela akan muncul yang memungkinkan Anda memilih langganan dan sumber daya Language. Pilih sumber daya Bahasa Anda.
Di bagian Klasifikasi teks di Studio Bahasa, pilih Klasifikasi teks kustom.
Pilih Buat proyek baru dari menu atas di halaman proyek Anda. Membuat proyek akan memungkinkan Anda melabeli data, melatih, mengevaluasi, meningkatkan, dan menyebarkan model Anda.
Setelah Anda mengeklik, Buat proyek baru, layar akan muncul untuk memungkinkan Anda menghubungkan akun penyimpanan Anda. Jika Anda sudah menyambungkan akun penyimpanan, Anda akan melihat akun penyimpanan tersambung. Jika tidak, pilih akun penyimpanan Anda dari menu dropdown yang muncul dan pilih akun penyimpanan Koneksi; ini akan mengatur peran yang diperlukan untuk akun penyimpanan Anda. Langkah ini mungkin akan mengembalikan kesalahan jika Anda tidak ditetapkan sebagai pemilik di akun penyimpanan.
Catatan
Cukup lakukan langkah ini sekali untuk setiap sumber daya baru yang Anda gunakan.
Proses ini tidak dapat diubah, jika Anda menghubungkan akun penyimpanan ke sumber daya Bahasa, Anda tidak dapat memutuskannya nanti.
Anda hanya dapat menghubungkan sumber daya Bahasa Anda ke satu akun penyimpanan.
Pilih jenis proyek. Anda dapat membuat proyek Klasifikasi multi-label yang setiap dokumennya dapat disertakan dalam satu atau beberapa kelas atau proyek Klasifikasi label tunggal yang setiap dokumennya hanya dapat disertakan dalam satu kelas. Jenis yang dipilih tidak dapat diubah nanti. Pelajari selengkapnya jenis proyek
Masukkan informasi proyek, termasuk nama, deskripsi, dan bahasa pemrogram file dalam dokumen di proyek Anda. Jika Anda menggunakan contoh himpunan data, pilih Bahasa Inggris. Anda tidak akan dapat mengubah nama proyek Anda nanti. Pilih Selanjutnya.
Tip
Himpunan data Anda tidak harus sepenuhnya dalam bahasa pemrogram yang sama. Anda dapat memiliki beberapa dokumen, masing-masing dengan bahasa yang didukung berbeda. Jika himpunan data Anda berisi dokumen dari bahasa yang berbeda atau jika Anda mengharapkan teks dari bahasa yang berbeda selama waktu proses, pilih opsi aktifkan himpunan data multi-bahasa saat Anda memasukkan informasi dasar untuk proyek Anda. Opsi ini dapat diaktifkan nanti dari halaman Pengaturan proyek.
Pilih kontainer tempat Anda mengunggah himpunan data Anda.
Catatan
Jika Anda telah memberi label data Anda pastikan data mengikuti format yang didukung dan pilih Ya, dokumen saya sudah diberi label dan saya telah memformat file label JSON dan memilih file label dari menu drop-down di bawah ini.
Jika Anda menggunakan salah satu contoh himpunan data, gunakan file yang disertakan webOfScience_labelsFile atau movieLabels json. Kemudian pilih Berikutnya.
Tinjau data yang Anda masukkan dan pilih Buat Project.
Untuk mulai membuat model klasifikasi kustom, Anda harus membuat proyek. Membuat proyek akan memungkinkan Anda melabeli data, melatih, mengevaluasi, meningkatkan, dan menyebarkan model Anda.
Catatan
Nama proyek peka huruf besar/kecil untuk semua operasi.
Buat permintaan POST menggunakan URL, header, serta badan JSON berikut ini untuk membuat proyek Anda.
Minta URL
Gunakan URL berikut ini untuk membuat proyek. Ganti nilai tempat penampung di bawah ini dengan nilai Anda sendiri.
Nama untuk proyek Anda. Nilai ini peka huruf besar/kecil.
myProject
{API-VERSION}
Versi API yang Anda panggil. Nilai yang dirujuk di sini adalah untuk versi terbaru yang dirilis. Lihat Siklus hidup model untuk mempelajari selengkapnya tentang versi API lain yang tersedia.
2022-05-01
Header
Gunakan header berikut untuk mengautentikasi permintaan Anda.
Tombol
Nilai
Ocp-Apim-Subscription-Key
Kunci sumber daya Anda. Digunakan untuk mengautentikasi permintaan API Anda.
Isi
Gunakan JSON berikut dalam permintaan Anda. Ganti nilai tempat penampung di bawah ini dengan nilai Anda sendiri.
Nama proyek Anda. Nilai ini peka huruf besar/kecil.
myProject
bahasa
{LANGUAGE-CODE}
String yang menentukan kode bahasa untuk dokumen yang digunakan dalam proyek Anda. Jika proyek Anda adalah proyek multi-bahasa, pilih kode bahasa dari sebagian besar dokumen. Lihat dukungan bahasa untuk mempelajari selengkapnya tentang kode bahasa yang didukung.
en-us
projectKind
customMultiLabelClassification
Jenis proyek Anda.
customMultiLabelClassification
multilingual
true
Nilai boolean yang memungkinkan Anda memiliki dokumen dalam beberapa bahasa dalam kumpulan data Anda dan ketika model Anda disebarkan, Anda dapat membuat kueri model dalam bahasa apa pun yang didukung (tidak harus disertakan dalam dokumen pelatihan Anda. Lihat dukungan bahasa untuk mempelajari selengkapnya tentang dukungan multi-bahasa.
true
storageInputContainerName
{CONTAINER-NAME}
Nama kontainer penyimpanan Azure tempat Anda mengunggah dokumen.
Nama proyek Anda. Nilai ini peka huruf besar/kecil.
myProject
bahasa
{LANGUAGE-CODE}
String yang menentukan kode bahasa untuk dokumen yang digunakan dalam proyek Anda. Jika proyek Anda adalah proyek multi-bahasa, pilih kode bahasa dari sebagian besar dokumen. Lihat dukungan bahasa untuk mempelajari selengkapnya tentang kode bahasa yang didukung.
en-us
projectKind
customSingleLabelClassification
Jenis proyek Anda.
customSingleLabelClassification
multilingual
true
Nilai boolean yang memungkinkan Anda memiliki dokumen dalam beberapa bahasa dalam kumpulan data Anda dan ketika model Anda disebarkan, Anda dapat membuat kueri model dalam bahasa apa pun yang didukung (tidak harus disertakan dalam dokumen pelatihan Anda. Lihat dukungan bahasa untuk mempelajari selengkapnya tentang dukungan multi-bahasa.
true
storageInputContainerName
{CONTAINER-NAME}
Nama kontainer penyimpanan Azure tempat Anda mengunggah dokumen.
myContainer
Permintaan ini akan menghasilkan respons 201, yang berarti bahwa proyek telah dibuat.
Permintaan ini akan mengembalikan kesalahan jika:
Sumber daya yang dipilih tidak memiliki izin yang sesuai untuk akun penyimpanan.
Mengimpor proyek klasifikasi teks kustom
Jika Anda telah memberi label data, Anda dapat menggunakannya dengan memulai layanan. Pastikan bahwa data berlabel Anda mengikuti format data yang diterima.
Masuk ke Studio Bahasa. Sebuah jendela akan muncul yang memungkinkan Anda memilih langganan dan sumber daya Language. Pilih sumber daya Bahasa Anda.
Di bagian Klasifikasi teks di Studio Bahasa, pilih Klasifikasi teks kustom.
Pilih Buat proyek baru dari menu atas di halaman proyek Anda. Membuat proyek akan memungkinkan Anda melabeli data, melatih, mengevaluasi, meningkatkan, dan menyebarkan model Anda.
Setelah memilih Buat proyek baru, layar akan muncul untuk memungkinkan Anda menyambungkan akun penyimpanan Anda. Jika tidak dapat menemukan akun penyimpanan Anda, pastikan Anda membuat sumber daya menggunakan langkah-langkah yang disarankan. Jika sudah menyambungkan akun penyimpanan ke sumber daya Bahasa, Anda akan melihat akun penyimpanan Anda tersambung.
Catatan
Cukup lakukan langkah ini sekali untuk setiap sumber daya baru yang Anda gunakan.
Proses ini tidak dapat diubah, jika Anda menghubungkan akun penyimpanan ke sumber daya Bahasa, Anda tidak dapat memutuskannya nanti.
Anda hanya dapat menghubungkan sumber daya Bahasa Anda ke satu akun penyimpanan.
Pilih jenis proyek. Anda dapat membuat proyek Klasifikasi multi-label yang setiap dokumennya dapat disertakan dalam satu atau beberapa kelas atau proyek Klasifikasi label tunggal yang setiap dokumennya hanya dapat disertakan dalam satu kelas. Jenis yang dipilih tidak dapat diubah nanti.
Masukkan informasi proyek, termasuk nama, deskripsi, dan bahasa pemrogram file dalam dokumen di proyek Anda. Anda tidak akan dapat mengubah nama proyek Anda nanti. Pilih Selanjutnya.
Tip
Himpunan data Anda tidak harus sepenuhnya dalam bahasa pemrogram yang sama. Anda dapat memiliki beberapa dokumen, masing-masing dengan bahasa yang didukung berbeda. Jika himpunan data Anda berisi dokumen dari bahasa yang berbeda atau jika Anda mengharapkan teks dari bahasa yang berbeda selama waktu proses, pilih opsi aktifkan himpunan data multi-bahasa saat Anda memasukkan informasi dasar untuk proyek Anda. Opsi ini dapat diaktifkan nanti dari halaman Pengaturan proyek.
Pilih kontainer tempat Anda mengunggah himpunan data Anda.
Pilih Ya, dokumen saya sudah diberi label dan saya telah memformat file label JSON dan memilih file label dari menu drop-down di bawah ini untuk mengimpor file label JSON Anda. Pastikan sudah mengikuti format yang didukung.
Pilih Selanjutnya.
Tinjau data yang Anda masukkan dan pilih Buat Project.
Kirim permintaan POST menggunakan URL, header, dan isi JSON berikut untuk mengimpor file label Anda. Pastikan file label Anda mengikuti format yang diterima.
Jika sebuah proyek dengan nama yang sama sudah ada, data proyek tersebut diganti.
Nama untuk proyek Anda. Nilai ini peka huruf besar/kecil.
myProject
{API-VERSION}
Versi API yang Anda panggil. Nilai yang dirujuk di sini adalah untuk versi terbaru yang dirilis. Pelajari selengkapnya tentang versi API lain yang tersedia
2022-05-01
Header
Gunakan header berikut untuk mengautentikasi permintaan Anda.
Tombol
Nilai
Ocp-Apim-Subscription-Key
Kunci sumber daya Anda. Digunakan untuk mengautentikasi permintaan API Anda.
Isi
Gunakan JSON berikut dalam permintaan Anda. Ganti nilai tempat penampung di bawah ini dengan nilai Anda sendiri.
Versi API yang Anda panggil. Versi yang digunakan di sini harus versi API yang sama dengan di URL. Pelajari selengkapnya tentang versi API lain yang tersedia
2022-05-01
projectName
{PROJECT-NAME}
Nama proyek Anda. Nilai ini peka huruf besar/kecil.
myProject
projectKind
customMultiLabelClassification
Jenis proyek Anda.
customMultiLabelClassification
bahasa
{LANGUAGE-CODE}
String yang menentukan kode bahasa untuk dokumen yang digunakan dalam proyek Anda. Jika proyek Anda adalah proyek multi-bahasa, pilih kode bahasa dari sebagian besar dokumen. Lihat dukungan bahasa untuk mempelajari selengkapnya tentang dukungan multi-bahasa.
en-us
multilingual
true
Nilai boolean yang memungkinkan Anda memiliki dokumen dalam beberapa bahasa dalam kumpulan data Anda dan ketika model Anda disebarkan, Anda dapat membuat kueri model dalam bahasa apa pun yang didukung (tidak harus disertakan dalam dokumen pelatihan Anda. Lihat dukungan bahasa untuk mempelajari selengkapnya tentang dukungan multi-bahasa.
true
storageInputContainerName
{CONTAINER-NAME}
Nama kontainer penyimpanan Azure tempat Anda mengunggah dokumen.
myContainer
kelas
[]
Array yang berisi semua kelas yang Anda miliki dalam proyek. Ini adalah kelas yang Anda inginkan untuk mengklasifikasikan dokumen Anda.
[]
Dokumen
[]
Array yang berisi semua dokumen dalam proyek Anda dan kelas yang diberi label untuk dokumen ini.
[]
lokasi
{DOCUMENT-NAME}
Lokasi dokumen dalam kontainer penyimpanan. Karena semua dokumen berada di akar kontainer, ini akan menjadi nama dokumen.
doc1.txt
himpunan data
{DATASET}
Set pengujian yang akan digunakan untuk dokumen ini saat dibagi sebelum pelatihan. Lihat Cara melatih model untuk informasi selengkapnya tentang pemisahan data. Nilai yang mungkin untuk bidang ini adalah Train dan Test.
Versi API yang Anda panggil. Versi yang digunakan di sini harus versi API yang sama dengan di URL.
2022-05-01
projectName
{PROJECT-NAME}
Nama proyek Anda. Nilai ini peka huruf besar/kecil.
myProject
projectKind
customSingleLabelClassification
Jenis proyek Anda.
customSingleLabelClassification
bahasa
{LANGUAGE-CODE}
String yang menentukan kode bahasa untuk dokumen yang digunakan dalam proyek Anda. Jika proyek Anda adalah proyek multi-bahasa, pilih kode bahasa dari sebagian besar dokumen. Lihat dukungan bahasa untuk mempelajari selengkapnya tentang kode bahasa yang didukung.
en-us
multilingual
true
Nilai boolean yang memungkinkan Anda memiliki dokumen dalam beberapa bahasa dalam kumpulan data Anda dan ketika model Anda disebarkan, Anda dapat membuat kueri model dalam bahasa apa pun yang didukung (tidak harus disertakan dalam dokumen pelatihan Anda. Lihat dukungan bahasa untuk mempelajari selengkapnya tentang dukungan multi-bahasa.
true
storageInputContainerName
{CONTAINER-NAME}
Nama kontainer penyimpanan Azure tempat Anda mengunggah dokumen.
myContainer
kelas
[]
Array yang berisi semua kelas yang Anda miliki dalam proyek. Ini adalah kelas yang Anda inginkan untuk mengklasifikasikan dokumen Anda.
[]
Dokumen
[]
Array yang berisi semua dokumen dalam proyek Anda dan kelas yang dimiliki dokumen ini.
[]
lokasi
{DOCUMENT-NAME}
Lokasi dokumen dalam kontainer penyimpanan. Karena semua dokumen berada di akar kontainer, ini akan menjadi nama dokumen.
doc1.txt
himpunan data
{DATASET}
Set pengujian yang akan digunakan untuk dokumen ini saat dibagi sebelum pelatihan. Lihat Cara melatih model untuk mempelajari selengkapnya tentang pemisahan data. Nilai yang mungkin untuk bidang ini adalah Train dan Test.
Train
Setelah mengirim permintaan API, Anda akan menerima respons 202 yang menunjukkan bahwa pekerjaan telah dikirimkan dengan benar. Di header respons, ekstrak nilai operation-location. Nilai ini akan diformat seperti ini:
{JOB-ID} digunakan untuk mengidentifikasi permintaan Anda, karena operasi ini tidak asinkron. Anda akan menggunakan URL ini untuk mendapatkan status pekerjaan impor.
Kemungkinan skenario kesalahan untuk permintaan ini:
Sumber daya yang dipilih tidak memiliki izin yang sesuai untuk akun penyimpanan.
storageInputContainerName yang ditentukan tidak ada.
Kode bahasa tidak valid digunakan, atau jika jenis kode bahasa bukan string.
Nilai multilingual adalah string dan bukan boolean.
Di halaman ini Anda dapat memperbarui deskripsi proyek dan mengaktifkan/menonaktifkan himpunan data Multi-bahasa dalam pengaturan proyek.
Anda juga dapat melihat akun penyimpanan dan kontainer yang tersambung ke sumber daya Bahasa Anda.
Anda juga dapat mengambil kunci primer sumber daya dari halaman ini.
Untuk mendapatkan detail proyek klasifikasi teks kustom, kirimkan permintaan GET menggunakan URL dan header berikut. Ganti nilai tempat penampung dengan nilai Anda sendiri.
Nilai ini dapat berupa customSingleLabelClassification atau customMultiLabelClassification.
storageInputContainerName
{CONTAINER-NAME}
Nama kontainer penyimpanan Azure tempat Anda mengunggah dokumen.
myContainer
projectName
{PROJECT-NAME}
Nama proyek Anda. Nilai ini peka huruf besar/kecil.
myProject
multilingual
Nilai boolean yang memungkinkan Anda memiliki dokumen dalam beberapa bahasa dalam himpunan data Anda. Saat model disebarkan, Anda dapat mengkueri model dalam bahasa yang didukung (belum tentu disertakan dalam dokumen pelatihan Anda. Untuk informasi selengkapnya tentang dukungan multi-bahasa, lihat dukungan bahasa.
true
language
{LANGUAGE-CODE}
String yang menentukan kode bahasa untuk dokumen yang digunakan dalam proyek Anda. Jika proyek Anda adalah proyek multi-bahasa, pilih kode bahasa dari sebagian besar dokumen. Lihat dukungan bahasa untuk mempelajari selengkapnya tentang kode bahasa yang didukung.
en-us
Setelah Anda mengirim permintaan API, Anda akan menerima respons 200 yang menunjukkan keberhasilan dan isi respons JSON dengan detail proyek Anda.
Jika Anda tidak memerlukan proyek lagi, Anda dapat menghapus proyek menggunakan Language Studio. Pilih Klasifikasi teks kustom di bagian atas, lalu pilih proyek yang ingin Anda hapus. Pilih Hapus dari menu atas untuk menghapus proyek.
Saat tidak lagi membutuhkan proyek, Anda dapat menghapusnya dengan permintaan DELETE berikut. Ganti nilai tempat penampung dengan nilai Anda sendiri.
Nama untuk proyek Anda. Nilai ini peka huruf besar/kecil.
myProject
{API-VERSION}
Versi API yang Anda panggil. Nilai yang dirujuk di sini adalah untuk versi terbaru yang dirilis. Pelajari selengkapnya tentang versi API lain yang tersedia
2022-05-01
Header
Gunakan header berikut untuk mengautentikasi permintaan Anda.
Tombol
Nilai
Ocp-Apim-Subscription-Key
Kunci sumber daya Anda. Digunakan untuk mengautentikasi permintaan API Anda.
Setelah mengirim permintaan API, Anda akan menerima respons 202 yang menunjukkan keberhasilan, yang berarti proyek Anda telah dihapus. Hasil call yang sukses dengan header Operation-Location yang digunakan untuk memeriksa status pekerjaan.
Langkah berikutnya
Anda harus memiliki gagasan tentang skema proyek yang akan digunakan untuk memberikan label pada data Anda.
Setelah proyek dibuat, Anda dapat memulai memberi label pada data, yang akan menginformasikan model klasifikasi teks Anda cara menafsirkan teks, dan digunakan untuk pelatihan dan evaluasi.