Bagikan melalui


Mulai cepat: Analisis sentimen kustom (pratinjau)

Gunakan artikel ini untuk mulai membuat proyek Analisis sentimen kustom tempat Anda dapat melatih model kustom untuk mendeteksi sentimen teks. Model adalah perangkat lunak kecerdasan buatan yang dilatih untuk melakukan tugas tertentu. Untuk sistem ini, model mengklasifikasikan teks, dan dilatih dengan belajar dari data yang diberi tag.

Prasyarat

Buat sumber daya Azure Language dan akun penyimpanan Azure baru

Sebelum dapat menggunakan Analisis sentimen kustom, Anda harus membuat sumber daya Bahasa Azure, yang akan memberi Anda kredensial yang Anda butuhkan untuk membuat proyek dan mulai melatih model. Anda juga memerlukan akun penyimpanan Azure, tempat Anda dapat mengunggah himpunan data yang akan digunakan untuk membangun model Anda.

Penting

Untuk memulai dengan cepat, sebaiknya buat sumber daya Bahasa Azure baru menggunakan langkah-langkah yang disediakan dalam artikel ini. Menggunakan langkah-langkah dalam artikel ini, Anda dapat membuat sumber daya Bahasa dan akun penyimpanan secara bersamaan, yang lebih mudah daripada melakukannya nanti.

Buat sumber daya baru menggunakan portal Microsoft Azure

  1. Buka portal Azure untuk membuat sumber daya Bahasa Azure AI baru.

  2. Di jendela yang muncul, pilih layanan ini dari fitur kustom. Pilih Lanjutkan untuk membuat sumber daya Anda di bagian bawah layar.

    A screenshot showing custom text classification & custom named entity recognition in the Azure portal.

  3. Buat sumber daya Bahasa dengan detail berikut.

    Nama Deskripsi
    Langganan Langganan Azure Anda.
    Grup sumber daya Grup sumber daya yang akan berisi sumber daya Anda. Anda dapat menggunakan ruang kerja yang sudah ada atau membuat baru.
    Wilayah Wilayah sumber daya Bahasa Anda. Misalnya, "US Barat 2".
    Nama Nama sumber daya Anda.
    Tingkatan harga Tingkat harga untuk sumber daya Bahasa Anda. Anda dapat menggunakan tingkat Gratis (F0) untuk mencoba layanan.

    Catatan

    Jika Anda mendapatkan pesan yang mengatakan "akun masuk Anda bukan pemilik grup sumber daya akun penyimpanan yang dipilih", akun Anda harus memiliki peran pemilik yang ditetapkan pada grup sumber daya sebelum Anda dapat membuat sumber daya Bahasa. Hubungi pemilik langganan Azure Anda untuk bantuan.

  4. Di bagian layanan ini, pilih akun penyimpanan yang sudah ada atau pilih Akun penyimpanan baru. Nilai ini untuk membantu Anda memulai, dan belum tentu menjadi nilai akun penyimpanan yang ingin Anda gunakan di lingkungan produksi. Untuk menghindari latensi selama membangun proyek Anda, sambungkan ke akun penyimpanan di wilayah yang sama dengan sumber daya Bahasa Anda.

    Nilai akun penyimpanan Nilai yang direkomendasikan
    Nama akun penyimpanan Nama apa pun
    Jenis akun penyimpanan LRS Standar
  5. Pastikan Pemberitahuan AI yang Bertanggung Jawab diperiksa. Lalu, pilih Tinjau + buat di bagian bawah halaman, kemudian pilih Buat.

Unggah data sampel ke kontainer blob

Setelah Anda membuat akun penyimpanan Azure dan menghubungkannya ke sumber daya Bahasa, Anda perlu mengunggah dokumen dari himpunan data sampel ke direktori akar kontainer Anda. Dokumen ini akan digunakan untuk melatih model Anda.

Mulailah dengan mengunduh himpunan data sampel untuk proyek analisis sentimen kustom. Buka file .zip, dan ekstrak folder yang berisi dokumen. Himpunan data sampel yang disediakan berisi dokumen, yang masing-masing merupakan contoh singkat dari tinjauan pelanggan.

  1. Temukan file untuk diunggah ke akun penyimpanan Anda

  2. Di portal Azure, buka akun penyimpanan yang Anda buat, dan pilih.

  3. Di akun penyimpanan Anda, pilih Kontainer dari menu kiri, yang terletak di bawah Penyimpanan data. Pada layar yang muncul, pilih + Kontainer. Beri kontainer nama contoh-data dan tinggalkan Tingkat akses publik default.

    A screenshot showing the main page for a storage account.

  4. Setelah kontainer Anda dibuat, pilih itu. Lalu pilih tombol Unggah untuk memilih file dan .json yang .txt Anda unduh sebelumnya.

    A screenshot showing the button for uploading files to the storage account.

Membuat proyek analisis sentimen kustom

Setelah kontainer sumber daya dan penyimpanan Anda dikonfigurasi, buat proyek analisis sentimen kustom baru. Proyek adalah area kerja untuk membuat model ML kustom berdasarkan data Anda. Proyek Anda hanya dapat diakses oleh Anda dan orang lain yang memiliki akses ke sumber daya Bahasa yang digunakan.

  1. Masuk ke Studio Bahasa. Sebuah jendela akan muncul yang memungkinkan Anda memilih langganan dan sumber daya Language. Pilih sumber daya yang Anda buat pada langkah di atas.

  2. Pilih fitur yang ingin Anda gunakan di Language Studio.

  3. Pilih Buat proyek baru dari menu atas di halaman proyek Anda. Membuat proyek memungkinkan Anda memberi label data, melatih, mengevaluasi, meningkatkan, dan menyebarkan model Anda.

    A screenshot of the project creation page.

  4. Masukkan informasi proyek, termasuk nama, deskripsi, dan bahasa pemrogram file dalam proyek Anda. Jika Anda menggunakan contoh himpunan data, pilih Bahasa Inggris. Anda tidak dapat mengubah nama proyek Anda nanti. Pilih Selanjutnya

    Tip

    Himpunan data Anda tidak harus sepenuhnya dalam bahasa pemrogram yang sama. Anda dapat memiliki beberapa dokumen, masing-masing dengan bahasa yang didukung berbeda. Jika himpunan data Anda berisi dokumen dari bahasa yang berbeda atau jika Anda mengharapkan teks dari bahasa yang berbeda selama waktu proses, pilih opsi aktifkan himpunan data multi-bahasa saat Anda memasukkan informasi dasar untuk proyek Anda. Opsi ini dapat diaktifkan nanti dari halaman Pengaturan proyek.

  5. Setelah Anda memilih Buat proyek baru, jendela akan muncul untuk memungkinkan Anda menyambungkan akun penyimpanan Anda. Jika Anda sudah menyambungkan akun penyimpanan, Anda akan melihat akun penyimpanan tersambung. Jika tidak, pilih akun penyimpanan Anda dari menu dropdown yang muncul dan pilih akun penyimpanan Koneksi; ini akan mengatur peran yang diperlukan untuk akun penyimpanan Anda. Langkah ini mungkin akan mengembalikan kesalahan jika Anda tidak ditetapkan sebagai pemilik di akun penyimpanan.

    Catatan

    • Anda hanya perlu melakukan langkah ini sekali untuk setiap sumber daya baru yang Anda gunakan.
    • Proses ini tidak dapat diubah, jika Anda menghubungkan akun penyimpanan ke sumber daya Bahasa, Anda tidak dapat memutuskannya nanti.
    • Anda hanya dapat menghubungkan sumber daya Bahasa Anda ke satu akun penyimpanan.
  6. Pilih kontainer tempat Anda mengunggah himpunan data Anda.

  7. Jika Anda telah melabeli data pastikan data mengikuti format yang didukung dan memilih Ya, file saya sudah diberi label dan saya telah memformat file label JSON dan memilih file label dari menu drop-down. Pilih Selanjutnya. Jika Anda menggunakan himpunan data dari Mulai Cepat, Anda tidak perlu meninjau pemformatan file label JSON.

  8. Tinjau data yang Anda masukkan dan pilih Buat Project.

Melatih model

Biasanya setelah membuat proyek, Anda mulai melabeli dokumen yang Anda miliki di kontainer yang tersambung ke proyek Anda. Untuk mulai cepat ini, Anda sudah mengimpor sampel himpunan data yang dilabeli dan menginisialisasi proyek Anda dengan sampel file berlabel JSON.

Untuk mulai melatih model Anda dari dalam Language Studio:

  1. Pilih Pekerjaan pelatihan dari menu sebelah kiri.

  2. Pilih Mulai pekerjaan pelatihan dari menu atas.

  3. Pilih Latih model baru dan ketik nama model di kotak teks. Anda juga dapat menimpa model yang ada dengan memilih opsi ini dan memilih model yang ingin Anda timpa dari menu drop-down. Menimpa model terlatih tidak dapat diubah, tetapi tidak akan memengaruhi model yang Anda sebarkan hingga Anda menyebarkan model baru.

    Create a new training job

  4. Secara default, sistem akan membagi data berlabel Anda antara set pelatihan dan pengujian, sesuai dengan persentase yang ditentukan. Jika Anda memiliki dokumen dalam set pengujian, Anda dapat membagi data pelatihan dan pengujian secara manual.

  5. Pilih tombol Latih.

  6. Jika Anda memilih ID Pekerjaan Pelatihan dari daftar, panel samping akan muncul di mana Anda dapat memeriksa kemajuan Pelatihan, Status pekerjaan, dan detail lainnya untuk pekerjaan ini.

    Catatan

    • Hanya pekerjaan pelatihan yang berhasil diselesaikan yang akan menghasilkan model.
    • Pelatihan dapat memakan waktu antara beberapa menit dan beberapa jam berdasarkan ukuran data berlabel Anda.
    • Anda hanya dapat memiliki satu pekerjaan pelatihan yang berjalan pada satu waktu. Anda tidak dapat memulai pekerjaan pelatihan lain dalam proyek yang sama sampai pekerjaan yang sedang berjalan selesai.

Sebarkan model anda

Biasanya setelah melatih model, Anda akan meninjau detail evaluasi dan melakukan peningkatan jika perlu. Dalam mulai cepat ini, Anda hanya akan menyebarkan model Anda, dan membuatnya tersedia untuk Anda coba di Language Studio, atau Anda dapat memanggil API prediksi.

Untuk menyebarkan model Anda dari dalam Language Studio:

  1. Pilih Menyebarkan model dari menu sebelah kiri.

  2. Pilih Tambahkan penyebaran untuk memulai pekerjaan penyebaran baru.

    A screenshot showing the deployment button

  3. Pilih Buat penyebaran baru untuk membuat penyebaran baru dan tetapkan model terlatih dari menu drop-down di bawah ini. Anda juga dapat Menimpa penyebaran yang ada dengan memilih opsi ini dan memilih model terlatih yang ingin Anda tetapkan dari menu drop-down di bawah ini.

    Catatan

    Menimpa penyebaran yang ada tidak memerlukan perubahan pada panggilan API prediksi Anda tetapi hasil yang Anda dapatkan akan didasarkan pada model yang baru ditetapkan.

    A screenshot showing the deployment screen

  4. Pilih Sebarkan untuk memulai pekerjaan penyebaran.

  5. Setelah penyebaran berhasil, tanggal kedaluwarsa akan muncul di sampingnya. Kedaluwarsa penyebaran adalah ketika model yang Anda sebarkan tidak akan tersedia untuk digunakan untuk prediksi, yang biasanya terjadi dua belas bulan setelah konfigurasi pelatihan kedaluwarsa.

Uji model Anda

Setelah model disebarkan, Anda dapat mulai menggunakannya untuk mengklasifikasikan teks Anda melalui API Prediksi. Untuk mulai cepat ini, Anda akan menggunakan Language Studio untuk mengirimkan tugas Analisis sentimen kustom dan memvisualisasikan hasilnya. Dalam himpunan data sampel yang Anda unduh sebelumnya, Anda dapat menemukan beberapa dokumen pengujian yang dapat Anda gunakan pada langkah ini.

Untuk menguji model disebarkan dari dalam Language Studio:

  1. Pilih Menguji penyebaran dari menu sebelah kiri.

  2. Pilih penyebaran yang ingin Anda uji. Anda hanya dapat menguji model yang ditetapkan untuk penyebaran.

  3. Untuk proyek multi-bahasa, dari menu dropdown bahasa, pilih bahasa teks yang sedang Anda uji.

  4. Pilih penyebaran yang ingin Anda kueri/uji dari menu dropdown.

  5. Anda dapat memasukkan teks yang ingin dikirimkan ke permintaan atau unggah file .txt yang akan digunakan.

  6. Pilih Jalankan pengujian dari menu atas.

  7. Di tab Hasil, Anda dapat melihat entitas yang diekstraksi dari teks dan jenisnya. Anda juga dapat melihat respons JSON pada tab JSON.

Membersihkan proyek

Jika Anda tidak memerlukan proyek lagi, Anda dapat menghapus proyek menggunakan Language Studio. Pilih fitur yang Anda gunakan di bagian atas, lalu pilih proyek yang ingin Anda hapus. Pilih Hapus dari menu atas untuk menghapus proyek.

Prasyarat

Buat sumber daya Azure Language dan akun penyimpanan Azure baru

Sebelum dapat menggunakan Analisis sentimen kustom, Anda harus membuat sumber daya Bahasa Azure, yang akan memberi Anda kredensial yang Anda butuhkan untuk membuat proyek dan mulai melatih model. Anda juga memerlukan akun penyimpanan Azure, tempat Anda dapat mengunggah himpunan data yang akan digunakan dalam membangun model Anda.

Penting

Untuk memulai dengan cepat, kami sarankan untuk membuat sumber daya Azure Language baru menggunakan langkah-langkah yang disediakan dalam artikel ini, yang memungkinkan Anda membuat sumber daya Bahasa, dan membuat dan/atau menyambungkan akun penyimpanan pada saat yang sama, yang lebih mudah daripada melakukannya nanti.

Buat sumber daya baru menggunakan portal Microsoft Azure

  1. Buka portal Azure untuk membuat sumber daya Bahasa Azure AI baru.

  2. Di jendela yang muncul, pilih layanan ini dari fitur kustom. Pilih Lanjutkan untuk membuat sumber daya Anda di bagian bawah layar.

    A screenshot showing custom text classification & custom named entity recognition in the Azure portal.

  3. Buat sumber daya Bahasa dengan detail berikut.

    Nama Deskripsi
    Langganan Langganan Azure Anda.
    Grup sumber daya Grup sumber daya yang akan berisi sumber daya Anda. Anda dapat menggunakan ruang kerja yang sudah ada atau membuat baru.
    Wilayah Wilayah sumber daya Bahasa Anda. Misalnya, "US Barat 2".
    Nama Nama sumber daya Anda.
    Tingkatan harga Tingkat harga untuk sumber daya Bahasa Anda. Anda dapat menggunakan tingkat Gratis (F0) untuk mencoba layanan.

    Catatan

    Jika Anda mendapatkan pesan yang mengatakan "akun masuk Anda bukan pemilik grup sumber daya akun penyimpanan yang dipilih", akun Anda harus memiliki peran pemilik yang ditetapkan pada grup sumber daya sebelum Anda dapat membuat sumber daya Bahasa. Hubungi pemilik langganan Azure Anda untuk bantuan.

  4. Di bagian layanan ini, pilih akun penyimpanan yang sudah ada atau pilih Akun penyimpanan baru. Nilai ini untuk membantu Anda memulai, dan belum tentu menjadi nilai akun penyimpanan yang ingin Anda gunakan di lingkungan produksi. Untuk menghindari latensi selama membangun proyek Anda, sambungkan ke akun penyimpanan di wilayah yang sama dengan sumber daya Bahasa Anda.

    Nilai akun penyimpanan Nilai yang direkomendasikan
    Nama akun penyimpanan Nama apa pun
    Jenis akun penyimpanan LRS Standar
  5. Pastikan Pemberitahuan AI yang Bertanggung Jawab diperiksa. Lalu, pilih Tinjau + buat di bagian bawah halaman, kemudian pilih Buat.

Unggah data sampel ke kontainer blob

Setelah Anda membuat akun penyimpanan Azure dan menghubungkannya ke sumber daya Bahasa, Anda perlu mengunggah dokumen dari himpunan data sampel ke direktori akar kontainer Anda. Dokumen ini akan digunakan untuk melatih model Anda.

Mulailah dengan mengunduh himpunan data sampel untuk proyek analisis sentimen kustom. Buka file .zip, dan ekstrak folder yang berisi dokumen. Himpunan data sampel yang disediakan berisi dokumen, yang masing-masing merupakan contoh singkat dari tinjauan pelanggan.

  1. Temukan file untuk diunggah ke akun penyimpanan Anda

  2. Di portal Azure, buka akun penyimpanan yang Anda buat, dan pilih.

  3. Di akun penyimpanan Anda, pilih Kontainer dari menu kiri, yang terletak di bawah Penyimpanan data. Pada layar yang muncul, pilih + Kontainer. Beri kontainer nama contoh-data dan tinggalkan Tingkat akses publik default.

    A screenshot showing the main page for a storage account.

  4. Setelah kontainer Anda dibuat, pilih itu. Lalu pilih tombol Unggah untuk memilih file dan .json yang .txt Anda unduh sebelumnya.

    A screenshot showing the button for uploading files to the storage account.

Dapatkan kunci dan titik akhir Anda

Selanjutnya Anda akan memerlukan kunci dan titik akhir dari sumber daya untuk menghubungkan aplikasi Anda ke API. Anda akan menempelkan kunci dan titik akhir Anda ke dalam kode di mulai cepat nanti.

  1. Setelah sumber daya Bahasa berhasil disebarkan, klik tombol Buka Sumber Daya di bawah Langkah Berikutnya.

    A screenshot showing the next steps after a resource has deployed.

  2. Pada layar untuk sumber daya Anda, pilih Kunci dan titik akhir di menu navigasi kiri. Anda akan menggunakan salah satu kunci dan titik akhir Anda dalam langkah-langkah di bawah ini.

    A screenshot showing the keys and endpoint section for a resource.

Membuat proyek analisis sentimen kustom

Setelah kontainer sumber daya dan penyimpanan Anda dikonfigurasi, buat proyek analisis sentimen kustom baru. Proyek adalah area kerja untuk membuat model ML kustom berdasarkan data Anda. Proyek Anda hanya dapat diakses oleh Anda dan orang lain yang memiliki akses ke sumber daya Bahasa yang digunakan.

Memicu pekerjaan proyek impor

Kirim permintaan POST menggunakan URL, header, dan isi JSON berikut untuk mengimpor file label Anda.

Jika sebuah proyek dengan nama yang sama sudah ada, data proyek tersebut diganti.

{Endpoint}/language/authoring/analyze-text/projects/{projectName}/:import?api-version={API-VERSION}
Placeholder Value Contoh
{ENDPOINT} Titik akhir untuk mengautentikasi permintaan API Anda. https://<your-custom-subdomain>.cognitiveservices.azure.com
{PROJECT-NAME} Nama untuk proyek Anda. Nilai ini peka huruf besar/kecil. myProject
{API-VERSION} Versi API yang Anda panggil. Nilai yang dirujuk di sini adalah untuk versi terbaru yang dirilis. Pelajari selengkapnya tentang versi API lain yang tersedia 2023-04-15-preview

Header

Gunakan header berikut untuk mengautentikasi permintaan Anda.

Tombol Nilai
Ocp-Apim-Subscription-Key Kunci sumber daya Anda. Digunakan untuk mengautentikasi permintaan API Anda.

Isi

Gunakan JSON berikut dalam permintaan Anda. Ganti nilai tempat penampung di bawah ini dengan nilai Anda sendiri.

{
  "projectFileVersion": "2023-04-15-preview",
  "stringIndexType": "Utf16CodeUnit",
  "metadata": {
    "projectKind": "CustomTextSentiment",
    "storageInputContainerName": "text-sentiment",
    "projectName": "TestSentiment",
    "multilingual": false,
    "description": "This is a Custom sentiment analysis project.",
    "language": "en-us"
  },
  "assets": {
    "projectKind": "CustomTextSentiment",
    "documents": [
      {
        "location": "documents/document_1.txt",
        "language": "en-us",
        "sentimentSpans": [
            {
                "category": "negative",
                "offset": 0,
                "length": 28
            }
        ]
      },
      {
          "location": "documents/document_2.txt",
          "language": "en-us",
          "sentimentSpans": [
              {
                  "category": "negative",
                  "offset": 0,
                  "length": 24
              }
          ]
      },
      {
          "location": "documents/document_3.txt",
          "language": "en-us",
          "sentimentSpans": [
              {
                  "category": "neutral",
                  "offset": 0,
                  "length": 18
              }
          ]
      }
    ]
  }
}


Tombol Placeholder Value Contoh
versi-api {API-VERSION} Versi API yang Anda panggil. Versi yang digunakan di sini harus versi API yang sama dengan di URL. Pelajari selengkapnya tentang versi API lain yang tersedia 2023-04-15-preview
projectName {PROJECT-NAME} Nama proyek Anda. Nilai ini peka huruf besar/kecil. myProject
projectKind CustomTextSentiment Jenis proyek Anda. CustomTextSentiment
bahasa {LANGUAGE-CODE} String yang menentukan kode bahasa untuk dokumen yang digunakan dalam proyek Anda. Jika proyek Anda adalah proyek multi-bahasa, pilih kode bahasa dari sebagian besar dokumen. Lihat dukungan bahasa untuk mempelajari selengkapnya tentang dukungan multi-bahasa. en-us
multilingual true Nilai boolean yang memungkinkan Anda memiliki dokumen dalam beberapa bahasa dalam himpunan data Anda dan saat model Anda disebarkan, Anda dapat mengkueri model dalam bahasa yang didukung yang belum tentu disertakan dalam dokumen pelatihan Anda. Lihat dukungan bahasa untuk mempelajari selengkapnya tentang dukungan multi-bahasa. true
storageInputContainerName {CONTAINER-NAME} Nama kontainer penyimpanan Azure tempat Anda mengunggah dokumen. myContainer
Dokumen [] Array yang berisi semua dokumen dalam proyek Anda dan kelas yang diberi label untuk dokumen ini. []
lokasi {DOCUMENT-NAME} Lokasi dokumen dalam kontainer penyimpanan. Karena semua dokumen berada di akar kontainer, ini akan menjadi nama dokumen. doc1.txt
sentimentSpans {sentimentSpans} Sentimen dokumen (positif, netral, negatif), posisi di mana sentimen dimulai, dan panjangnya. []

Setelah mengirim permintaan API, Anda akan menerima respons 202 yang menunjukkan bahwa pekerjaan telah dikirimkan dengan benar. Di header respons, ekstrak nilai operation-location. Nilai ini akan diformat seperti ini:

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/import/jobs/{JOB-ID}?api-version={API-VERSION}

{JOB-ID} digunakan untuk mengidentifikasi permintaan Anda, karena operasi ini tidak asinkron. Anda akan menggunakan URL ini untuk mendapatkan status pekerjaan impor.

Kemungkinan skenario kesalahan untuk permintaan ini:

  • storageInputContainerName yang ditentukan tidak ada.
  • Kode bahasa tidak valid digunakan, atau jika jenis kode bahasa bukan string.
  • Nilai multilingual adalah string dan bukan boolean.

Mendapatkan status pekerjaan impor

Gunakan permintaan GET berikut untuk mendapatkan status impor proyek Anda. Ganti nilai tempat penampung di bawah ini dengan nilai Anda sendiri.

Minta URL

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/import/jobs/{JOB-ID}?api-version={API-VERSION}
Placeholder Value Contoh
{ENDPOINT} Titik akhir untuk mengautentikasi permintaan API Anda. https://<your-custom-subdomain>.cognitiveservices.azure.com
{PROJECT-NAME} Nama proyek Anda. Nilai ini peka huruf besar/kecil. myProject
{JOB-ID} ID untuk menemukan status pelatihan model Anda. Nilai ini ada di nilai header location yang Anda terima pada langkah sebelumnya. xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION} Versi API yang Anda panggil. Nilai yang dirujuk di sini adalah untuk versi terbaru yang dirilis. Pelajari selengkapnya tentang versi API lain yang tersedia 2023-04-15-preview

Header

Gunakan header berikut untuk mengautentikasi permintaan Anda.

Tombol Nilai
Ocp-Apim-Subscription-Key Kunci sumber daya Anda. Digunakan untuk mengautentikasi permintaan API Anda.

Melatih model

Biasanya setelah membuat proyek, Anda mulai menandai dokumen yang Anda miliki di kontainer yang tersambung ke proyek Anda. Untuk mulai cepat ini, Anda sudah mengimpor sampel himpunan data yang ditandai dan menginisialisasi proyek Anda dengan sampel file tag JSON.

Mulai latih model Anda

Setelah proyek Anda diimpor, Anda dapat mulai melatih model Anda.

Kirim permintaan POST menggunakan URL, header, dan isi JSON berikut untuk mengirimkan pekerjaan pelatihan. Ganti nilai tempat penampung dengan nilai Anda sendiri.

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/:train?api-version={API-VERSION}
Placeholder Value Contoh
{ENDPOINT} Titik akhir untuk mengautentikasi permintaan API Anda. https://<your-custom-subdomain>.cognitiveservices.azure.com
{PROJECT-NAME} Nama proyek Anda. Nilai ini peka huruf besar/kecil. myProject
{API-VERSION} Versi API yang Anda panggil. Nilai yang dirujuk di sini adalah untuk versi terbaru yang dirilis. Pelajari selengkapnya tentang versi API lain yang tersedia 2023-04-15-preview

Header

Gunakan header berikut untuk mengautentikasi permintaan Anda.

Tombol Nilai
Ocp-Apim-Subscription-Key Kunci sumber daya Anda. Digunakan untuk mengautentikasi permintaan API Anda.

Isi permintaan

Gunakan JSON berikut di isi permintaan Anda. Model akan diberi {MODEL-NAME} setelah pelatihan selesai. Hanya pekerjaan pelatihan yang berhasil yang akan menghasilkan model.

{
	"modelLabel": "{MODEL-NAME}",
	"trainingConfigVersion": "{CONFIG-VERSION}",
	"evaluationOptions": {
		"kind": "percentage",
		"trainingSplitPercentage": 80,
		"testingSplitPercentage": 20
	}
}
Tombol Placeholder Value Contoh
modelLabel {MODEL-NAME} Nama model yang akan ditetapkan ke model Anda setelah berhasil dilatih. myModel
trainingConfigVersion {CONFIG-VERSION} Ini adalah versi model yang akan digunakan untuk melatih model. 2023-04-15-preview
evaluationOptions Opsi untuk membagi data Anda di seluruh set pelatihan dan pengujian. {}
jenis percentage Memisahkan metode. Nilai yang mungkin adalah percentage atau manual. percentage
trainingSplitPercentage 80 Persentase data Anda yang diberi tag untuk disertakan dalam set pelatihan. Nilai yang disarankan adalah 80. 80
testingSplitPercentage 20 Persentase data Anda yang diberi tag untuk disertakan dalam set pengujian. Nilai yang disarankan adalah 20. 20

Catatan

trainingSplitPercentage dan testingSplitPercentage hanya diperlukan jika Kind diatur ke percentage dan jumlah kedua persentase harus sama dengan 100.

Setelah mengirim permintaan API, Anda akan menerima respons 202 yang menunjukkan bahwa pekerjaan telah dikirimkan dengan benar. Di header respons, ekstrak nilai location. Nilai ini akan diformat seperti ini:

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}

{JOB-ID} digunakan untuk mengidentifikasi permintaan Anda, karena operasi ini tidak asinkron. Anda dapat menggunakan URL ini untuk mendapatkan status pelatihan.

Dapatkan status pekerjaan pelatihan

Pelatihan bisa memakan waktu antara 10 dan 30 menit. Anda dapat menggunakan permintaan berikut untuk terus melakukan polling status pekerjaan pelatihan hingga berhasil diselesaikan.

Gunakan permintaan GET berikut untuk mendapatkan status kemajuan pelatihan model Anda. Ganti nilai tempat penampung dengan nilai Anda sendiri.

Minta URL

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}
Placeholder Value Contoh
{ENDPOINT} Titik akhir untuk mengautentikasi permintaan API Anda. https://<your-custom-subdomain>.cognitiveservices.azure.com
{PROJECT-NAME} Nama proyek Anda. Nilai ini peka huruf besar/kecil. myProject
{JOB-ID} ID untuk menemukan status pelatihan model Anda. Nilai ini ada di nilai header location yang Anda terima pada langkah sebelumnya. xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION} Versi API yang Anda panggil. Nilai yang dirujuk di sini adalah untuk versi terbaru yang dirilis. Lihat Siklus hidup model untuk mempelajari selengkapnya mengenai versi API lain yang tersedia. 2023-04-15-preview

Header

Gunakan header berikut untuk mengautentikasi permintaan Anda.

Tombol Nilai
Ocp-Apim-Subscription-Key Kunci sumber daya Anda. Digunakan untuk mengautentikasi permintaan API Anda.

Isi respons

Setelah mengirim permintaan, Anda akan mendapatkan respons berikut.

{
  "result": {
    "modelLabel": "{MODEL-NAME}",
    "trainingConfigVersion": "{CONFIG-VERSION}",
    "estimatedEndDateTime": "2022-04-18T15:47:58.8190649Z",
    "trainingStatus": {
      "percentComplete": 3,
      "startDateTime": "2022-04-18T15:45:06.8190649Z",
      "status": "running"
    },
    "evaluationStatus": {
      "percentComplete": 0,
      "status": "notStarted"
    }
  },
  "jobId": "{JOB-ID}",
  "createdDateTime": "2022-04-18T15:44:44Z",
  "lastUpdatedDateTime": "2022-04-18T15:45:48Z",
  "expirationDateTime": "2022-04-25T15:44:44Z",
  "status": "running"
}

Sebarkan model anda

Biasanya setelah melatih model, Anda akan meninjau detail evaluasi dan melakukan peningkatan jika perlu. Dalam mulai cepat ini, Anda hanya akan menyebarkan model Anda, dan membuatnya tersedia untuk Anda coba di Language Studio, atau Anda dapat memanggil API prediksi.

Mengirimkan pekerjaan penyebaran

Kirim permintaan PUT menggunakan URL, header, dan isi JSON berikut untuk mengirimkan tugas penyebaran. Ganti nilai tempat penampung dengan nilai Anda sendiri.

{Endpoint}/language/authoring/analyze-text/projects/{projectName}/deployments/{deploymentName}?api-version={API-VERSION}
Placeholder Value Contoh
{ENDPOINT} Titik akhir untuk mengautentikasi permintaan API Anda. https://<your-custom-subdomain>.cognitiveservices.azure.com
{PROJECT-NAME} Nama proyek Anda. Nilai ini peka huruf besar/kecil. myProject
{DEPLOYMENT-NAME} Nama penyebaran Anda. Nilai ini peka huruf besar/kecil. staging
{API-VERSION} Versi API yang Anda panggil. Nilai yang dirujuk di sini adalah untuk versi terbaru yang dirilis. Lihat Siklus hidup model untuk mempelajari selengkapnya tentang versi API lain yang tersedia. 2023-04-15-preview

Header

Gunakan header berikut untuk mengautentikasi permintaan Anda.

Tombol Nilai
Ocp-Apim-Subscription-Key Kunci sumber daya Anda. Digunakan untuk mengautentikasi permintaan API Anda.

Isi permintaan

Gunakan JSON berikut dalam isi permintaan Anda. Gunakan nama model yang akan Anda tetapkan ke penyebaran.

{
  "trainedModelLabel": "{MODEL-NAME}"
}
Tombol Placeholder Value Contoh
trainedModelLabel {MODEL-NAME} Nama model yang akan ditetapkan ke penyebaran Anda. Anda hanya dapat menetapkan model yang berhasil dilatih. Nilai ini peka huruf besar/kecil. myModel

Setelah mengirim permintaan API, Anda akan menerima respons 202 yang menunjukkan bahwa pekerjaan telah dikirimkan dengan benar. Di header respons, ekstrak nilai operation-location. Nilai ini akan diformat seperti ini:

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/deployments/{DEPLOYMENT-NAME}/jobs/{JOB-ID}?api-version={API-VERSION}

{JOB-ID} digunakan untuk mengidentifikasi permintaan Anda, karena operasi ini tidak asinkron. Anda dapat menggunakan URL ini untuk mendapatkan status penyebaran.

Dapatkan status pekerjaan penyebaran

Gunakan permintaan GET berikut untuk menanyakan status tugas penyebaran. Anda dapat menggunakan URL yang Anda terima dari langkah sebelumnya, atau mengganti nilai tempat penampung dengan nilai Anda sendiri.

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/deployments/{DEPLOYMENT-NAME}/jobs/{JOB-ID}?api-version={API-VERSION}
Placeholder Value Contoh
{ENDPOINT} Titik akhir untuk mengautentikasi permintaan API Anda. https://<your-custom-subdomain>.cognitiveservices.azure.com
{PROJECT-NAME} Nama proyek Anda. Nilai ini peka huruf besar/kecil. myProject
{DEPLOYMENT-NAME} Nama penyebaran Anda. Nilai ini peka huruf besar/kecil. staging
{JOB-ID} ID untuk menemukan status pelatihan model Anda. Ini ada dalam nilai header location yang Anda terima di langkah sebelumnya. xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION} Versi API yang Anda panggil. Nilai yang dirujuk di sini adalah untuk versi terbaru yang dirilis. Lihat Siklus hidup model untuk mempelajari selengkapnya tentang versi API lain yang tersedia. 2023-04-15-preview

Header

Gunakan header berikut untuk mengautentikasi permintaan Anda.

Tombol Nilai
Ocp-Apim-Subscription-Key Kunci sumber daya Anda. Digunakan untuk mengautentikasi permintaan API Anda.

Isi respons

Setelah mengirim permintaan, Anda akan mendapatkan respons berikut. Pertahankan polling titik akhir ini sampai parameter status berubah menjadi "berhasil". Anda harus mendapatkan 200 kode untuk menunjukkan keberhasilan permintaan.

{
    "jobId":"{JOB-ID}",
    "createdDateTime":"{CREATED-TIME}",
    "lastUpdatedDateTime":"{UPDATED-TIME}",
    "expirationDateTime":"{EXPIRATION-TIME}",
    "status":"running"
}

Mengklasifikasikan teks

Setelah model berhasil disebarkan, Anda dapat mulai menggunakannya untuk mengklasifikasikan teks Anda melalui API Prediksi. Dalam himpunan data sampel yang Anda unduh sebelumnya, Anda dapat menemukan beberapa dokumen pengujian yang dapat Anda gunakan pada langkah ini.

Mengirimkan tugas analisis sentimen kustom

Gunakan permintaan POST ini untuk memulai tugas klasifikasi teks.

{ENDPOINT}/language/analyze-text/jobs?api-version={API-VERSION}
Placeholder Value Contoh
{ENDPOINT} Titik akhir untuk mengautentikasi permintaan API Anda. https://<your-custom-subdomain>.cognitiveservices.azure.com
{API-VERSION} Versi API yang Anda panggil. Nilai yang dirujuk di sini adalah untuk versi terbaru yang dirilis. 2023-04-15-preview

Header

Tombol Nilai
Ocp-Apim-Subscription-Key Kunci Anda yang menyediakan akses menuju API ini.

Isi

{
  "displayName": "Detecting sentiment",
  "analysisInput": {
    "documents": [
      {
        "id": "1",
        "language": "{LANGUAGE-CODE}",
        "text": "Text1"
      },
      {
        "id": "2",
        "language": "{LANGUAGE-CODE}",
        "text": "Text2"
      }
    ]
  },
  "tasks": [
     {
      "kind": "CustomTextSentiment",
      "taskName": "Sentiment analysis",
      "parameters": {
        "projectName": "{PROJECT-NAME}",
        "deploymentName": "{DEPLOYMENT-NAME}"
      }
    }
  ]
}
Tombol Placeholder Value Contoh
displayName {JOB-NAME} Nama pekerjaan Anda. MyJobName
documents [{},{}] Daftar dokumen untuk menjalankan tugas. [{},{}]
id {DOC-ID} ID atau nama dokumen. doc1
language {LANGUAGE-CODE} String yang menentukan kode bahasa untuk dokumen. Jika kunci ini tidak ditentukan, layanan akan menggunakan bahasa default proyek yang dipilih saat pembuatan proyek. en-us
text {DOC-TEXT} Tugas dokumen untuk menjalankan tugas. Lorem ipsum dolor sit amet
tasks Daftar tugas yang ingin kami jalankan. []
taskName CustomTextSentiment Nama tugas CustomTextSentiment
parameters Daftar parameter untuk diteruskan ke tugas.
project-name {PROJECT-NAME} Nama untuk proyek Anda. Nilai ini peka huruf besar/kecil. myProject
deployment-name {DEPLOYMENT-NAME} Nama penyebaran Anda. Nilai ini peka huruf besar/kecil. prod

Respons

Anda akan menerima respons 202 yang menunjukkan bahwa tugas Anda telah berhasil dikirimkan. Di header respons, ekstrak operation-location. operation-location diformat sebagai berikut:

{ENDPOINT}/language/analyze-text/jobs/{JOB-ID}?api-version={API-VERSION}

Anda dapat menggunakan URL ini untuk mengkueri status penyelesaian tugas dan mendapatkan hasil saat tugas selesai.

Mendapatkan hasil tugas

Gunakan permintaan GET berikut untuk mengkueri status/hasil tugas pengenalan entitas kustom.

{ENDPOINT}/language/analyze-text/jobs/{JOB-ID}?api-version={API-VERSION}
Placeholder Value Contoh
{ENDPOINT} Titik akhir untuk mengautentikasi permintaan API Anda. https://<your-custom-subdomain>.cognitiveservices.azure.com
{API-VERSION} Versi API yang Anda panggil. Nilai yang dirujuk di sini adalah untuk versi terbaru yang dirilis. 2023-04-15-preview

Header

Tombol Nilai
Ocp-Apim-Subscription-Key Kunci Anda yang menyediakan akses menuju API ini.

Isi Respons

Responsnya adalah dokumen JSON dengan parameter berikut

{
  "createdDateTime": "2021-05-19T14:32:25.578Z",
  "displayName": "MyJobName",
  "expirationDateTime": "2021-05-19T14:32:25.578Z",
  "jobId": "xxxx-xxxx-xxxxx-xxxxx",
  "lastUpdateDateTime": "2021-05-19T14:32:25.578Z",
  "status": "succeeded",
  "tasks": {
    "completed": 1,
    "failed": 0,
    "inProgress": 0,
    "total": 1,
    "items": [
      {
        "kind": "EntityRecognitionLROResults",
        "taskName": "Recognize Entities",
        "lastUpdateDateTime": "2020-10-01T15:01:03Z",
        "status": "succeeded",
        "results": {
          "documents": [
            {
              "entities": [
                {
                  "category": "Event",
                  "confidenceScore": 0.61,
                  "length": 4,
                  "offset": 18,
                  "text": "trip"
                },
                {
                  "category": "Location",
                  "confidenceScore": 0.82,
                  "length": 7,
                  "offset": 26,
                  "subcategory": "GPE",
                  "text": "Seattle"
                },
                {
                  "category": "DateTime",
                  "confidenceScore": 0.8,
                  "length": 9,
                  "offset": 34,
                  "subcategory": "DateRange",
                  "text": "last week"
                }
              ],
              "id": "1",
              "warnings": []
            }
          ],
          "errors": [],
          "modelVersion": "2020-04-01"
        }
      }
    ]
  }
}

Membersihkan sumber daya

Saat tidak lagi membutuhkan proyek, Anda dapat menghapusnya dengan permintaan DELETE berikut. Ganti nilai tempat penampung dengan nilai Anda sendiri.

{Endpoint}/language/authoring/analyze-text/projects/{projectName}?api-version={API-VERSION}
Placeholder Value Contoh
{ENDPOINT} Titik akhir untuk mengautentikasi permintaan API Anda. https://<your-custom-subdomain>.cognitiveservices.azure.com
{PROJECT-NAME} Nama untuk proyek Anda. Nilai ini peka huruf besar/kecil. myProject
{API-VERSION} Versi API yang Anda panggil. Nilai yang dirujuk di sini adalah untuk versi terbaru yang dirilis. Pelajari selengkapnya tentang versi API lain yang tersedia 2023-04-15-preview

Header

Gunakan header berikut untuk mengautentikasi permintaan Anda.

Tombol Nilai
Ocp-Apim-Subscription-Key Kunci sumber daya Anda. Digunakan untuk mengautentikasi permintaan API Anda.

Setelah mengirim permintaan API, Anda akan menerima respons yang 202 menunjukkan keberhasilan, yang berarti proyek Anda telah dihapus. Hasil call yang sukses dengan header Operation-Location yang digunakan untuk memeriksa status pekerjaan.

Langkah berikutnya

Setelah membuat model analisis sentimen kustom, Anda dapat:

Saat Anda mulai membuat proyek analisis sentimen Kustom Anda sendiri, gunakan artikel cara untuk mempelajari selengkapnya tentang mengembangkan model Anda secara lebih rinci: