Mengunggah himpunan data pelatihan dan pengujian untuk ucapan kustom

Anda memerlukan data audio atau teks untuk menguji akurasi pengenalan ucapan atau melatih model kustom Anda. Untuk informasi tentang jenis data yang didukung untuk menguji atau melatih model Anda, lihat Pelatihan dan pengujian himpunan data.

Tip

Anda juga dapat menggunakan editor transkripsi online untuk membuat dan memperbaiki himpunan data audio berlabel.

Mengunggah himpunan data

Untuk mengunggah himpunan data Anda sendiri di Speech Studio, ikuti langkah-langkah berikut:

  1. Masuk ke Speech Studio.

  2. Pilih Ucapan> kustom Himpunan>data Ucapan nama >proyek Anda Unggah data.

  3. Pilih tab Data pelatihan atau Data pengujian.

  4. Pilih jenis himpunan data, lalu pilih Berikutnya.

  5. Tentukan lokasi himpunan data, lalu pilih Berikutnya. Anda dapat memilih file lokal atau memasukkan lokasi jarak jauh seperti URL Azure Blob. Jika Anda memilih lokasi jarak jauh, dan Anda tidak menggunakan mekanisme keamanan layanan Azure tepercaya, maka lokasi jarak jauh harus menjadi URL yang dapat diambil dengan permintaan GET anonim sederhana. Misalnya, URL SAS atau URL yang dapat diakses publik. URL yang memerlukan otorisasi tambahan, atau mengharapkan interaksi pengguna tidak didukung.

    Catatan

    Jika Anda menggunakan URL Azure Blob, Anda dapat memastikan keamanan maksimum file himpunan data Anda dengan menggunakan mekanisme keamanan layanan Azure tepercaya. Anda akan menggunakan teknik yang sama seperti untuk transkripsi Batch dan URL Akun Penyimpanan biasa untuk file himpunan data Anda. Lihat detailnya di sini.

  6. Masukkan nama dan deskripsi himpunan data, lalu pilih Berikutnya.

  7. Tinjau pengaturan Anda, lalu pilih Simpan dan tutup.

Setelah himpunan data Anda diunggah, buka halaman Latih model kustom untuk melatih model kustom.

Dengan Rest API Speech CLI dan Ucapan ke teks, tidak seperti Speech Studio, Anda tidak memilih apakah himpunan data untuk pengujian atau pelatihan pada saat pengunggahan. Anda menentukan bagaimana himpunan data digunakan saat Anda melatih model atau menjalankan pengujian.

Meskipun Anda tidak menunjukkan apakah himpunan data tersebut untuk pengujian atau pelatihan, Anda harus menentukan jenis himpunan data tersebut. Jenis himpunan data digunakan untuk menentukan jenis himpunan data yang dibuat. Dalam beberapa kasus, jenis himpunan data hanya digunakan untuk pengujian atau pelatihan, tetapi Anda tidak boleh bergantung padanya. Nilai CLI dan REST API Azure Cognitive Service untuk Ucapan kind sesuai dengan opsi di Studio Azure Cognitive Service untuk Ucapan seperti yang dijelaskan dalam tabel berikut:

Jenis CLI dan API Opsi Studio Azure Cognitive Service untuk Ucapan
Akustik Data pelatihan: Audio + transkrip berlabel manusia
Data pengujian: Transkrip (sintesis audio otomatis)
Data pengujian: Audio + transkrip berlabel manusia
AudioFiles Data pengujian: Audio
Bahasa Data pelatihan: Teks biasa
LanguageMarkdown Data pelatihan: Teks terstruktur dalam format markdown
Pengucapan Data pelatihan: Pengucapan
OutputFormatting Data pelatihan: Format output

Catatan

Teks terstruktur dalam himpunan data pelatihan format markdown tidak didukung oleh REST API Ucapan ke teks versi 3.0. Anda harus menggunakan Ucapan ke teks REST API v3.1. Untuk informasi selengkapnya, lihat Memigrasikan kode dari v3.0 ke v3.1 REST API.

Untuk membuat himpunan data dan menyambungkannya ke proyek yang ada, gunakan perintah spx csr dataset create. Buat parameter permintaan sesuai dengan instruksi berikut:

  • Atur parameter project ke ID proyek yang ada. Parameter ini direkomendasikan sehingga Anda juga dapat melihat dan mengelola himpunan data di Speech Studio. Anda dapat menjalankan perintah spx csr project list untuk mendapatkan proyek yang tersedia.

  • Atur parameter kind yang diperlukan. Kumpulan nilai yang mungkin untuk jenis himpunan data adalah: Bahasa, Akustik, Pengucapan, dan AudioFiles.

  • Atur parameter contentUrl yang diperlukan. Parameter ini adalah lokasi himpunan data. Jika Anda tidak menggunakan mekanisme keamanan layanan Azure tepercaya (lihat Catatan berikutnya), parameter contentUrl harus berupa URL yang dapat diambil dengan permintaan GET anonim sederhana. Misalnya, URL SAS atau URL yang dapat diakses publik. URL yang memerlukan otorisasi tambahan, atau mengharapkan interaksi pengguna tidak didukung.

    Catatan

    Jika Anda menggunakan URL Azure Blob, Anda dapat memastikan keamanan maksimum file himpunan data Anda dengan menggunakan mekanisme keamanan layanan Azure tepercaya. Anda akan menggunakan teknik yang sama seperti untuk transkripsi Batch dan URL Akun Penyimpanan biasa untuk file himpunan data Anda. Lihat detailnya di sini.

  • Atur parameter language yang diperlukan. Lokal himpunan data harus cocok dengan lokal proyek. Lokal tidak dapat diubah nanti. Parameter language Speech CLI sesuai dengan properti locale dalam permintaan dan respons JSON.

  • Atur parameter name yang diperlukan. Parameter ini adalah nama yang ditampilkan di Speech Studio. Parameter name Speech CLI sesuai dengan properti displayName dalam permintaan dan respons JSON.

Berikut adalah contoh perintah CLI Azure Cognitive Service untuk Ucapan yang membuat himpunan data dan menyambungkannya ke proyek yang sudah ada:

spx csr dataset create --api-version v3.1 --kind "Acoustic" --name "My Acoustic Dataset" --description "My Acoustic Dataset Description" --project YourProjectId --content YourContentUrl --language "en-US"

Anda akan menerima isi respons dalam format berikut:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/e0ea620b-e8c3-4a26-acb2-95fd0cbc625c",
  "kind": "Acoustic",
  "contentUrl": "https://contoso.com/mydatasetlocation",
  "links": {
    "files": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/e0ea620b-e8c3-4a26-acb2-95fd0cbc625c/files"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/70ccbffc-cafb-4301-aa9f-ef658559d96e"
  },
  "properties": {
    "acceptedLineCount": 0,
    "rejectedLineCount": 0
  },
  "lastActionDateTime": "2022-05-20T14:07:11Z",
  "status": "NotStarted",
  "createdDateTime": "2022-05-20T14:07:11Z",
  "locale": "en-US",
  "displayName": "My Acoustic Dataset",
  "description": "My Acoustic Dataset Description"
}

Properti self tingkat atas di isi respons adalah URI himpunan data. Gunakan URI ini untuk mendapatkan detail tentang proyek dan file himpunan data. Anda juga menggunakan URI ini untuk memperbarui atau menghapus himpunan data.

Untuk bantuan CLI Azure Cognitive Service untuk Ucapan dengan himpunan data, jalankan perintah berikut:

spx help csr dataset

Dengan Rest API Speech CLI dan Ucapan ke teks, tidak seperti Speech Studio, Anda tidak memilih apakah himpunan data untuk pengujian atau pelatihan pada saat pengunggahan. Anda menentukan bagaimana himpunan data digunakan saat Anda melatih model atau menjalankan pengujian.

Meskipun Anda tidak menunjukkan apakah himpunan data tersebut untuk pengujian atau pelatihan, Anda harus menentukan jenis himpunan data tersebut. Jenis himpunan data digunakan untuk menentukan jenis himpunan data yang dibuat. Dalam beberapa kasus, jenis himpunan data hanya digunakan untuk pengujian atau pelatihan, tetapi Anda tidak boleh bergantung padanya. Nilai CLI dan REST API Azure Cognitive Service untuk Ucapan kind sesuai dengan opsi di Studio Azure Cognitive Service untuk Ucapan seperti yang dijelaskan dalam tabel berikut:

Jenis CLI dan API Opsi Studio Azure Cognitive Service untuk Ucapan
Akustik Data pelatihan: Audio + transkrip berlabel manusia
Data pengujian: Transkrip (sintesis audio otomatis)
Data pengujian: Audio + transkrip berlabel manusia
AudioFiles Data pengujian: Audio
Bahasa Data pelatihan: Teks biasa
LanguageMarkdown Data pelatihan: Teks terstruktur dalam format markdown
Pengucapan Data pelatihan: Pengucapan
OutputFormatting Data pelatihan: Format output

Catatan

Teks terstruktur dalam himpunan data pelatihan format markdown tidak didukung oleh REST API Ucapan ke teks versi 3.0. Anda harus menggunakan Ucapan ke teks REST API v3.1. Untuk informasi selengkapnya, lihat Memigrasikan kode dari v3.0 ke v3.1 REST API.

Untuk membuat himpunan data dan menyambungkannya ke proyek yang ada, gunakan operasi Datasets_Create Rest API Ucapan ke teks. Buat isi permintaan sesuai dengan instruksi berikut:

  • Atur properti project ke URI proyek yang ada. Properti ini direkomendasikan sehingga Anda juga dapat melihat dan mengelola himpunan data di Speech Studio. Anda dapat membuat permintaan Projects_List untuk mendapatkan proyek yang tersedia.

  • Atur properti kind yang diperlukan. Kumpulan nilai yang mungkin untuk jenis himpunan data adalah: Bahasa, Akustik, Pengucapan, dan AudioFiles.

  • Atur properti contentUrl yang diperlukan. Properti ini adalah lokasi himpunan data. Jika Anda tidak menggunakan mekanisme keamanan layanan Azure tepercaya (lihat Catatan berikutnya), parameter contentUrl harus berupa URL yang dapat diambil dengan permintaan GET anonim sederhana. Misalnya, URL SAS atau URL yang dapat diakses publik. URL yang memerlukan otorisasi tambahan, atau mengharapkan interaksi pengguna tidak didukung.

    Catatan

    Jika Anda menggunakan URL Azure Blob, Anda dapat memastikan keamanan maksimum file himpunan data Anda dengan menggunakan mekanisme keamanan layanan Azure tepercaya. Anda akan menggunakan teknik yang sama seperti untuk transkripsi Batch dan URL Akun Penyimpanan biasa untuk file himpunan data Anda. Lihat detailnya di sini.

  • Atur properti locale yang diperlukan. Lokal himpunan data harus cocok dengan lokal proyek. Lokal tidak dapat diubah nanti.

  • Atur properti displayName yang diperlukan. Properti ini adalah nama yang ditampilkan di Speech Studio.

Buat permintaan HTTP POST menggunakan URI seperti yang ditunjukkan dalam contoh berikut. Ganti YourSubscriptionKey dengan kunci sumber daya Ucapan Anda, ganti YourServiceRegion dengan wilayah sumber daya Ucapan Anda, dan atur properti isi permintaan seperti yang dijelaskan sebelumnya.

curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey" -H "Content-Type: application/json" -d '{
  "kind": "Acoustic",
  "displayName": "My Acoustic Dataset",
  "description": "My Acoustic Dataset Description",
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/70ccbffc-cafb-4301-aa9f-ef658559d96e"
  },
  "contentUrl": "https://contoso.com/mydatasetlocation",
  "locale": "en-US",
}'  "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/datasets"

Anda akan menerima isi respons dalam format berikut:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/e0ea620b-e8c3-4a26-acb2-95fd0cbc625c",
  "kind": "Acoustic",
  "contentUrl": "https://contoso.com/mydatasetlocation",
  "links": {
    "files": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/e0ea620b-e8c3-4a26-acb2-95fd0cbc625c/files"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/70ccbffc-cafb-4301-aa9f-ef658559d96e"
  },
  "properties": {
    "acceptedLineCount": 0,
    "rejectedLineCount": 0
  },
  "lastActionDateTime": "2022-05-20T14:07:11Z",
  "status": "NotStarted",
  "createdDateTime": "2022-05-20T14:07:11Z",
  "locale": "en-US",
  "displayName": "My Acoustic Dataset",
  "description": "My Acoustic Dataset Description"
}

Properti self tingkat atas di isi respons adalah URI himpunan data. Gunakan URI ini untuk mendapatkan detail tentang proyek dan file himpunan data. Anda juga menggunakan URI ini untuk memperbarui atau menghapus himpunan data.

Penting

Koneksi himpunan data ke proyek ucapan kustom tidak diperlukan untuk melatih dan menguji model kustom menggunakan REST API atau Speech CLI. Namun jika himpunan data tidak tersambung ke proyek apa pun, Anda tidak dapat memilihnya untuk pelatihan atau pengujian di Studio Azure Cognitive Service untuk Ucapan.

Langkah berikutnya