Bagikan melalui


Gunakan sumber daya Ucapan Bring your own storage (BYOS) untuk ucapan ke teks

Bawa penyimpanan Anda sendiri (BYOS) dapat digunakan dalam skenario ucapan ke teks berikut:

  • Transkripsi batch
  • Transkripsi real time dengan pengelogan hasil audio dan transkripsi diaktifkan
  • Ucapan kustom

Satu sumber daya Ucapan ke pemasangan akun penyimpanan dapat digunakan untuk semua skenario secara bersamaan.

Artikel ini menjelaskan secara mendalam cara menggunakan sumber daya Ucapan dengan dukungan BYOS dalam semua skenario ucapan ke teks. Artikel ini menyiratkan, bahwa Anda memiliki sumber daya Ucapan dengan dukungan BYOS yang sepenuhnya dikonfigurasi dan akun Penyimpanan terkait.

Penyimpanan data

Saat menggunakan BYOS, layanan Ucapan tidak menyimpan artefak pelanggan setelah pemrosesan data (transkripsi, pelatihan model, pengujian model) selesai. Namun, beberapa metadata yang tidak berasal dari konten pengguna disimpan dalam lokal layanan Ucapan. Misalnya, dalam skenario ucapan kustom, Layanan menyimpan informasi tertentu tentang titik akhir kustom, seperti model mana yang mereka gunakan.

Akun Penyimpanan terkait BYOS menyimpan data berikut:

Catatan

Opsional di bagian ini berarti bahwa itu mungkin, tetapi tidak diperlukan untuk menyimpan artefak tertentu di akun Penyimpanan terkait BYOS. Jika diperlukan, mereka dapat disimpan di tempat lain.

Transkripsi batch

  • Audio sumber (opsional)
  • Hasil transkripsi batch

Transkripsi real time dengan pengelogan hasil audio dan transkripsi diaktifkan

  • Log hasil audio dan transkripsi

Ucapan kustom

  • File sumber himpunan data untuk pelatihan dan pengujian model (opsional)
  • Semua data dan metadata yang terkait dengan Model kustom yang dihosting oleh sumber daya Ucapan dengan dukungan BYOS (termasuk salinan himpunan data untuk pelatihan dan pengujian model)

Transkripsi batch

Transkripsi batch digunakan untuk mentranskripsikan data audio berjumlah besar di dalam penyimpanan . Jika Anda tidak terbiasa dengan transkripsi Batch, lihat artikel ini terlebih dahulu.

Lakukan langkah-langkah ini untuk menjalankan transkripsi Batch dengan sumber daya Ucapan dengan dukungan BYOS:

  1. Mulai transkripsi Batch seperti yang dijelaskan dalam panduan ini.

    Penting

    Jangan gunakan destinationContainerUrl parameter dalam permintaan transkripsi Anda. Jika Anda menggunakan BYOS, hasil transkripsi disimpan di akun Penyimpanan terkait BYOS secara otomatis.

    Jika Anda menggunakan destinationContainerUrl parameter, parameter tersebut akan berfungsi, tetapi memberikan keamanan yang jauh lebih sedikit untuk data Anda, karena penggunaan SAS ad hoc. Lihat detailnya di sini.

  2. Ketika transkripsi selesai, dapatkan hasil transkripsi sesuai dengan panduan ini. Pertimbangkan untuk menggunakan sasValidityInSeconds parameter (lihat bagian berikut).

Layanan ucapan menggunakan customspeech-artifacts kontainer Blob di akun Penyimpanan terkait BYOS untuk menyimpan hasil transkripsi perantara dan akhir.

Perhatian

Layanan ucapan bergantung pada jalur kontainer Blob yang telah ditentukan sebelumnya dan nama file untuk modul transkripsi Batch agar berfungsi dengan benar. Jangan pindahkan, ganti nama, atau dengan cara apa pun mengubah konten customspeech-artifacts kontainer.

Kegagalan untuk melakukannya sangat mungkin akan mengakibatkan kesalahan 4xx dan 5xx Service yang sulit di-debug.

Gunakan alat standar untuk berinteraksi dengan transkripsi Batch. Lihat detail di bagian transkripsi Batch.

Mendapatkan hasil transkripsi Batch melalui REST API

REST API ucapan ke teks sepenuhnya mendukung sumber daya Ucapan dengan dukungan BYOS. Namun, karena data sekarang disimpan dalam akun Penyimpanan dengan dukungan BYOS, permintaan seperti Dapatkan File Transkripsi berinteraksi dengan penyimpanan Blob akun Penyimpanan terkait BYOS, bukan sumber daya internal layanan Ucapan. Ini memungkinkan penggunaan kode berbasis REST API yang sama untuk sumber daya Ucapan yang didukung "reguler" dan BYOS.

Untuk keamanan maksimum, gunakan sasValidityInSeconds parameter dengan nilai yang diatur ke 0 dalam permintaan, yang mengembalikan URL file data, seperti permintaan Dapatkan File Transkripsi. Berikut adalah contoh URL permintaan:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/3b24ca19-2eb1-4a2a-b964-35d89eca486b/files?sasValidityInSeconds=0

Permintaan seperti itu mengembalikan URL Akun Penyimpanan langsung ke file data (tanpa SAS atau penambahan lainnya). Contohnya:

"links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-artifacts/TranscriptionData/3b24ca19-2eb1-4a2a-b964-35d89eca486b_0_0.json"
      }

URL format ini memastikan bahwa hanya identitas Microsoft Entra (pengguna, perwakilan layanan, identitas terkelola) dengan hak akses yang memadai (seperti peran Pembaca Data Blob Penyimpanan) yang dapat mengakses data dari URL.

Peringatan

Jika sasValidityInSeconds parameter dihilangkan dalam permintaan Dapatkan File Transkripsi atau yang serupa, maka SAS delegasi pengguna dengan validitas 5 hari akan dihasilkan untuk setiap URL file data yang dikembalikan. SAS ini ditandatangani oleh identitas terkelola yang ditetapkan sistem dari sumber daya Ucapan yang didukung BYOS Anda. Karena itu, SAS memungkinkan akses ke data, bahkan jika akses kunci akun penyimpanan dinonaktifkan. Lihat detailnya di sini.

Transkripsi real time dengan pengelogan hasil audio dan transkripsi diaktifkan

Anda dapat mengaktifkan pengelogan untuk input audio dan ucapan yang dikenali saat menggunakan terjemahan ucapan ke teks atau ucapan. Lihat deskripsi lengkap dalam artikel ini.

Jika Anda menggunakan BYOS, maka Anda menemukan log dalam customspeech-audiologs kontainer Blob di akun Penyimpanan terkait BYOS.

Peringatan

Data pengelogan disimpan selama 5 hari. Setelah periode ini, log akan dihapus secara otomatis. Ini juga berlaku untuk sumber daya Ucapan dengan dukungan BYOS. Jika Anda ingin menyimpan log lebih lama, salin file dan folder terkait dari customspeech-audiologs kontainer Blob secara langsung atau gunakan REST API.

Mendapatkan log transkripsi real time melalui REST API

REST API ucapan ke teks sepenuhnya mendukung sumber daya Ucapan dengan dukungan BYOS. Namun, karena data sekarang disimpan dalam akun Penyimpanan dengan dukungan BYOS, permintaan seperti Dapatkan Log Model Dasar berinteraksi dengan penyimpanan Blob akun Penyimpanan terkait BYOS, bukan sumber daya internal layanan Ucapan. Ini memungkinkan penggunaan kode berbasis REST API yang sama untuk sumber daya Ucapan yang didukung "reguler" dan BYOS.

Untuk keamanan maksimum, gunakan sasValidityInSeconds parameter dengan nilai yang diatur ke 0 dalam permintaan, yang mengembalikan URL file data, seperti permintaan Dapatkan Log Model Dasar. Berikut adalah contoh URL permintaan:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/endpoints/base/en-US/files/logs?sasValidityInSeconds=0

Permintaan seperti itu mengembalikan URL Akun Penyimpanan langsung ke file data (tanpa SAS atau penambahan lainnya). Contohnya:

"links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-audiologs/be172190e1334399852185c0addee9d6/en-US/2023-07-06/152339_fcf52189-0d3f-4415-becd-5f639fd7fd6b.v2.json"
      }

URL format ini memastikan bahwa hanya identitas Microsoft Entra (pengguna, perwakilan layanan, identitas terkelola) dengan hak akses yang memadai (seperti peran Pembaca Data Blob Penyimpanan) yang dapat mengakses data dari URL.

Peringatan

Jika sasValidityInSeconds parameter dihilangkan dalam permintaan Dapatkan Log Model Dasar atau yang serupa, maka SAS delegasi pengguna dengan validitas 5 hari akan dihasilkan untuk setiap URL file data yang dikembalikan. SAS ini ditandatangani oleh identitas terkelola yang ditetapkan sistem dari sumber daya Ucapan yang didukung BYOS Anda. Karena itu, SAS memungkinkan akses ke data, bahkan jika akses kunci akun penyimpanan dinonaktifkan. Lihat detailnya di sini.

Ucapan kustom

Dengan ucapan kustom, Anda dapat mengevaluasi dan meningkatkan akurasi pengenalan ucapan untuk aplikasi dan produk Anda. Model ucapan kustom dapat digunakan untuk ucapan real time ke teks, terjemahan ucapan, dan transkripsi batch. Untuk informasi selengkapnya, lihat gambaran umum ucapan kustom.

Tidak ada yang spesifik tentang cara Anda menggunakan ucapan kustom dengan sumber daya Ucapan dengan dukungan BYOS. Satu-satunya perbedaan adalah di mana semua data terkait model kustom, yang dikumpulkan dan dihasilkan layanan Ucapan untuk Anda, disimpan. Data disimpan dalam kontainer Blob berikut dari akun Penyimpanan terkait BYOS:

  • customspeech-models - Lokasi model ucapan kustom
  • customspeech-artifacts - Lokasi semua data terkait ucapan kustom lainnya

Struktur kontainer Blob disediakan hanya untuk informasi Anda dan dapat berubah tanpa pemberitahuan.

Perhatian

Layanan ucapan bergantung pada jalur kontainer Blob yang telah ditentukan sebelumnya dan nama file untuk modul ucapan kustom agar berfungsi dengan benar. Jangan pindahkan, ganti nama, atau dengan cara apa pun mengubah konten customspeech-models kontainer dan folder customspeech-artifacts kontainer terkait ucapan kustom.

Kegagalan untuk melakukannya sangat mungkin akan mengakibatkan kesalahan yang sulit di-debug dan dapat menyebabkan kebutuhan pelatihan ulang model kustom.

Gunakan alat standar, seperti REST API dan Speech Studio untuk berinteraksi dengan data terkait ucapan kustom. Lihat detail di bagian ucapan kustom.

Penggunaan REST API dengan ucapan kustom

REST API ucapan ke teks sepenuhnya mendukung sumber daya Ucapan dengan dukungan BYOS. Namun, karena data sekarang disimpan dalam akun Penyimpanan dengan dukungan BYOS, permintaan seperti Datasets_ListFiles berinteraksi dengan penyimpanan Blob akun Penyimpanan terkait BYOS, bukan sumber daya internal layanan Ucapan. Ini memungkinkan penggunaan kode berbasis REST API yang sama untuk sumber daya Ucapan yang didukung "reguler" dan BYOS.

Untuk keamanan maksimum, gunakan sasValidityInSeconds parameter dengan nilai yang diatur ke 0 dalam permintaan, yang mengembalikan URL file data, seperti permintaan Dapatkan File Himpunan Data. Berikut adalah contoh URL permintaan:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/8427b92a-cb50-4cda-bf04-964ea1b1781b/files?sasValidityInSeconds=0

Permintaan seperti itu mengembalikan URL Akun Penyimpanan langsung ke file data (tanpa SAS atau penambahan lainnya). Contohnya:

 "links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-artifacts/AcousticData/8427b92a-cb50-4cda-bf04-964ea1b1781b/4a61ddac-5b1c-4c21-b87d-22001b0f18ab.zip"
      }

URL format ini memastikan bahwa hanya identitas Microsoft Entra (pengguna, perwakilan layanan, identitas terkelola) dengan hak akses yang memadai (seperti peran Pembaca Data Blob Penyimpanan) yang dapat mengakses data dari URL.

Peringatan

Jika sasValidityInSeconds parameter dihilangkan dalam permintaan Dapatkan File Himpunan Data atau yang serupa, maka SAS delegasi pengguna dengan validitas 5 hari akan dihasilkan untuk setiap URL file data yang dikembalikan. SAS ini ditandatangani oleh identitas terkelola yang ditetapkan sistem dari sumber daya Ucapan yang didukung BYOS Anda. Karena itu, SAS memungkinkan akses ke data, bahkan jika akses kunci akun penyimpanan dinonaktifkan. Lihat detailnya di sini.

Langkah berikutnya