Gunakan sumber daya Ucapan Bring your own storage (BYOS) untuk ucapan ke teks
Bawa penyimpanan Anda sendiri (BYOS) dapat digunakan dalam skenario ucapan ke teks berikut:
- Transkripsi batch
- Transkripsi real time dengan pengelogan hasil audio dan transkripsi diaktifkan
- Ucapan kustom
Satu sumber daya Ucapan ke pemasangan akun penyimpanan dapat digunakan untuk semua skenario secara bersamaan.
Artikel ini menjelaskan secara mendalam cara menggunakan sumber daya Ucapan dengan dukungan BYOS dalam semua skenario ucapan ke teks. Artikel ini menyiratkan, bahwa Anda memiliki sumber daya Ucapan dengan dukungan BYOS yang sepenuhnya dikonfigurasi dan akun Penyimpanan terkait.
Penyimpanan data
Saat menggunakan BYOS, layanan Ucapan tidak menyimpan artefak pelanggan setelah pemrosesan data (transkripsi, pelatihan model, pengujian model) selesai. Namun, beberapa metadata yang tidak berasal dari konten pengguna disimpan dalam lokal layanan Ucapan. Misalnya, dalam skenario ucapan kustom, Layanan menyimpan informasi tertentu tentang titik akhir kustom, seperti model mana yang mereka gunakan.
Akun Penyimpanan terkait BYOS menyimpan data berikut:
Catatan
Opsional di bagian ini berarti bahwa itu mungkin, tetapi tidak diperlukan untuk menyimpan artefak tertentu di akun Penyimpanan terkait BYOS. Jika diperlukan, mereka dapat disimpan di tempat lain.
Transkripsi batch
- Audio sumber (opsional)
- Hasil transkripsi batch
Transkripsi real time dengan pengelogan hasil audio dan transkripsi diaktifkan
- Log hasil audio dan transkripsi
Ucapan kustom
- File sumber himpunan data untuk pelatihan dan pengujian model (opsional)
- Semua data dan metadata yang terkait dengan Model kustom yang dihosting oleh sumber daya Ucapan dengan dukungan BYOS (termasuk salinan himpunan data untuk pelatihan dan pengujian model)
Transkripsi batch
Transkripsi batch digunakan untuk mentranskripsikan data audio berjumlah besar di dalam penyimpanan . Jika Anda tidak terbiasa dengan transkripsi Batch, lihat artikel ini terlebih dahulu.
Lakukan langkah-langkah ini untuk menjalankan transkripsi Batch dengan sumber daya Ucapan dengan dukungan BYOS:
Mulai transkripsi Batch seperti yang dijelaskan dalam panduan ini.
Penting
Jangan gunakan
destinationContainerUrl
parameter dalam permintaan transkripsi Anda. Jika Anda menggunakan BYOS, hasil transkripsi disimpan di akun Penyimpanan terkait BYOS secara otomatis.Jika Anda menggunakan
destinationContainerUrl
parameter, parameter tersebut akan berfungsi, tetapi memberikan keamanan yang jauh lebih sedikit untuk data Anda, karena penggunaan SAS ad hoc. Lihat detailnya di sini.Ketika transkripsi selesai, dapatkan hasil transkripsi sesuai dengan panduan ini. Pertimbangkan untuk menggunakan
sasValidityInSeconds
parameter (lihat bagian berikut).
Layanan ucapan menggunakan customspeech-artifacts
kontainer Blob di akun Penyimpanan terkait BYOS untuk menyimpan hasil transkripsi perantara dan akhir.
Perhatian
Layanan ucapan bergantung pada jalur kontainer Blob yang telah ditentukan sebelumnya dan nama file untuk modul transkripsi Batch agar berfungsi dengan benar. Jangan pindahkan, ganti nama, atau dengan cara apa pun mengubah konten customspeech-artifacts
kontainer.
Kegagalan untuk melakukannya sangat mungkin akan mengakibatkan kesalahan 4xx dan 5xx Service yang sulit di-debug.
Gunakan alat standar untuk berinteraksi dengan transkripsi Batch. Lihat detail di bagian transkripsi Batch.
Mendapatkan hasil transkripsi Batch melalui REST API
REST API ucapan ke teks sepenuhnya mendukung sumber daya Ucapan dengan dukungan BYOS. Namun, karena data sekarang disimpan dalam akun Penyimpanan dengan dukungan BYOS, permintaan seperti Dapatkan File Transkripsi berinteraksi dengan penyimpanan Blob akun Penyimpanan terkait BYOS, bukan sumber daya internal layanan Ucapan. Ini memungkinkan penggunaan kode berbasis REST API yang sama untuk sumber daya Ucapan yang didukung "reguler" dan BYOS.
Untuk keamanan maksimum, gunakan sasValidityInSeconds
parameter dengan nilai yang diatur ke 0
dalam permintaan, yang mengembalikan URL file data, seperti permintaan Dapatkan File Transkripsi. Berikut adalah contoh URL permintaan:
https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/3b24ca19-2eb1-4a2a-b964-35d89eca486b/files?sasValidityInSeconds=0
Permintaan seperti itu mengembalikan URL Akun Penyimpanan langsung ke file data (tanpa SAS atau penambahan lainnya). Contohnya:
"links": {
"contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-artifacts/TranscriptionData/3b24ca19-2eb1-4a2a-b964-35d89eca486b_0_0.json"
}
URL format ini memastikan bahwa hanya identitas Microsoft Entra (pengguna, perwakilan layanan, identitas terkelola) dengan hak akses yang memadai (seperti peran Pembaca Data Blob Penyimpanan) yang dapat mengakses data dari URL.
Peringatan
Jika sasValidityInSeconds
parameter dihilangkan dalam permintaan Dapatkan File Transkripsi atau yang serupa, maka SAS delegasi pengguna dengan validitas 5 hari akan dihasilkan untuk setiap URL file data yang dikembalikan. SAS ini ditandatangani oleh identitas terkelola yang ditetapkan sistem dari sumber daya Ucapan yang didukung BYOS Anda. Karena itu, SAS memungkinkan akses ke data, bahkan jika akses kunci akun penyimpanan dinonaktifkan. Lihat detailnya di sini.
Transkripsi real time dengan pengelogan hasil audio dan transkripsi diaktifkan
Anda dapat mengaktifkan pengelogan untuk input audio dan ucapan yang dikenali saat menggunakan terjemahan ucapan ke teks atau ucapan. Lihat deskripsi lengkap dalam artikel ini.
Jika Anda menggunakan BYOS, maka Anda menemukan log dalam customspeech-audiologs
kontainer Blob di akun Penyimpanan terkait BYOS.
Peringatan
Data pengelogan disimpan selama 5 hari. Setelah periode ini, log akan dihapus secara otomatis. Ini juga berlaku untuk sumber daya Ucapan dengan dukungan BYOS. Jika Anda ingin menyimpan log lebih lama, salin file dan folder terkait dari customspeech-audiologs
kontainer Blob secara langsung atau gunakan REST API.
Mendapatkan log transkripsi real time melalui REST API
REST API ucapan ke teks sepenuhnya mendukung sumber daya Ucapan dengan dukungan BYOS. Namun, karena data sekarang disimpan dalam akun Penyimpanan dengan dukungan BYOS, permintaan seperti Dapatkan Log Model Dasar berinteraksi dengan penyimpanan Blob akun Penyimpanan terkait BYOS, bukan sumber daya internal layanan Ucapan. Ini memungkinkan penggunaan kode berbasis REST API yang sama untuk sumber daya Ucapan yang didukung "reguler" dan BYOS.
Untuk keamanan maksimum, gunakan sasValidityInSeconds
parameter dengan nilai yang diatur ke 0
dalam permintaan, yang mengembalikan URL file data, seperti permintaan Dapatkan Log Model Dasar. Berikut adalah contoh URL permintaan:
https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/endpoints/base/en-US/files/logs?sasValidityInSeconds=0
Permintaan seperti itu mengembalikan URL Akun Penyimpanan langsung ke file data (tanpa SAS atau penambahan lainnya). Contohnya:
"links": {
"contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-audiologs/be172190e1334399852185c0addee9d6/en-US/2023-07-06/152339_fcf52189-0d3f-4415-becd-5f639fd7fd6b.v2.json"
}
URL format ini memastikan bahwa hanya identitas Microsoft Entra (pengguna, perwakilan layanan, identitas terkelola) dengan hak akses yang memadai (seperti peran Pembaca Data Blob Penyimpanan) yang dapat mengakses data dari URL.
Peringatan
Jika sasValidityInSeconds
parameter dihilangkan dalam permintaan Dapatkan Log Model Dasar atau yang serupa, maka SAS delegasi pengguna dengan validitas 5 hari akan dihasilkan untuk setiap URL file data yang dikembalikan. SAS ini ditandatangani oleh identitas terkelola yang ditetapkan sistem dari sumber daya Ucapan yang didukung BYOS Anda. Karena itu, SAS memungkinkan akses ke data, bahkan jika akses kunci akun penyimpanan dinonaktifkan. Lihat detailnya di sini.
Ucapan kustom
Dengan ucapan kustom, Anda dapat mengevaluasi dan meningkatkan akurasi pengenalan ucapan untuk aplikasi dan produk Anda. Model ucapan kustom dapat digunakan untuk ucapan real time ke teks, terjemahan ucapan, dan transkripsi batch. Untuk informasi selengkapnya, lihat gambaran umum ucapan kustom.
Tidak ada yang spesifik tentang cara Anda menggunakan ucapan kustom dengan sumber daya Ucapan dengan dukungan BYOS. Satu-satunya perbedaan adalah di mana semua data terkait model kustom, yang dikumpulkan dan dihasilkan layanan Ucapan untuk Anda, disimpan. Data disimpan dalam kontainer Blob berikut dari akun Penyimpanan terkait BYOS:
customspeech-models
- Lokasi model ucapan kustomcustomspeech-artifacts
- Lokasi semua data terkait ucapan kustom lainnya
Struktur kontainer Blob disediakan hanya untuk informasi Anda dan dapat berubah tanpa pemberitahuan.
Perhatian
Layanan ucapan bergantung pada jalur kontainer Blob yang telah ditentukan sebelumnya dan nama file untuk modul ucapan kustom agar berfungsi dengan benar. Jangan pindahkan, ganti nama, atau dengan cara apa pun mengubah konten customspeech-models
kontainer dan folder customspeech-artifacts
kontainer terkait ucapan kustom.
Kegagalan untuk melakukannya sangat mungkin akan mengakibatkan kesalahan yang sulit di-debug dan dapat menyebabkan kebutuhan pelatihan ulang model kustom.
Gunakan alat standar, seperti REST API dan Speech Studio untuk berinteraksi dengan data terkait ucapan kustom. Lihat detail di bagian ucapan kustom.
Penggunaan REST API dengan ucapan kustom
REST API ucapan ke teks sepenuhnya mendukung sumber daya Ucapan dengan dukungan BYOS. Namun, karena data sekarang disimpan dalam akun Penyimpanan dengan dukungan BYOS, permintaan seperti Datasets_ListFiles berinteraksi dengan penyimpanan Blob akun Penyimpanan terkait BYOS, bukan sumber daya internal layanan Ucapan. Ini memungkinkan penggunaan kode berbasis REST API yang sama untuk sumber daya Ucapan yang didukung "reguler" dan BYOS.
Untuk keamanan maksimum, gunakan sasValidityInSeconds
parameter dengan nilai yang diatur ke 0
dalam permintaan, yang mengembalikan URL file data, seperti permintaan Dapatkan File Himpunan Data. Berikut adalah contoh URL permintaan:
https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/8427b92a-cb50-4cda-bf04-964ea1b1781b/files?sasValidityInSeconds=0
Permintaan seperti itu mengembalikan URL Akun Penyimpanan langsung ke file data (tanpa SAS atau penambahan lainnya). Contohnya:
"links": {
"contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-artifacts/AcousticData/8427b92a-cb50-4cda-bf04-964ea1b1781b/4a61ddac-5b1c-4c21-b87d-22001b0f18ab.zip"
}
URL format ini memastikan bahwa hanya identitas Microsoft Entra (pengguna, perwakilan layanan, identitas terkelola) dengan hak akses yang memadai (seperti peran Pembaca Data Blob Penyimpanan) yang dapat mengakses data dari URL.
Peringatan
Jika sasValidityInSeconds
parameter dihilangkan dalam permintaan Dapatkan File Himpunan Data atau yang serupa, maka SAS delegasi pengguna dengan validitas 5 hari akan dihasilkan untuk setiap URL file data yang dikembalikan. SAS ini ditandatangani oleh identitas terkelola yang ditetapkan sistem dari sumber daya Ucapan yang didukung BYOS Anda. Karena itu, SAS memungkinkan akses ke data, bahkan jika akses kunci akun penyimpanan dinonaktifkan. Lihat detailnya di sini.