將語音翻譯成文字

已完成

使用 Azure AI 語音 SDK 進行語音翻譯的模式類似於語音辨識,其中包含用於轉譯之來源和目的語言的相關資訊:

A TranslationRecognizer object is created from a SpeechConfig, TranslationConfig, and AudioConfig; and its RecognizeOnceAsync method is used to call the Speech API.

  1. 使用 SpeechConfig 物件,封裝連線至您的 Azure AI 語音資源所需的資訊。 具體而言,是它的位置和金鑰。

  2. SpeechTranslationConfig 物件也被用來指定語音辨識 (說話輸入語音) 的語言,以及應轉譯的目的語言。

  3. (選擇性) 使用 AudioConfig 來定義要轉譯的音訊的輸入來源。 根據預設,這是預設的系統麥克風,但您也可以指定音訊檔案。

  4. 使用 SpeechTranslationConfigAudioConfig 建立 TranslationRecognizer 物件。 此物件是 Azure AI 語音翻譯 API 的 proxy 用戶端。

  5. 使用 TranslationRecognizer 物件的方法來呼叫基礎 API 函數。 例如,RecognizeOnceAsync() 方法會使用 Azure AI 語音服務,以非同步方式翻譯單一口說語句。

  6. 處理來自 Azure AI 語音的回應。 在使用 RecognizeOnceAsync() 方法的情況下,結果會是 SpeechRecognitionResult 物件,其包含下列屬性:

    • 期間
    • OffsetInTicks
    • 屬性
    • 原因
    • ResultId
    • Text
    • 翻譯

如果作業成功,Reason 屬性會有列舉值 RecognizedSpeech,且 Text 屬性會包含原來語言的謄寫。 您也可以存取包含翻譯字典 (使用雙字元 ISO 語言代碼,例如英文的 "en" 作為索引鍵) 的 Translations 屬性。