什麼是語音轉換文字?
在此概觀中,您將了解語音服務的語音轉換文字功能的優點和功能,這是 Azure AI 服務的一部分。 語音轉換文字可用於將音訊串流即時或批次謄寫為文字。
如需可用語音轉換文字語言的完整清單,請參閱語言和語音支援。
即時語音轉換文字
透過即時語音轉換文字,可以在辨識麥克風或檔案中的語音時轉錄語音。 針對需要即時謄寫音訊的應用程式使用即時語音轉換文字,例如:
批次轉譯
批次謄寫是用來謄寫儲存體中的大量音訊。 您可使用共用存取簽章 (SAS) URI 來指向音訊檔案,並以非同步方式接收轉譯結果。 針對需要大量謄寫音訊的應用程式使用批次謄寫,例如:
- 預先錄製音訊的謄寫、原文字幕或翻譯字幕
- 連絡中心通話後分析
- 自動分段標記
可透過以下方式進行批次謄寫:
- 語音轉換文字 REST API:若要開始使用,請參閱如何使用批次謄寫和批次謄寫範例 (REST) 。
- 語音 CLI同時支援即時和批次謄寫。 如需批次謄寫的語音 CLI 說明,請執行下列命令:
spx help batch transcription
自訂語音
有了 自訂語音,您即可評估與提高應用程式和產品的語音辨識精確度。 自訂語音模型可用於即時語音轉換文字、語音翻譯和批次謄寫。
開箱即用的語音辨識功能運用通用語言模型作為基礎模型。這個功能是以 Microsoft 擁有的資料定型,且能夠反映常用的口語語言。 基底模型會預先訓練代表各種常見領域的方言和注音符號。 當您提出語音辨識要求時,系統預設會使用每個支援語言的最新基礎模型。 基礎模型在大部分的語音辨識案例中運作良好。
自訂模型可用於增強基礎模型,藉由提供文字資料來定型模型,以改善應用程式特有領域限定的詞彙辨識。 它也可以藉由提供音訊資料與參考轉錄內容,來改善應用程式特定音訊條件的辨識。 如需詳細資訊,請參閱 自訂語音 和 語音轉換文字 REST API。
自訂選項會因語言或地區設定而有所不同。 若要確認支援,請參閱語音服務的語言和語音支援。
負責 AI
AI 系統不僅包含技術,也包含使用它的人員、受其影響的人員,以及其部署所在的環境。 閱讀透明度資訊,了解在系統中負責任 AI 的使用和部署資訊。
下一步
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應