什麼是語音轉換文字?
在此概觀中,您將了解語音服務的語音轉換文字功能的優點和功能,這是 Azure AI 服務的一部分。 語音轉換文字可用於將音訊串流即時或批次謄寫為文字。
如需可用語音轉換文字語言的完整清單,請參閱語言和語音支援。
即時語音轉換文字
透過即時語音轉換文字,可以在辨識麥克風或檔案中的語音時轉錄語音。 針對需要即時謄寫音訊的應用程式使用即時語音轉換文字,例如:
批次轉譯
批次謄寫是用來謄寫儲存體中的大量音訊。 您可使用共用存取簽章 (SAS) URI 來指向音訊檔案,並以非同步方式接收轉譯結果。 針對需要大量謄寫音訊的應用程式使用批次謄寫,例如:
- 預先錄製音訊的轉譯、標題 或字幕
- 連絡中心通話後分析
- 自動分段標記
可透過以下方式進行批次謄寫:
- 語音轉換文字 REST API:若要開始使用,請參閱如何使用批次謄寫和批次謄寫範例 (REST) 。
- 語音 CLI同時支援即時和批次謄寫。 如需批次轉譯的語音 CLI 說明,請執行下列命令:
spx help batch transcription
自訂語音
透過 自訂語音,您可以評估及改善應用程式和產品的語音辨識精確度。 自訂語音模型可用於即時語音轉換文字、語音翻譯和批次謄寫。
提示
裝載的部署端點不需要搭配 Batch 轉譯 API 使用自定義語音。 如果自訂語音模型僅用於批次謄寫,則可以節省資源。 如需詳細資訊,請參閱 語音服務定價。
開箱即用的語音辨識功能運用通用語言模型作為基礎模型。這個功能是以 Microsoft 擁有的資料定型,且能夠反映常用的口語語言。 基底模型會預先定型代表各種常見領域之方言和注音。 當您提出語音辨識要求時,預設會使用每個 支持語言 的最新基底模型。 基礎模型在大部分的語音辨識案例中運作良好。
自定義模型可用來增強基底模型,藉由提供文字數據來定型模型,以改善應用程式特有的領域特定詞彙的辨識。 它也可以藉由提供音訊數據與參考轉譯,來改善應用程式特定音訊條件的辨識。 如需詳細資訊,請參閱 自定義語音 和 語音轉換文字 REST API。
自訂選項會依語言或地區設定而有所不同。 若要確認支援,請參閱 語音服務的語言和語音支援。
負責 AI
AI 系統不僅包含技術,也包含使用它的人員、受其影響的人員,以及其部署所在的環境。 閱讀透明度資訊,了解在系統中負責任 AI 的使用和部署資訊。