什麼是語音轉換文字？

在此概觀中，您將了解語音服務的語音轉換文字功能的優點和功能，這是 Azure AI 服務的一部分。語音轉換文字可用於將音訊串流即時或批次謄寫為文字。

注意

如需比較即時和批次謄寫的價格，請參閱語音服務定價。

如需可用語音轉換文字語言的完整清單，請參閱語言和語音支援。

即時語音轉換文字

透過即時語音轉換文字，可以在辨識麥克風或檔案中的語音時轉錄語音。針對需要即時謄寫音訊的應用程式使用即時語音轉換文字，例如：

可透過語音 SDK、語音 CLI 實現即時語音轉換文字。

批次謄寫是用來謄寫儲存體中的大量音訊。您可使用共用存取簽章 (SAS) URI 來指向音訊檔案，並以非同步方式接收轉譯結果。針對需要大量謄寫音訊的應用程式使用批次謄寫，例如：

可透過以下方式進行批次謄寫：

語音轉換文字 REST API：若要開始使用，請參閱如何使用批次謄寫和批次謄寫範例 (REST) 。
語音 CLI同時支援即時和批次謄寫。如需批次謄寫的語音 CLI 說明，請執行下列命令：
```
spx help batch transcription
```

有了自訂語音，您即可評估與提高應用程式和產品的語音辨識精確度。自訂語音模型可用於即時語音轉換文字、語音翻譯和批次謄寫。

提示

無需託管部署端點，也能將自訂語音與批次謄寫 API 搭配使用。如果自訂語音模型僅用於批次謄寫，則可以節省資源。如需詳細資訊，請參閱語音服務價格。

開箱即用的語音辨識功能運用通用語言模型作為基礎模型。這個功能是以 Microsoft 擁有的資料定型，且能夠反映常用的口語語言。基底模型會預先訓練代表各種常見領域的方言和注音符號。當您提出語音辨識要求時，系統預設會使用每個支援語言的最新基礎模型。基礎模型在大部分的語音辨識案例中運作良好。

自訂模型可用於增強基礎模型，藉由提供文字資料來定型模型，以改善應用程式特有領域限定的詞彙辨識。它也可以藉由提供音訊資料與參考轉錄內容，來改善應用程式特定音訊條件的辨識。如需詳細資訊，請參閱自訂語音和語音轉換文字 REST API。

自訂選項會因語言或地區設定而有所不同。若要確認支援，請參閱語音服務的語言和語音支援。

AI 系統不僅包含技術，也包含使用它的人員、受其影響的人員，以及其部署所在的環境。閱讀透明度資訊，了解在系統中負責任 AI 的使用和部署資訊。