什麼是 Speech CLI？

文章
09/24/2024

語音 CLI 是一種不必撰寫程式碼就能使用語音服務的命令列工具。語音 CLI 需要最少的設定。您可以輕鬆地使用語音 CLI 來實驗語音服務的主要功能，並查看其如何與您的使用案例搭配使用。在幾分鐘內，您即可從檔案目錄執行簡單的測試工作流程 (像是批次語音辨識)，或是針對一組來自檔案的字串進行文字轉換語音。除了簡單的工作流程外，語音 CLI 已準備好用於生產環境，並可進行擴大以使用自動化 .bat 或殼層指令碼以執行較大的程序。

語音 SDK 中的大部分功能都可以在語音 CLI 中使用，而且語音 CLI 簡化了其中的某些進階功能和自訂功能。當您正在決定何時使用語音 CLI 或語音 SDK 時，請考慮下列指導。

語音 CLI 的使用時機：

您希望能進行最少設定且不用撰寫程式碼，就能實驗語音服務功能。
您對於使用語音服務的生產應用程式有著相對簡單的需求。

語音 SDK 的使用時機：

您想要在特定語言或平台 (例如，C#、Python 或 C++) 內整合語音服務功能。
您有著複雜的需求，可能需要進階的服務要求。
您正在開發自訂行為，包括回應串流。

核心功能

語音辨識：從音訊檔案或直接從麥克風進行語音轉換文字，或謄寫錄製的對話。
語音合成：使用文字檔的輸入，或直接從命令列輸入，以進行文字轉換語音。使用語音合成標記語言 (SSML) 設定來自訂語音輸出特性。
語音翻譯：將來源語言的音訊轉換為文字，或是轉換為目標語言的音訊。
在 Azure 計算資源上執行：傳送語音 CLI 命令，使用 spx webjob 在 Azure 遠端計算資源上執行。

開始使用

若要開始使用語音 CLI，請參閱快速入門。本文顯示如何執行一些基本命令。其也向您提供稍微更進階的命令，可用於執行語音轉換文字和文字轉換語音的批次作業。閱讀基本文章之後，您便會對語法具備足夠的理解，可開始撰寫一些自訂命令，或將簡單的語音服務作業自動化。

分享方式：

什麼是 Speech CLI？

核心功能

開始使用

下一步

意見反映

更多資源