分享方式:


什麼是 Speech CLI?

語音 CLI 是一種不必撰寫程式碼就能使用語音服務的命令列工具。 語音 CLI 需要最少的設定。 您可以輕鬆地使用語音 CLI 來實驗語音服務的主要功能,並查看其如何與您的使用案例搭配使用。 在幾分鐘內,您即可從檔案目錄執行簡單的測試工作流程 (像是批次語音辨識),或是針對一組來自檔案的字串進行文字轉換語音。 除了簡單的工作流程外,語音 CLI 已準備好用於生產環境,並可進行擴大以使用自動化 .bat 或殼層指令碼以執行較大的程序。

語音 SDK 中的大部分功能都可以在語音 CLI 中使用,而且語音 CLI 簡化了其中的某些進階功能和自訂功能。 當您正在決定何時使用語音 CLI 或語音 SDK 時,請考慮下列指導。

語音 CLI 的使用時機:

  • 您希望能進行最少設定且不用撰寫程式碼,就能實驗語音服務功能。
  • 您對於使用語音服務的生產應用程式有著相對簡單的需求。

語音 SDK 的使用時機:

  • 您想要在特定語言或平台 (例如,C#、Python 或 C++) 內整合語音服務功能。
  • 您有著複雜的需求,可能需要進階的服務要求。
  • 您正在開發自訂行為,包括回應串流。

核心功能

  • 語音辨識:從音訊檔案或直接從麥克風進行語音轉換文字,或謄寫錄製的對話。

  • 語音合成:使用文字檔的輸入,或直接從命令列輸入,以進行文字轉換語音。 使用語音合成標記語言 (SSML) 設定來自訂語音輸出特性。

  • 語音翻譯:將來源語言的音訊轉換為文字,或是轉換為目標語言的音訊。

  • 在 Azure 計算資源上執行:傳送語音 CLI 命令,使用 spx webjob 在 Azure 遠端計算資源上執行。

開始使用

若要開始使用語音 CLI,請參閱快速入門。 本文顯示如何執行一些基本命令。 其也向您提供稍微更進階的命令,可用於執行語音轉換文字和文字轉換語音的批次作業。 閱讀基本文章之後,您便會對語法具備足夠的理解,可開始撰寫一些自訂命令,或將簡單的語音服務作業自動化。

下一步