共用方式為


什麼是語音轉換文字?

在此概觀中,您將了解語音服務的語音轉換文字功能的優點和功能,這是 Azure AI 服務的一部分。 語音轉換文字可用於將音訊串流即時批次謄寫為文字。

注意

如需比較即時批次謄寫的價格,請參閱語音服務定價

如需可用語音轉換文字語言的完整清單,請參閱語言和語音支援

即時語音轉換文字

透過即時語音轉換文字,可以在辨識麥克風或檔案中的語音時轉錄語音。 針對需要即時謄寫音訊的應用程式使用即時語音轉換文字,例如:

可透過語音 SDK語音 CLI 實現即時語音轉換文字。

批次轉譯

批次謄寫是用來謄寫儲存體中的大量音訊。 您可使用共用存取簽章 (SAS) URI 來指向音訊檔案,並以非同步方式接收轉譯結果。 針對需要大量謄寫音訊的應用程式使用批次謄寫,例如:

  • 預先錄製音訊的謄寫、原文字幕或翻譯字幕
  • 連絡中心通話後分析
  • 自動分段標記

可透過以下方式進行批次謄寫:

自訂語音

有了 自訂語音,您即可評估與提高應用程式和產品的語音辨識精確度。 自訂語音模型可用於即時語音轉換文字語音翻譯批次謄寫

提示

無需 託管部署端點,也能將自訂語音與 批次謄寫 API 搭配使用。 如果自訂語音模型僅用於批次謄寫,則可以節省資源。 如需詳細資訊,請參閱語音服務價格

開箱即用的語音辨識功能運用通用語言模型作為基礎模型。這個功能是以 Microsoft 擁有的資料定型,且能夠反映常用的口語語言。 基底模型會預先訓練代表各種常見領域的方言和注音符號。 當您提出語音辨識要求時,系統預設會使用每個支援語言的最新基礎模型。 基礎模型在大部分的語音辨識案例中運作良好。

自訂模型可用於增強基礎模型,藉由提供文字資料來定型模型,以改善應用程式特有領域限定的詞彙辨識。 它也可以藉由提供音訊資料與參考轉錄內容,來改善應用程式特定音訊條件的辨識。 如需詳細資訊,請參閱 自訂語音語音轉換文字 REST API

自訂選項會因語言或地區設定而有所不同。 若要確認支援,請參閱語音服務的語言和語音支援

負責 AI

AI 系統不僅包含技術,也包含使用它的人員、受其影響的人員,以及其部署所在的環境。 閱讀透明度資訊,了解在系統中負責任 AI 的使用和部署資訊。

下一步