什麼是語音翻譯?

在本文中,您將瞭解使用 Azure AI 語音進行翻譯的優點和功能。 語音服務支援即時、多語言語音轉換語音,以及音訊串流文字翻譯的語音轉換。

您可以使用語音 SDK 或語音 CLI,將所提供音訊的來源謄寫和翻譯輸出存取權授予您的應用程式、工具和裝置。 偵測到語音時,系統會傳回過渡謄寫和翻譯結果,而最終結果可以轉換為合成語音。

如需語音翻譯的支援語言清單,請參閱語言和語音支援

提示

移至 Speech Studio ,以以低延遲快速測試語音,並將語音翻譯成您選擇的其他語言。

核心功能

語音翻譯的核心功能包括:

語音轉換文字翻譯

語音服務所提供的標準功能是能夠採用您指定來源語言的輸入音訊串流,並將其翻譯並輸出為指定目標語言中的文字。

語音轉換語音翻譯

作為上述功能的補充,語音服務也提供使用預先定型語音的大型資料庫大聲朗讀翻譯文字的選項,以允許輸入語音的自然輸出。

多語語音翻譯 (預覽)

多語言語音翻譯會實作新的語音翻譯技術層級,以解除鎖定各種功能,包括沒有指定的輸入語言、處理相同會話內的語言切換,以及支援將即時串流翻譯轉換成英文。 這些功能可啟用可實作至產品的新語音翻譯功能層級。

  • 未指定的輸入語言。 多語言語音翻譯可以接收各種語言的音訊,而且不需要指定預期的輸入語言。
  • 語言切換。 多語系語音翻譯允許在相同會話期間說出多種語言,並將它們全部翻譯成相同的目標語言。 輸入語言變更或任何其他動作時,不需要重新啟動會話。
  • 轉錄。 服務會以指定的目標語言輸出轉譯。 尚未提供來源語言轉譯。

多語語音翻譯的一些使用案例包括:

  • 旅遊解釋器。 在出國旅行時,多語言語音翻譯提供建立解決方案,讓客戶能夠將任何輸入音訊翻譯成當地語言。 這可讓他們與當地人溝通,並更好地了解他們的環境。
  • 商務會議。 在與講不同語言的人員會面中,多語系語音翻譯可讓會議的成員自然地彼此通訊,就像沒有語言障礙一樣。

針對多語語音翻譯, 這些是語音服務可以從輸入自動偵測和切換的語言:阿拉伯文(ar)、巴斯克文(eu)、波士尼亞文(bs)、保加利亞文(bg)、簡體中文(zh)、繁體中文(zhh)、捷克文(cs)、丹麥文(da)、荷蘭文(nl)、英文(en)、愛沙尼亞文(et)、芬蘭文(fi)、法文(fr)、加利西亞文(gl)、德文(德)、希臘文(el)、印度文(hi)、 匈牙利文(hu)、印尼文(id)、義大利文(文)、日文(ja)、韓文(ko)、拉脫維亞文(lv)、立陶宛文(lt)、馬其頓文(mk)、挪威文(nb)、波蘭文(pl)、葡萄牙文(pt)、羅馬尼亞文(羅)、俄羅斯(魯)、塞爾維亞文(sr)、斯洛伐克文(sk)、斯洛維尼亞文(sl)、西班牙文(es)、瑞典文(sv)、泰國(th)、土耳其文(tr)、烏克蘭文(英國)、越南文(vi)和威爾士(cy)。

如需支援的輸出 (目標) 語言清單,請參閱語言和語音支援檔中翻譯文字語言表格。

如需多語種語音翻譯的詳細資訊,請參閱 GitHub 上的語音翻譯如何引導和語音翻譯範例。

多個目標語言翻譯

在您想要以多種語言輸出的情況下,語音服務會直接提供將輸入語言翻譯成兩種目標語言的能力。 這可讓它們接收兩個輸出,並透過單一 API 呼叫,將這些翻譯分享給更廣泛的物件。 如果需要更多輸出語言,您可以建立多服務資源或使用個別的翻譯服務。

如果您需要翻譯為兩個以上的目標語言,您必須 建立多服務資源 ,或針對第二個以上的語言使用不同的翻譯服務。 如果您選擇使用多服務資源呼叫語音翻譯服務,請注意,翻譯費用會根據翻譯的字元計數,套用到超過第二種語言的每一種語言。

若要計算套用的翻譯費用,請參閱 Azure AI 翻譯工具 定價

多個目標語言翻譯價格

請務必注意,語音翻譯服務會實時運作,而中繼語音結果會轉譯為產生中繼翻譯結果。 因此,實際翻譯數量大於輸入音訊的標記。 您需支付語音轉譯文字轉譯的費用,以及每個目標語言的文字翻譯。

例如,假設您想要從一小時音訊檔案到三個目標語言的文字翻譯。 如果初始語音轉換文字轉譯包含 10,000 個字元,您可能會向您收取 $2.80 的費用。

警告

此範例中的價格僅供說明之用。 如需最新的定價資訊,請參閱 Azure AI 語音定價Azure AI 翻譯工具 定價。

先前的範例價格為 $2.80,其計算方式是結合語音轉譯與文字轉譯和文字翻譯成本。 以下是計算的完成方式:

  • 語音翻譯清單價格為每小時 2.50 美元,最多涵蓋 2 個目標語言。 價格是用來計算成本的範例。 如需最新的定價資訊,請參閱 Azure AI 語音定價表中的隨用>隨付語音翻譯>標準。
  • 本範例中第三種語言翻譯的成本為 30 美分。 翻譯清單價格為每百萬個字元 10 美元。 由於音訊檔案包含 10,000 個字元,翻譯成本為 $10 * 10,000 / 1,000,000 * 3 = $0.3。 此方程式中的數位 「3」 代表中繼流量的加權係數,可能會因所涉及的語言而有所不同。 價格是用來計算成本的範例。 如需最新的定價資訊,請參閱 Azure AI 翻譯工具 定價表中的隨用隨付>標準翻譯>文字翻譯。

開始使用

在第一個步驟中 ,請嘗試語音翻譯快速入門。 語音翻譯服務可透過語音 SDK語音 CLI 取得。

您可以在 GitHub 上找到 語音 SDK 語音轉換文字和翻譯範例 。 這些範例包含常見案例,例如從檔案或串流讀取音訊、連續辨識及翻譯、一次性辨識及翻譯,以及使用自訂模型。

下一步