語音合成標記語言 (SSML) 概觀
語音合成標記語言 (SSML) 是以 XML 為基礎的標記語言,可用來微調文字轉換語音輸出屬性,例如音調、發音、說話速率、音量等等。 它提供您比純文字輸入更多的控制和彈性。
提示
您可以使用 語音資源庫 來聆聽以不同風格和音調閱讀範例文字的聲音。
使用案例
SSML 的設計目的是讓您靈活地調整語音輸出聽起來的感覺,並提供不同的屬性來自訂該輸出。 您可以使用 SSML 來:
- 定義輸入文字結構,以決定文字轉換語音輸出的結構、內容和其他特性。 例如,您可以使用 SSML 來定義段落、句子、中斷或暫停或無聲。 您可以使用書籤或描聲影像等事件標籤來包裝文字,以供應用程式稍後處理。 描聲影像是音素的視覺呈現,亦即口說語言中的個別語音聲音。
- 選擇語音、語言、名稱、樣式和角色。 您可以在單一 SSML 檔中使用多個語音。 您也可以調整重音、說話速率、音調和音量。 SSML 也可以插入預先錄製的音訊,例如音效或音符。
- 控制輸出音訊的發音。 例如,您可以使用 SSML 搭配音素和自訂語彙來改善發音。 您也可以使用 SSML 來定義單字或數學運算式的發音方式。
使用 SSML 的方式
可能符合使用案例的許多工具均可使用 SSML 功能。
重要
轉換成語音的每個字元都會計費,包括標點符號。 雖然 SSML 檔本身無法計費,但服務會計算您用來調整文字轉換成語音方式的選擇性元素,例如音素和音調,作為可計費字元。 如需詳細資訊,請參閱 價格注意事項。
您可以透過下列方式使用 SSML︰
- 音訊內容建立 工具可讓您在 Speech Studio 中撰寫純文字和 SSML。 您可以接聽輸出音訊,並調整 SSML 以改善語音合成。 如需詳細資訊,請參閱使用音訊內容建立工具來合成語音。
- 批次合成 API 會透過
inputs
屬性接受 SSML。 - 語音 CLI 透過
spx synthesize --ssml SSML
命令列引數接受 SSML。 - 語音 SDK 透過不同受支援的程式設計語言「說出」SSML 的方法來接受 SSML。