共用方式為


使用 Windows 媒體音訊語音編解碼器

Windows 媒體音訊語音編解碼器針對包含語音的音訊提供低位元速率壓縮。 編解碼器產生這類小型樣本的能力,是因為人類聲音的音效頻率範圍有限。 此優化表示專用語音編碼器會為包含更複雜音效的內容建立品質不佳的輸出,例如音樂。 不過,Windows 媒體音訊語音編解碼器會藉由提供不同的語音、音樂和混合內容模式來補償此潛在品質問題。 編解碼器會分析混合內容,以判斷要用於檔案每個部分的模式。

Windows Media Audio Voice 編解碼器是在類別識別碼CLSID_CWMSPEncMediaObject2所識別的編碼器物件中,以及在類別識別碼所識別的解碼器物件中實作CLSID_CWMSPDecMediaObject。 使用此編解碼器的媒體類型格式標記0x00A。

設定編碼器

語音編碼器支援三種模式:語音、音樂和混合。 每個模式都會優化,以取得該類型內容的最佳結果。 您可以使用 IPropertyStore 的 方法來設定語音編碼器的模式,以設定 MFPKEY_WMAVOICE_ENC_MusicSpeechClassMode 屬性。

針對混合內容設定時,Windows 媒體音訊語音編解碼器會自動偵測內容中的音樂部分。 如果您不滿意結果,您可以使用編輯決策清單來指定內容中音樂的位置, (EDL) 。 如需詳細資訊,請參閱 使用編碼語音的編輯決策清單

不同于其他音訊編碼器,您可以使用 MFPKEY_WMAVOICE_ENC_BufferWindow 屬性來設定語音內容的緩衝區視窗值。 不過,在大部分情況下,預設值應該正常運作。

注意

   設定語音編碼器時,請務必先設定輸出類型,再設定輸入類型。 這是所有音訊編解碼器的建議作業順序,但是如果呼叫 IMediaObject::GetOutputTypeIMFTransform::GetOutputType時設定輸入,語音編碼器可以回報錯誤的輸出類型。

 

解碼

解碼語音音訊沒有特殊需求。 表單詳細資訊,請參閱 設定音訊解碼

使用音訊