部署自訂語音模型
在本文中,您會了解如何部署自訂語音模型的端點。 除了批次謄寫外,您必須部署自訂端點以使用自訂語音模型。
您可以部署基本或自訂模型的端點,然後在稍後更新端點,以使用更好的定型模型。
注意
F0
語音資源所使用的端點會在七天後刪除。
新增部署端點
若要建立自訂端點,請遵循下列步驟:
登入 Speech Studio。
選取自訂語音>您的專案名稱>部署模型。
如果這是您的第一個端點,您會發現資料表中沒有列出任何端點。 建立端點之後,您可以使用此頁面來追蹤每個已部署的端點。
選取 [部署模型] 以啟動新增端點精靈。
在 [新增端點] 頁面上,輸入自訂端點的名稱和描述。
選取要與端點建立關聯的自訂模型。
您可以選擇核取方塊,以啟用端點流量的音訊和診斷記錄。
選取 [新增] 以儲存和部署端點。
在主要 [部署模型] 頁面上,新端點的詳細資料會顯示在資料表中,例如名稱、描述、狀態和到期日。 具現化使用自訂模型的新端點,最多需要 30 分鐘的時間。 當部署狀態變更為 [成功] 時,端點就可供使用了。
重要
記下模型到期日。 這是您可以使用自訂模型進行語音辨識的最後一天。 如需詳細資訊,請參閱模型和端點生命週期。
選取端點連結以查看該端點的特定資訊,例如端點金鑰、端點 URL 和範例程式碼。
若要建立端點並部署模型,請使用 spx csr endpoint create
命令。 根據下列指示來建構要求參數:
- 將
project
參數設定為現有專案的識別碼。 建議這樣做,這樣一來,您也可以在 Speech Studio 中檢視和管理端點。 您可以執行spx csr project list
命令來取得可用的專案。 - 將必要的
model
參數設定為您要部署至端點的模型識別碼。 - 設定必要的
language
參數。 端點地區設定必須符合模型的地區設定。 稍後無法變更此地區設定。 語音 CLIlanguage
參數會對應至 JSON 要求和回應中的locale
屬性。 - 設定必要的
name
參數。 這是顯示在 Speech Studio 中的名稱。 語音 CLIname
參數會對應至 JSON 要求和回應中的displayName
屬性。 - 您可以選擇是否設定
logging
參數。 將此參數設定為enabled
,以啟用端點流量的音訊和診斷記錄。 預設值為false
。
以下是建立端點和部署模型的範例語音 CLI 命令:
spx csr endpoint create --api-version v3.2 --project YourProjectId --model YourModelId --name "My Endpoint" --description "My Endpoint Description" --language "en-US"
您應該會收到下列格式的回應本文:
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"model": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/9e240dc1-3d2d-4ac9-98ec-1be05ba0e9dd"
},
"links": {
"logs": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37/files/logs",
"restInteractive": "https://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"restConversation": "https://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"restDictation": "https://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"webSocketInteractive": "wss://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"webSocketConversation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"webSocketDictation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37"
},
"project": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/projects/0198f569-cc11-4099-a0e8-9d55bc3d0c52"
},
"properties": {
"loggingEnabled": true
},
"lastActionDateTime": "2024-07-15T16:29:36Z",
"status": "NotStarted",
"createdDateTime": "2024-07-15T16:29:36Z",
"locale": "en-US",
"displayName": "My Endpoint",
"description": "My Endpoint Description"
}
回應本文中最上層 self
屬性是端點的 URI。 使用此 URI 來取得端點專案、模型和記錄的詳細資料。 您也可以使用此 URI 來更新端點。
如需在端點使用語音 CLI 的說明,請執行下列命令:
spx help csr endpoint
若要建立端點並部署模型,請使用語音轉換文字 REST API 的 Endpoints_Create 作業。 根據下列指示來建構要求本文:
- 將
project
屬性設定為現有專案的 URI。 建議這樣做,這樣一來,您也可以在 Speech Studio 中檢視和管理端點。 您可以提出 Projects_List 要求以取得可用的專案。 - 將必要的
model
屬性設定為您要部署至端點的模型 URI。 - 設定必要的
locale
屬性。 端點地區設定必須符合模型的地區設定。 稍後無法變更此地區設定。 - 設定必要的
displayName
屬性。 這是顯示在 Speech Studio 中的名稱。 - 您可以選擇是否要在
properties
中設定loggingEnabled
屬性。 將此參數設定為true
,以啟用端點流量的音訊和診斷記錄。 預設值為false
。
使用 URI 提出 HTTP POST 要求,如下列 Endpoints_Create 範例所示。 以您的語音資源金鑰取代 YourSubscriptionKey
、以您的語音資源區域取代 YourServiceRegion
,並設定要求本文屬性,如前所述。
curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey" -H "Content-Type: application/json" -d '{
"project": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/projects/0198f569-cc11-4099-a0e8-9d55bc3d0c52"
},
"properties": {
"loggingEnabled": true
},
"displayName": "My Endpoint",
"description": "My Endpoint Description",
"model": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/base/ae8d1643-53e4-4554-be4c-221dcfb471c5"
},
"locale": "en-US",
}' "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints"
您應該會收到下列格式的回應本文:
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"model": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/9e240dc1-3d2d-4ac9-98ec-1be05ba0e9dd"
},
"links": {
"logs": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37/files/logs",
"restInteractive": "https://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"restConversation": "https://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"restDictation": "https://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"webSocketInteractive": "wss://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"webSocketConversation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"webSocketDictation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37"
},
"project": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/projects/0198f569-cc11-4099-a0e8-9d55bc3d0c52"
},
"properties": {
"loggingEnabled": true
},
"lastActionDateTime": "2024-07-15T16:29:36Z",
"status": "NotStarted",
"createdDateTime": "2024-07-15T16:29:36Z",
"locale": "en-US",
"displayName": "My Endpoint",
"description": "My Endpoint Description"
}
回應本文中最上層 self
屬性是端點的 URI。 使用此 URI 來取得端點專案、模型和記錄的詳細資料。 您也可以使用此 URI 來更新或刪除端點。
變更模型並重新部署端點
端點可以更新為使用相同語音資源所建立的另一個模型。 如先前所述,您必須在模型到期之前更新端點的模型。
若要使用新模型並重新部署自訂端點:
- 登入 Speech Studio。
- 選取自訂語音>您的專案名稱>部署模型。
- 依名稱選取端點的連結,然後選取 [變更模型]。
- 選取您要端點使用的新模型。
- 選取 [完成] 以儲存並重新部署端點。
若要使用新模型重新部署自訂端點,請使用 spx csr model update
命令。 根據下列指示來建構要求參數:
- 將必要的
endpoint
參數設定為您要部署的端點識別碼。 - 將必要的
model
參數設定為您要部署至端點的模型識別碼。
以下是使用新模型重新部署自訂端點的範例語音 CLI 命令:
spx csr endpoint update --api-version v3.2 --endpoint YourEndpointId --model YourModelId
您應該會收到下列格式的回應本文:
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"model": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/9e240dc1-3d2d-4ac9-98ec-1be05ba0e9dd"
},
"links": {
"logs": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37/files/logs",
"restInteractive": "https://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"restConversation": "https://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"restDictation": "https://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"webSocketInteractive": "wss://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"webSocketConversation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"webSocketDictation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37"
},
"project": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/projects/0198f569-cc11-4099-a0e8-9d55bc3d0c52"
},
"properties": {
"loggingEnabled": true
},
"lastActionDateTime": "2024-07-15T16:30:12Z",
"status": "Succeeded",
"createdDateTime": "2024-07-15T16:29:36Z",
"locale": "en-US",
"displayName": "My Endpoint",
"description": "My Endpoint Description"
}
如需在端點使用語音 CLI 的說明,請執行下列命令:
spx help csr endpoint
若要使用新模型重新部署自訂端點,請使用語音轉換文字 REST API 的 Endpoints_Update 作業。 根據下列指示來建構要求本文:
- 將
model
屬性設定為您要部署至端點的模型 URI。
使用 URI 提出 HTTP PATCH 要求,如下列範例所示。 以您的語音資源金鑰取代 YourSubscriptionKey
、以語音資源區域取代 YourServiceRegion
、以端點識別碼取代 YourEndpointId
,然後設定要求本文屬性,如前所述。
curl -v -X PATCH -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey" -H "Content-Type: application/json" -d '{
"model": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/9e240dc1-3d2d-4ac9-98ec-1be05ba0e9dd"
},
}' "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/YourEndpointId"
您應該會收到下列格式的回應本文:
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"model": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/9e240dc1-3d2d-4ac9-98ec-1be05ba0e9dd"
},
"links": {
"logs": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37/files/logs",
"restInteractive": "https://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"restConversation": "https://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"restDictation": "https://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"webSocketInteractive": "wss://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"webSocketConversation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"webSocketDictation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37"
},
"project": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/projects/0198f569-cc11-4099-a0e8-9d55bc3d0c52"
},
"properties": {
"loggingEnabled": true
},
"lastActionDateTime": "2024-07-15T16:30:12Z",
"status": "Succeeded",
"createdDateTime": "2024-07-15T16:29:36Z",
"locale": "en-US",
"displayName": "My Endpoint",
"description": "My Endpoint Description"
}
重新部署需要數分鐘才能完成。 同時,您的端點會使用先前的模型,不會中斷服務。
檢視記錄資料
如果您在建立端點時設定記錄資料,則可以匯出該資料。
若要下載端點記錄:
- 登入 Speech Studio。
- 選取自訂語音>您的專案名稱>部署模型。
- 依端點名稱選取連結。
- 在 [內容記錄] 下方,選取 [下載記錄]。
若要取得端點的記錄,請使用 spx csr endpoint list
命令。 根據下列指示來建構要求參數:
- 將必要的
endpoint
參數設定為您要取得記錄的端點識別碼。
以下是取得端點記錄的範例語音 CLI 命令:
spx csr endpoint list --api-version v3.2 --endpoint YourEndpointId
回應本文會傳回每個記錄檔的位置及其詳細資料。
若要取得端點的記錄,請先使用語音轉換文字 REST API 的 Endpoints_Get 作業。
使用 URI 提出 HTTP GET 要求,如下列範例所示。 以您的端點識別碼取代 YourEndpointId
、以語音資源金鑰取代 YourSubscriptionKey
,並以語音資源區域取代 YourServiceRegion
。
curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/YourEndpointId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"
您應該會收到下列格式的回應本文:
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"model": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/9e240dc1-3d2d-4ac9-98ec-1be05ba0e9dd"
},
"links": {
"logs": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/a07164e8-22d1-4eb7-aa31-bf6bb1097f37/files/logs",
"restInteractive": "https://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"restConversation": "https://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"restDictation": "https://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"webSocketInteractive": "wss://eastus.stt.speech.microsoft.com/speech/recognition/interactive/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"webSocketConversation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37",
"webSocketDictation": "wss://eastus.stt.speech.microsoft.com/speech/recognition/dictation/cognitiveservices/v1?cid=a07164e8-22d1-4eb7-aa31-bf6bb1097f37"
},
"project": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/projects/0198f569-cc11-4099-a0e8-9d55bc3d0c52"
},
"properties": {
"loggingEnabled": true
},
"lastActionDateTime": "2024-07-15T16:30:12Z",
"status": "Succeeded",
"createdDateTime": "2024-07-15T16:29:36Z",
"locale": "en-US",
"displayName": "My Endpoint",
"description": "My Endpoint Description"
}
使用先前回應本文中的「記錄」URI,提出 HTTP GET 要求。 以您的端點識別碼取代 YourEndpointId
、以語音資源金鑰取代 YourSubscriptionKey
,並以語音資源區域取代 YourServiceRegion
。
curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.2/endpoints/YourEndpointId/files/logs" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"
回應本文會傳回每個記錄檔的位置及其詳細資料。
記錄資料會在 Microsoft 擁有的儲存體上保留 30 天以供使用,之後會將其移除。 如果您擁有的儲存體帳戶連結至 Azure AI 服務訂用帳戶,則不會自動刪除記錄資料。