Získání ID profilu mluvčího pro osobní hlas

Pokud chcete ve své aplikaci používat osobní hlas, musíte získat ID profilu mluvčího. ID profilu mluvčího se používá k vygenerování syntetizovaného zvuku s poskytnutým textovým vstupem.

Id profilu mluvčího vytvoříte na základě ústního prohlášení o souhlasu mluvčího a zvukové výzvy (čistý vzorek lidského hlasu v rozmezí 5 až 90 sekund). Vlastnosti hlasu uživatele jsou kódovány ve speakerProfileId vlastnosti, která se používá pro převod textu na řeč. Další informace najdete v tématu Použití osobního hlasu v aplikaci.

Poznámka:

ID osobního hlasu a ID profilu mluvčího nejsou stejné. Můžete zvolit osobní ID hlasu, ale služba vygeneruje ID profilu mluvčího. Osobní ID hlasu slouží ke správě osobního hlasu. ID profilu mluvčího se používá pro převod textu na řeč.

Zvukové soubory zadáte z veřejně přístupné adresy URL (PersonalVoices_Create) nebo nahrajete zvukové soubory (PersonalVoices_Post).

Vytvoření osobního hlasu ze souboru

V tomto scénáři musí být zvukové soubory dostupné místně.

Pokud chcete vytvořit osobní hlas a získat ID profilu mluvčího, použijte PersonalVoices_Post operaci vlastního hlasového rozhraní API. Sestavte tělo požadavku podle následujících pokynů:

  • Nastavte požadovanou projectId vlastnost. Viz vytvoření projektu.
  • Nastavte požadovanou consentId vlastnost. Viz přidání souhlasu uživatele.
  • Nastavte požadovanou audiodata vlastnost. Ve stejném požadavku můžete zadat jeden nebo více zvukových souborů.

Vytvořte požadavek HTTP POST pomocí identifikátoru URI, jak je znázorněno v následujícím příkladu PersonalVoices_Post.

  • Nahraďte YourResourceKey klíčem prostředku služby Speech.
  • Nahraďte YourResourceRegion oblastí prostředků služby Speech.
  • Nahraďte JessicaPersonalVoiceId osobním hlasovým ID podle vašeho výběru. V identifikátoru URI osobního hlasu se použije id s rozlišováním velkých a malých a malých písmen a nebude možné ho později změnit.
curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourResourceKey" -F 'projectId="ProjectId"' -F 'consentId="JessicaConsentId"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample001.wav"' -F 'audiodata=@"D:\PersonalVoiceTest\CNVSample002.wav"' "
https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2023-12-01-preview"

Měl by se zobrazit text odpovědi v následujícím formátu:

{
  "id": "JessicaPersonalVoiceId",
  "speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
  "projectId": "ProjectId",
  "consentId": "JessicaConsentId",
  "status": "NotStarted",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

speakerProfileId Pomocí vlastnosti můžete integrovat osobní hlas do aplikace pro řeč. Další informace najdete v tématu Použití osobního hlasu v aplikaci.

Hlavička odpovědi obsahuje Operation-Location vlastnost. Pomocí tohoto identifikátoru URI získáte podrobnosti o operaci PersonalVoices_Post . Tady je příklad hlavičky odpovědi:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2023-12-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f

Vytvoření osobního hlasu z adresy URL

V tomto scénáři už musí být zvukové soubory uložené v kontejneru Azure Blob Storage.

Pokud chcete vytvořit osobní hlas a získat ID profilu mluvčího, použijte PersonalVoices_Create operaci vlastního hlasového rozhraní API. Sestavte tělo požadavku podle následujících pokynů:

  • Nastavte požadovanou projectId vlastnost. Viz vytvoření projektu.
  • Nastavte požadovanou consentId vlastnost. Viz přidání souhlasu uživatele.
  • Nastavte požadovanou audios vlastnost. V rámci audios vlastnosti nastavte následující vlastnosti:
    • Nastavte požadovanou containerUrl vlastnost na adresu URL kontejneru Azure Blob Storage, který obsahuje zvukové soubory. Pro kontejner použijte sdílený přístupový podpis (SAS) s oprávněními ke čtení i seznamu.
    • Nastavte požadovanou extensions vlastnost na rozšíření zvukových souborů.
    • Volitelně můžete nastavit vlastnost tak, prefix aby nastavil předponu názvu objektu blob.

Vytvořte požadavek HTTP PUT pomocí identifikátoru URI, jak je znázorněno v následujícím příkladu PersonalVoices_Create.

  • Nahraďte YourResourceKey klíčem prostředku služby Speech.
  • Nahraďte YourResourceRegion oblastí prostředků služby Speech.
  • Nahraďte JessicaPersonalVoiceId osobním hlasovým ID podle vašeho výběru. V identifikátoru URI osobního hlasu se použije id s rozlišováním velkých a malých a malých písmen a nebude možné ho později změnit.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "projectId": "ProjectId",
  "consentId": "JessicaConsentId",
  "audios": {
    "containerUrl": "https://contoso.blob.core.windows.net/voicecontainer?mySasToken",
    "prefix": "jessica/",
    "extensions": [
      ".wav"
    ]
  }
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/personalvoices/JessicaPersonalVoiceId?api-version=2023-12-01-preview"

Měl by se zobrazit text odpovědi v následujícím formátu:

{
  "id": "JessicaPersonalVoiceId",
  "speakerProfileId": "3059912f-a3dc-49e3-bdd0-02e449df1fe3",
  "projectId": "ProjectId",
  "consentId": "JessicaConsentId",
  "status": "NotStarted",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

speakerProfileId Pomocí vlastnosti můžete integrovat osobní hlas do aplikace pro řeč. Další informace najdete v tématu Použití osobního hlasu v aplikaci.

Hlavička odpovědi obsahuje Operation-Location vlastnost. Pomocí tohoto identifikátoru URI získáte podrobnosti o operaci PersonalVoices_Create . Tady je příklad hlavičky odpovědi:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/1321a2c0-9be4-471d-83bb-bc3be4f96a6f?api-version=2023-12-01-preview
Operation-Id: 1321a2c0-9be4-471d-83bb-bc3be4f96a6f

Další kroky