Megosztás a következőn keresztül:


Hangtehetség-hozzájárulás hozzáadása a professzionális hangprojekthez

A hangtehetség olyan egyéni vagy célelőadó, akinek a hangját neurális hangmodellek létrehozásához rögzítik és használják.

A neurális hang betanítása előtt be kell küldenie egy felvételt a hangtehetség hozzájárulási nyilatkozatáról. A hangtehetség-állítás a hangtehetség-olvasó nyilatkozat felvétele, amely hozzájárul a beszédadatok egyéni hangmodell betanításához való használatához. A hozzájárulási nyilatkozat azt is ellenőrzi, hogy a hangtehetség ugyanaz-e, mint a betanítási adatok előadója.

Tipp.

Mielőtt elkezdené a Speech Studiót, határozza meg a hang személyiségét, és válassza ki a megfelelő hangtehetségeket.

A szóbeli hozzájárulási nyilatkozatot több nyelven is megtalálhatja a GitHubon. A szóbeli utasítás nyelvének meg kell egyeznie a felvétel nyelvével. Lásd még a hangtehetség nyilvánosságra hozatalát.

Hangtehetség hozzáadása

Hangtehetségprofil hozzáadásához és hozzájárulási nyilatkozatuk feltöltéséhez kövesse az alábbi lépéseket:

  1. Jelentkezzen be a Speech Studióba.
  2. Egyéni hang kiválasztása A projekt neve >Hangtehetség>beállítása Hangtehetség hozzáadása.>
  3. Az Új hangtehetség hozzáadása varázslóban írja le a létrehozni kívánt hang jellemzőit. Az itt megadott forgatókönyveknek összhangban kell lenniük az alkalmazásűrlapon megadottakkal.
  4. Válassza a Tovább lehetőséget.
  5. A Hangtehetség-nyilatkozat feltöltése lapon kövesse az utasításokat a korábban rögzített hangtehetség-nyilatkozat feltöltéséhez. Győződjön meg arról, hogy a verbális utasítás ugyanazokkal a beállításokkal, környezettel és beszédstílussal lett rögzítve , mint a betanítási adatok. Képernyőkép a hangtehetség-nyilatkozat feltöltési párbeszédpaneléről.
  6. Adja meg a hangtehetség nevét és a vállalat nevét. A hangtehetség neve annak a személynek a neve, aki a hozzájárulási nyilatkozatot rögzítette. Adja meg a nevet a rögzített utasításban használt nyelven. A cégnévnek meg kell egyeznie a rögzített utasításban elhangzott cégnévvel. Győződjön meg arról, hogy a vállalat neve a rögzített utasítás nyelvével megegyező nyelven van megadva.
  7. Válassza a Tovább lehetőséget.
  8. Tekintse át a hangtehetség és a személyiség részleteit, és válassza a Küldés lehetőséget.

A hangtehetség sikeres állapota után folytathatja az egyéni hangmodell betanítását.

Következő lépések

A professzionális hangfunkcióval minden hangot a felhasználó kifejezett hozzájárulásával kell létrehozni. A felhasználó által rögzített utasításra van szükség, amely elismeri, hogy az ügyfél (az Azure AI Speech erőforrás tulajdonosa) létrehozza és használja a hangját.

Ha hozzá szeretné adni a hangtehetség-hozzájárulást a professzionális hangprojekthez, megkapja az előre rögzített hozzájárulási hangfájlt egy nyilvánosan elérhető URL-címről (Consents_Create), vagy feltöltheti a hangfájlt (Consents_Post). Ebben a cikkben hozzájárulást ad egy URL-címhez.

A hozzájárulási nyilatkozatot beszélő felhasználóról hangrögzítésre van szükség.

A hozzájárulási nyilatkozat szövegét a szövegtől a beszéd gitHub-adattárig minden egyes területi beállításhoz lekérheti. A területi beállításhoz tartozó hozzájárulási nyilatkozat SpeakerAuthorization.txten-US:

"I  [state your first and last name] am aware that recordings of my voice will be used by [state the name of the company] to create and use a synthetic version of my voice."

Ha egy hangfájl URL-címéről szeretne hozzájárulást adni egy professzionális hangprojekthez, használja az egyéni hang API Consents_Create műveletét. A kérelem törzsének összeállítása az alábbi utasítások szerint:

  • Állítsa be a szükséges projectId tulajdonságot. Lásd: projekt létrehozása.
  • Állítsa be a szükséges voiceTalentName tulajdonságot. A hangtehetség neve annak a személynek a neve, aki a hozzájárulási nyilatkozatot rögzítette. Adja meg a nevet a rögzített utasításban használt nyelven. A hangtehetség neve később nem módosítható.
  • Állítsa be a szükséges companyName tulajdonságot. A cégnévnek meg kell egyeznie a rögzített utasításban szereplő cégnévvel. Győződjön meg arról, hogy a vállalat neve a rögzített utasítás nyelvével megegyező nyelven van megadva. A vállalat neve később nem módosítható.
  • Állítsa be a szükséges audioUrl tulajdonságot. A hangtehetség-hozzájárulás hangfájljának URL-címe. Használjon URI-t a közös hozzáférésű jogosultságkódok (SAS) jogkivonatával.
  • Állítsa be a szükséges locale tulajdonságot. Ennek kell lennie a hozzájárulás területi beállításának. A területi beállítás később nem módosítható. A beszéd területi beállítási listáját itt találja.

Hozzon létre egy HTTP PUT-kérést az URI használatával az alábbi Consents_Create példában látható módon.

  • Cserélje le YourResourceKey a Speech erőforráskulcsot.
  • Cserélje le YourResourceRegion a Speech erőforrásrégióját.
  • Cserélje le JessicaConsentId az Ön által választott hozzájárulási azonosítóra. A kis- és nagybetűk megkülönböztetett azonosítója a hozzájárulás URI-jában lesz használva, és később nem módosítható.
curl -v -X PUT -H "Ocp-Apim-Subscription-Key: YourResourceKey" -H "Content-Type: application/json" -d '{
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "audioUrl": "https://contoso.blob.core.windows.net/public/jessica-consent.wav?mySasToken",
  "locale": "en-US"
} '  "https://YourResourceRegion.api.cognitive.microsoft.com/customvoice/consents/JessicaConsentId?api-version=2024-02-01-preview"

A válasz törzsének a következő formátumban kell érkeznie:

{
  "id": "JessicaConsentId",
  "description": "Consent for Jessica voice",
  "projectId": "ProjectId",
  "voiceTalentName": "Jessica Smith",
  "companyName": "Contoso",
  "locale": "en-US",
  "status": "NotStarted",
  "createdDateTime": "2023-04-01T05:30:00.000Z",
  "lastActionDateTime": "2023-04-02T10:15:30.000Z"
}

A válaszfejléc tartalmazza a tulajdonságot Operation-Location . Ezzel az URI-val részletes információkat kaphat a Consents_Create műveletről. Íme egy példa a válaszfejlécre:

Operation-Location: https://eastus.api.cognitive.microsoft.com/customvoice/operations/070f7986-ef17-41d0-ba2b-907f0f28e314?api-version=2024-02-01-preview
Operation-Id: 070f7986-ef17-41d0-ba2b-907f0f28e314

Következő lépések