Megosztás a következőn keresztül:


Mi az a személyes hang a szövegfelolvasáshoz?

A személyes hang használatával lehetővé teheti a felhasználók számára, hogy néhány másodperc alatt megkapják a saját hangjuk AI által generált replikációját. Egy szóbeli utasítással és egy rövid beszédmintával hangüzenetként létrehozhat egy személyes hangot a felhasználók számára, és lehetővé teheti számukra, hogy beszédet generáljanak a több mint 90 nyelven, több mint 100 területi beállításban támogatott nyelvek bármelyikében.

Feljegyzés

A személyes hang ezekben a régiókban érhető el: Nyugat-Európában, az USA keleti régiójában és Délkelet-Ázsiában. A támogatott területi beállításokért tekintse meg a személyes hangnyelv támogatását.

Az alábbi táblázat összefoglalja a személyes hang és a professzionális egyéni neurális hang közötti különbséget.

Összehasonlítás Személyes hang Professzionális hang
Célforgatókönyvek Az üzleti ügyfelek olyan alkalmazást hozhatnak létre, amely lehetővé teszi a felhasználók számára a saját személyes hangjuk létrehozását és használatát az alkalmazásban. Olyan professzionális forgatókönyvek, mint például a csevegőrobotok márka- és karakterhangjai, vagy a hangtartalmak olvasása.
Használati esetek Korlátozott használati esetekre korlátozva. Lásd az átláthatósági megjegyzést. A jóváhagyott ügyfeleknek több mint 1000 személyes hang támogatásával kell rendelkezniük. Korlátozott használati esetekre korlátozva. Lásd az átláthatósági megjegyzést.
Betanítási adatok Ügyeljen arra, hogy kövesse a magatartási kódexet. Hozza magával a saját adatait. Professzionális stúdióban való felvétel ajánlott.
Szükséges adatméret Egy perc emberi beszéd. 300-2000 beszéd (kb. 30 perc-3 óra emberi beszéd).
Betanítási idő Kevesebb, mint 5 másodperc Körülbelül 20–40 számítási óra.
Hangminőség Természetes Rendkívül természetes
Többnyelvű támogatás Igen. A hang 100 nyelvről tud beszélni, és az automatikus nyelvfelismerés engedélyezve van. Igen. A betanítási adatoktól eltérő nyelvet beszélő modellek betanításához ki kell választania a "Neurális – többnyelvű" funkciót.
Elérhetőség A Speech Studio bemutatója regisztráció után érhető el. Az API-hoz való hozzáférés a jogosult ügyfelekre és a jóváhagyott használati esetekre korlátozódik. Hozzáférés kérése a beviteli űrlapon keresztül. A CNV Pro-modelleket csak a hozzáférés jóváhagyása után taníthatja be és helyezheti üzembe. A CNV Pro hozzáférése a jogosultsági és használati feltételek alapján korlátozott. Hozzáférés kérése a beviteli űrlapon keresztül.
Díjszabás Tekintse meg a díjszabás részleteit itt1. Itt megtekintheti a díjszabás részleteit.
Felelős AI-követelmények A beszélő szóbeli nyilatkozata szükséges. Nem engedélyezett a nem jóváhagyott használati eset. A beszélő szóbeli nyilatkozata szükséges. Nem engedélyezett a nem jóváhagyott használati eset.

1 Vegye figyelembe, hogy a személyes hangalapú díjszabás csak az olyan szolgáltatási régiókban lesz látható, ahol a szolgáltatás elérhető, beleértve Nyugat-Európát, az USA keleti régióját és Délkelet-Ázsiát.

Próbálja ki a demót

Ha S0-erőforrása van, elérheti a személyes hangbemutatót a Speech Studióban. A személyes hang API használatához itt kérheti a hozzáférést.

  1. Ugrás a Speech Studióra

  2. Válassza ki a Személyes hangkártyát .

  3. Rögzítheti a saját hangját, és kipróbálhatja a hangkimeneti mintákat különböző nyelveken. A bemutató tartalmazza a személyes hang által támogatott nyelvek egy részét.

    Képernyőkép a Speech Studióban a személyes hanglefokozás élményéről.

Személyes hang létrehozása

Első lépésként tekintse meg a személyes hang létrehozásának lépéseit:

  1. Hozzon létre egy projektet.
  2. Hozzájárulási fájl feltöltése. A személyes hangfunkcióval minden hang létrehozását a felhasználó kifejezett hozzájárulásával kell végezni. A felhasználó által rögzített utasításra van szükség, amely elismeri, hogy az ügyfél (az Azure AI Speech erőforrás tulajdonosa) létrehozza és használja a hangját.
  3. Kérje le a személyes hang beszélőprofil-azonosítóját . A beszélő profilazonosítóját a beszélő szóbeli hozzájárulási nyilatkozata és egy hangüzenet alapján kapja meg. A felhasználó hangjellemzői a speakerProfileId szövegfelolvasáshoz használt tulajdonságban vannak kódolva.

Ha már rendelkezik személyes hangokkal, a több mint 100 területi beállítással támogatott 91 nyelv bármelyikében szintetizálhatja a beszédet. Nincs szükség területi címke megadására. A személyes hang automatikus nyelvfelismerést használ a mondat szintjén. További információ: Személyes hang használata az alkalmazásban.

Tipp.

A GitHub Speech SDK-adattárában található kódmintákból megtudhatja, hogyan használhatja a személyes hangokat az alkalmazásban.

Referenciadokumentáció

Felelős AI

Törődünk az AI-t használó emberekkel és azokkal az emberekkel, akiket érint a technológia. További információkért tekintse meg a Felelős AI átláthatósági megjegyzéseit.

Következő lépések