Mi az a személyes hang a szövegfelolvasáshoz?
A személyes hang használatával lehetővé teheti a felhasználók számára, hogy néhány másodperc alatt megkapják a saját hangjuk AI által generált replikációját. Egy szóbeli utasítással és egy rövid beszédmintával hangüzenetként létrehozhat egy személyes hangot a felhasználók számára, és lehetővé teheti számukra, hogy beszédet generáljanak a több mint 90 nyelven, több mint 100 területi beállításban támogatott nyelvek bármelyikében.
Feljegyzés
A személyes hang ezekben a régiókban érhető el: Nyugat-Európában, az USA keleti régiójában és Délkelet-Ázsiában. A támogatott területi beállításokért tekintse meg a személyes hangnyelv támogatását.
Az alábbi táblázat összefoglalja a személyes hang és a professzionális egyéni neurális hang közötti különbséget.
Összehasonlítás | Személyes hang | Professzionális hang |
---|---|---|
Célforgatókönyvek | Az üzleti ügyfelek olyan alkalmazást hozhatnak létre, amely lehetővé teszi a felhasználók számára a saját személyes hangjuk létrehozását és használatát az alkalmazásban. | Olyan professzionális forgatókönyvek, mint például a csevegőrobotok márka- és karakterhangjai, vagy a hangtartalmak olvasása. |
Használati esetek | Korlátozott használati esetekre korlátozva. Lásd az átláthatósági megjegyzést. A jóváhagyott ügyfeleknek több mint 1000 személyes hang támogatásával kell rendelkezniük. | Korlátozott használati esetekre korlátozva. Lásd az átláthatósági megjegyzést. |
Betanítási adatok | Ügyeljen arra, hogy kövesse a magatartási kódexet. | Hozza magával a saját adatait. Professzionális stúdióban való felvétel ajánlott. |
Szükséges adatméret | Egy perc emberi beszéd. | 300-2000 beszéd (kb. 30 perc-3 óra emberi beszéd). |
Betanítási idő | Kevesebb, mint 5 másodperc | Körülbelül 20–40 számítási óra. |
Hangminőség | Természetes | Rendkívül természetes |
Többnyelvű támogatás | Igen. A hang 100 nyelvről tud beszélni, és az automatikus nyelvfelismerés engedélyezve van. | Igen. A betanítási adatoktól eltérő nyelvet beszélő modellek betanításához ki kell választania a "Neurális – többnyelvű" funkciót. |
Elérhetőség | A Speech Studio bemutatója regisztráció után érhető el. Az API-hoz való hozzáférés a jogosult ügyfelekre és a jóváhagyott használati esetekre korlátozódik. Hozzáférés kérése a beviteli űrlapon keresztül. | A CNV Pro-modelleket csak a hozzáférés jóváhagyása után taníthatja be és helyezheti üzembe. A CNV Pro hozzáférése a jogosultsági és használati feltételek alapján korlátozott. Hozzáférés kérése a beviteli űrlapon keresztül. |
Díjszabás | Tekintse meg a díjszabás részleteit itt1. | Itt megtekintheti a díjszabás részleteit. |
Felelős AI-követelmények | A beszélő szóbeli nyilatkozata szükséges. Nem engedélyezett a nem jóváhagyott használati eset. | A beszélő szóbeli nyilatkozata szükséges. Nem engedélyezett a nem jóváhagyott használati eset. |
1 Vegye figyelembe, hogy a személyes hangalapú díjszabás csak az olyan szolgáltatási régiókban lesz látható, ahol a szolgáltatás elérhető, beleértve Nyugat-Európát, az USA keleti régióját és Délkelet-Ázsiát.
Próbálja ki a demót
Ha S0-erőforrása van, elérheti a személyes hangbemutatót a Speech Studióban. A személyes hang API használatához itt kérheti a hozzáférést.
Válassza ki a Személyes hangkártyát .
Rögzítheti a saját hangját, és kipróbálhatja a hangkimeneti mintákat különböző nyelveken. A bemutató tartalmazza a személyes hang által támogatott nyelvek egy részét.
Személyes hang létrehozása
Első lépésként tekintse meg a személyes hang létrehozásának lépéseit:
- Hozzon létre egy projektet.
- Hozzájárulási fájl feltöltése. A személyes hangfunkcióval minden hang létrehozását a felhasználó kifejezett hozzájárulásával kell végezni. A felhasználó által rögzített utasításra van szükség, amely elismeri, hogy az ügyfél (az Azure AI Speech erőforrás tulajdonosa) létrehozza és használja a hangját.
- Kérje le a személyes hang beszélőprofil-azonosítóját . A beszélő profilazonosítóját a beszélő szóbeli hozzájárulási nyilatkozata és egy hangüzenet alapján kapja meg. A felhasználó hangjellemzői a
speakerProfileId
szövegfelolvasáshoz használt tulajdonságban vannak kódolva.
Ha már rendelkezik személyes hangokkal, a több mint 100 területi beállítással támogatott 91 nyelv bármelyikében szintetizálhatja a beszédet. Nincs szükség területi címke megadására. A személyes hang automatikus nyelvfelismerést használ a mondat szintjén. További információ: Személyes hang használata az alkalmazásban.
Tipp.
A GitHub Speech SDK-adattárában található kódmintákból megtudhatja, hogyan használhatja a személyes hangokat az alkalmazásban.
Referenciadokumentáció
Felelős AI
Törődünk az AI-t használó emberekkel és azokkal az emberekkel, akiket érint a technológia. További információkért tekintse meg a Felelős AI átláthatósági megjegyzéseit.
Következő lépések
- Hozzon létre egy projektet.
- További információ az egyéni neurális hangról az áttekintésben.
- További információ a Speech Studióról az áttekintésben.