Mi az a személyes hang a szövegfelolvasáshoz?

Cikk
10/16/2024

A személyes hang használatával lehetővé teheti a felhasználók számára, hogy néhány másodperc alatt megkapják a saját hangjuk AI által generált replikációját. Egy szóbeli utasítással és egy rövid beszédmintával hangüzenetként létrehozhat egy személyes hangot a felhasználók számára, és lehetővé teheti számukra, hogy beszédet generáljanak a több mint 90 nyelven, több mint 100 területi beállításban támogatott nyelvek bármelyikében.

Feljegyzés

A személyes hang ezekben a régiókban érhető el: Nyugat-Európában, az USA keleti régiójában és Délkelet-Ázsiában. A támogatott területi beállításokért tekintse meg a személyes hangnyelv támogatását.

Az alábbi táblázat összefoglalja a személyes hang és a professzionális egyéni neurális hang közötti különbséget.

Összehasonlítás	Személyes hang	Professzionális hang
Célforgatókönyvek	Az üzleti ügyfelek olyan alkalmazást hozhatnak létre, amely lehetővé teszi a felhasználók számára a saját személyes hangjuk létrehozását és használatát az alkalmazásban.	Olyan professzionális forgatókönyvek, mint például a csevegőrobotok márka- és karakterhangjai, vagy a hangtartalmak olvasása.
Használati esetek	Korlátozott használati esetekre korlátozva. Lásd az átláthatósági megjegyzést. A jóváhagyott ügyfeleknek több mint 1000 személyes hang támogatásával kell rendelkezniük.	Korlátozott használati esetekre korlátozva. Lásd az átláthatósági megjegyzést.
Betanítási adatok	Ügyeljen arra, hogy kövesse a magatartási kódexet.	Hozza magával a saját adatait. Professzionális stúdióban való felvétel ajánlott.
Szükséges adatméret	Egy perc emberi beszéd.	300-2000 beszéd (kb. 30 perc-3 óra emberi beszéd).
Betanítási idő	Kevesebb, mint 5 másodperc	Körülbelül 20–40 számítási óra.
Hangminőség	Természetes	Rendkívül természetes
Többnyelvű támogatás	Igen. A hang 100 nyelvről tud beszélni, és az automatikus nyelvfelismerés engedélyezve van.	Igen. A betanítási adatoktól eltérő nyelvet beszélő modellek betanításához ki kell választania a "Neurális – többnyelvű" funkciót.
Elérhetőség	A Speech Studio bemutatója regisztráció után érhető el. Az API-hoz való hozzáférés a jogosult ügyfelekre és a jóváhagyott használati esetekre korlátozódik. Hozzáférés kérése a beviteli űrlapon keresztül.	A CNV Pro-modelleket csak a hozzáférés jóváhagyása után taníthatja be és helyezheti üzembe. A CNV Pro hozzáférése a jogosultsági és használati feltételek alapján korlátozott. Hozzáférés kérése a beviteli űrlapon keresztül.
Díjszabás	Tekintse meg a díjszabás részleteit itt¹.	Itt megtekintheti a díjszabás részleteit.
Felelős AI-követelmények	A beszélő szóbeli nyilatkozata szükséges. Nem engedélyezett a nem jóváhagyott használati eset.	A beszélő szóbeli nyilatkozata szükséges. Nem engedélyezett a nem jóváhagyott használati eset.

¹ Vegye figyelembe, hogy a személyes hangalapú díjszabás csak az olyan szolgáltatási régiókban lesz látható, ahol a szolgáltatás elérhető, beleértve Nyugat-Európát, az USA keleti régióját és Délkelet-Ázsiát.

Próbálja ki a demót

Ha S0-erőforrása van, elérheti a személyes hangbemutatót a Speech Studióban. A személyes hang API használatához itt kérheti a hozzáférést.

Ugrás a Speech Studióra
Válassza ki a Személyes hangkártyát .
Rögzítheti a saját hangját, és kipróbálhatja a hangkimeneti mintákat különböző nyelveken. A bemutató tartalmazza a személyes hang által támogatott nyelvek egy részét.

Személyes hang létrehozása

Első lépésként tekintse meg a személyes hang létrehozásának lépéseit:

Hozzon létre egy projektet.
Hozzájárulási fájl feltöltése. A személyes hangfunkcióval minden hang létrehozását a felhasználó kifejezett hozzájárulásával kell végezni. A felhasználó által rögzített utasításra van szükség, amely elismeri, hogy az ügyfél (az Azure AI Speech erőforrás tulajdonosa) létrehozza és használja a hangját.
Kérje le a személyes hang beszélőprofil-azonosítóját . A beszélő profilazonosítóját a beszélő szóbeli hozzájárulási nyilatkozata és egy hangüzenet alapján kapja meg. A felhasználó hangjellemzői a speakerProfileId szövegfelolvasáshoz használt tulajdonságban vannak kódolva.

Ha már rendelkezik személyes hangokkal, a több mint 100 területi beállítással támogatott 91 nyelv bármelyikében szintetizálhatja a beszédet. Nincs szükség területi címke megadására. A személyes hang automatikus nyelvfelismerést használ a mondat szintjén. További információ: Személyes hang használata az alkalmazásban.

Tipp.

A GitHub Speech SDK-adattárában található kódmintákból megtudhatja, hogyan használhatja a személyes hangokat az alkalmazásban.

Referenciadokumentáció

Egyéni hang REST API-referenciadokumentáció

Felelős AI

Törődünk az AI-t használó emberekkel és azokkal az emberekkel, akiket érint a technológia. További információkért tekintse meg a Felelős AI átláthatósági megjegyzéseit.

Következő lépések

Hozzon létre egy projektet.
További információ az egyéni neurális hangról az áttekintésben.
További információ a Speech Studióról az áttekintésben.

Megosztás a következőn keresztül: