Co je osobní hlas pro převod textu na řeč?

2025-06-24

Pomocí osobního hlasu můžete uživatelům povolit, aby během několika sekund získali replikaci vlastních hlasů vygenerovanou pomocí umělé inteligence. Pomocí slovního příkazu a krátké ukázky řeči jako hlasové výzvy můžete pro uživatele vytvořit osobní hlas a umožnit jim generovat řeč v libovolném z více než 90 jazyků podporovaných ve více než 100 národních prostředích.

Poznámka:

Osobní hlas je k dispozici v těchto oblastech: Západní Evropa, USA – východ, USA – západ 2, Jihovýchodní Asie a Východní Asie. Podporovaná národní prostředí najdete v tématu podpora jazyka osobního hlasu.

Následující tabulka shrnuje rozdíl mezi osobním hlasem a profesionálním hlasem.

Porovnání	Osobní hlas	Profesionální hlas
Cílové scénáře	Podnikoví zákazníci můžou vytvořit aplikaci, která uživatelům umožní vytvářet a používat vlastní osobní hlas v aplikaci.	Profesionální scénáře, jako jsou hlasy značek a znaků pro chatovací roboty nebo čtení zvukového obsahu.
Případy použití	Omezeno na omezené případy použití. Podívejte se na poznámku transparentnosti.
Data pro trénink	Ujistěte se, že dodržujete pravidla chování.	Přineste si vlastní data. Doporučuje se nahrávání v profesionálním studiu.
Požadovaná velikost dat	Jedna minuta lidské řeči.	300–2000 promluv (asi 30 minut až 3 hodiny lidské řeči).
Doba trénování	Méně než 5 sekund	Přibližně 20 až 40 výpočetních hodin.
Kvalita hlasu	Přirozený	Vysoce přírodní
Podpora více jazyků	Ano. Hlas dokáže mluvit o 100 jazycích s povolenou automatickou detekcí jazyka.	Ano. Pokud chcete vytrénovat model, který mluví jiným jazykem než trénovací data, musíte vybrat funkci Neurální – křížový jazyk.
Dostupnost	Ukázka v sadě Speech Studio je k dispozici po registraci. Přístup k rozhraní API je omezený na oprávněné zákazníky a schválené případy použití. Požádejte o přístup prostřednictvím formuláře pro příjem.	Po schválení přístupu můžete používat pouze doladění hlasu profesionální úrovně. Přístup k vyladění profesionálního hlasu je omezený na základě kritérií způsobilosti a využití. Požádejte o přístup prostřednictvím formuláře pro příjem.
Ceny	Podrobnosti o cenách najdete tady¹.	Podrobnosti o cenách najdete tady.
Zodpovědné požadavky na AI	Vyžaduje se ústní prohlášení mluvčího. Nejsou povoleny žádné neschválené případy použití.	Vyžaduje se ústní prohlášení mluvčího. Nejsou povoleny žádné neschválené případy použití.

¹ Mějte na paměti, že ceny osobních hlasů budou viditelné pouze pro oblasti služeb, ve kterých je tato funkce dostupná, včetně oblasti Západní Evropa, USA – východ, USA – západ 2, Jihovýchodní Asie a Východní Asie.

Vyzkoušet ukázkovou verzi

Pokud máte prostředek S0, můžete získat přístup k osobní ukázce hlasu v sadě Speech Studio. Pokud chcete použít osobní hlasové rozhraní API, můžete požádat o přístup zde.

Přejít do sady Speech Studio
Vyberte osobní hlasovou kartu.
Můžete nahrát vlastní hlas a vyzkoušet ukázky hlasových výstupů v různých jazycích. Ukázka obsahuje podmnožinu jazyků podporovaných osobním hlasem.

Jak vytvořit osobní hlas

Začněte tím, že tady je souhrn kroků pro vytvoření osobního hlasu:

Vytvořte projekt.
Nahrání souboru souhlasu U funkce osobního hlasu je nutné, aby se každý hlas vytvořil s výslovným souhlasem uživatele. Vyžaduje se zaznamenané prohlášení od uživatele s potvrzením, že zákazník (vlastník prostředku Azure AI Speech) vytvoří a použije svůj hlas.
Získejte ID profilu mluvčího pro osobní hlas. Id profilu mluvčího získáte na základě ústního vyjádření souhlasu mluvčího a zvukové výzvy. Vlastnosti hlasu uživatele jsou kódovány ve speakerProfileId vlastnosti, která se používá pro převod textu na řeč.

Jakmile budete mít osobní hlas, můžete ho použít k syntetizaci řeči v libovolném z 91 jazyků podporovaných ve více než 100 národních prostředích. Značka národního prostředí není povinná. Osobní hlas používá automatické rozpoznávání jazyka na úrovni věty. Další informace najdete v tématu Použití osobního hlasu v aplikaci.

Návod

Podívejte se na ukázky kódu v úložišti Speech SDK na GitHubu a podívejte se, jak používat osobní hlas ve vaší aplikaci.

Referenční dokumentace

Referenční dokumentace k rozhraní REST API pro vlastní hlas

Zodpovědná AI

Záleží nám na lidech, kteří používají AI, a o lidi, na které bude mít vliv stejně jako na technologie. Další informace najdete v poznámkách k transparentnosti zodpovědné umělé inteligence.

Další kroky

Vytvořte projekt.
Další informace o vlastním hlasu najdete v přehledu.
Další informace o sadě Speech Studio najdete v přehledu.