Události
Vytváření aplikací a agentů AI
17. 3. 21 - 21. 3. 10
Připojte se k řadě meetupů a vytvořte škálovatelná řešení AI založená na skutečných případech použití s kolegy vývojáři a odborníky.
ZaregistrovatTento prohlížeč se už nepodporuje.
Upgradujte na Microsoft Edge, abyste mohli využívat nejnovější funkce, aktualizace zabezpečení a technickou podporu.
Služba Speech poskytuje funkce převodu řeči na text a text na řeč pomocí prostředku služby Speech. Převod řeči na text s vysokou přesností, vytváření přirozeného zvuku na hlasy řeči, překlad mluveného zvuku a rozpoznávání mluvčího během konverzací.
Můžete vytvořit vlastní hlasy, přidat konkrétní slova do základního slovníku nebo sestavit vlastní modely. Službu Speech můžete provozovat kdekoli – v cloudu nebo v kontejnerech na hraničních zařízeních. Díky rozhraní Speech CLI, sadě Speech SDK a rozhraním REST API můžete snadno používat vaše aplikace, nástroje a zařízení.
Řeč je dostupná pro mnoho jazyků, oblastí a cenových bodů.
Mezi běžné scénáře pro řeč patří:
Microsoft používá službu Speech pro mnoho scénářů, jako jsou titulky v Teams, diktování v Office 365 a čtení nahlas v prohlížeči Microsoft Edge.
Tyto části shrnují funkce služby Speech s odkazy na další informace.
Pomocí řeči můžete přepsat zvuk na text, a to buď v reálném čase , nebo asynchronně pomocí dávkového přepisu.
Tip
Převod řeči v reálném čase na text v sadě Speech Studio můžete vyzkoušet bez registrace nebo psaní jakéhokoli kódu.
Na text můžete převádět zvuk z nejrůznějších zdrojů, včetně mikrofonů, zvukových souborů a úložiště objektů blob. Pomocí diarizace mluvčího určete, kdo co a kdy řekl. Automatické formátování a interpunkce umožňuje získat čitelné přepisy.
Základní model nemusí být dostatečný, pokud zvuk obsahuje okolní šum nebo zahrnuje mnoho oborových a doménových žargonů. V těchto případech můžete vytvářet a trénovat vlastní modely řeči pomocí akustických dat, jazyka a výslovnosti. Vlastní modely řeči jsou soukromé a můžou nabídnout konkurenční výhodu.
Při převodu řeči na text v reálném čase se zvuk přepíše, protože řeč se rozpozná z mikrofonu nebo souboru. Použití řeči v reálném čase k textu pro aplikace, které potřebují přepis zvuku v reálném čase, například:
Rozhraní API pro rychlý přepis se používá k přepisu zvukových souborů s synchronními a mnohem rychlejšími výsledky než zvuk v reálném čase. Používejte rychlý přepis ve scénářích, kdy potřebujete co nejrychleji přepis zvukového záznamu s předvídatelnou latencí, například:
Pokud chcete začít s rychlým přepisem, podívejte se na rychlé rozhraní API pro přepis.
Dávkový přepis se používá k přepisu velkého množství zvuku v úložišti. Na zvukové soubory můžete odkazovat pomocí identifikátoru URI sdíleného přístupového podpisu (SAS) a asynchronně přijímat výsledky přepisu. Dávkový přepis použijte pro aplikace, které potřebují hromadně přepisovat zvuk, například:
Při převodu textu na řeč můžete vstupní text převést na člověka, jako je syntetizovaná řeč. Používejte neurální hlasy, které jsou lidské jako hlasy založené na hlubokých neurálních sítích. Pomocí jazyka SSML (Speech Synthesis Markup Language) můžete doladit tón, výslovnost, rychlost mluvení, hlasitost a další funkce.
Překlad řeči umožňuje překlad řeči v reálném čase, vícejazyčný překlad řeči do vašich aplikací, nástrojů a zařízení. Tato funkce slouží k převodu řeči na řeč a převod řeči na text.
Identifikace jazyka se používá k identifikaci jazyků mluvených ve zvuku v porovnání se seznamem podporovaných jazyků. Používejte identifikaci jazyka samostatně, s rozpoznáváním textu nebo překladem řeči.
Rozpoznávání mluvčího poskytuje algoritmy, které ověřují a identifikují mluvčí podle jejich jedinečných charakteristik hlasu. Rozpoznávání mluvčího se používá k zodpovězení otázky "Kdo mluví?".
Hodnocení výslovnosti vyhodnocuje výslovnost řeči a dává mluvčím zpětnou vazbu o přesnosti a plynulosti mluveného zvuku. Posouzení výslovnosti můžou využít studenti jazyků k procvičování, přičemž budou dostávat okamžitou zpětnou vazbu, takže můžou zlepšovat svou výslovnost, aby dokázali hovořit a prezentovat s jistotou.
Rozpoznávání záměru: Použití řeči k textu s porozuměním konverzačnímu jazyku k odvození záměrů uživatele z přepisované řeči a zpracování hlasových příkazů.
Funkce Azure AI Speech můžete nasadit v cloudu nebo místně.
S kontejnery můžete službu přiblížit k datům z důvodu dodržování předpisů, zabezpečení nebo jiných provozních důvodů.
Nasazení služby Speech v suverénních cloudech je k dispozici pro některé entity státní správy a jejich partnery. Cloud Azure Government je například dostupný pro entity státní správy USA a jejich partnery. Microsoft Azure provozovaný cloudem 21Vianet je k dispozici organizacím, které mají obchodní přítomnost v Číně. Další informace najdete v tématu Suverénní cloudy.
Speech Studio je sada nástrojů založených na uživatelském rozhraní pro vytváření a integraci funkcí ze služby Azure AI Speech ve vašich aplikacích. Projekty v sadě Speech Studio vytvoříte pomocí přístupu bez kódu a pak na tyto prostředky ve svých aplikacích odkazujete pomocí sady Speech SDK, rozhraní příkazového řádku služby Speech nebo rozhraní REST API.
Speech CLI je nástroj příkazového řádku pro použití služby Speech, aniž byste museli psát kód. Ve Speech CLI je dostupná většina funkcí sady Speech SDK a některé pokročilé funkce a možnosti přizpůsobení jsou ve Speech CLI zjednodušené.
Sada Speech SDK zveřejňuje řadu funkcí služby Speech, které můžete použít k vývoji aplikací s podporou řeči. Sada Speech SDK je dostupná v mnoha programovacích jazycích a na všech platformách.
V některých případech nemůžete nebo neměli používat sadu Speech SDK. V takových případech můžete pro přístup ke službě Speech použít rozhraní REST API. K dávkovému přepisu a rozhraní REST API pro rozpoznávání mluvčího použijte například rozhraní REST API rest.
Nabízíme rychlé starty v mnoha oblíbených programovacích jazycích. Každý rychlý start je navržený tak, aby vás naučil základní vzory návrhu a spouštět kód za méně než 10 minut. V následujícím seznamu najdete rychlý start pro každou funkci:
Ukázkový kód pro službu Speech je k dispozici na GitHubu. Tyto ukázky pokrývají běžné scénáře, jako je čtení zvuku ze souboru nebo datového proudu, nepřetržité a jednostřelové rozpoznávání a práce s vlastními modely. Pomocí těchto odkazů můžete zobrazit ukázky sady SDK a REST:
Systém AI zahrnuje nejen technologii, ale také uživatele, kteří ho používají, osoby, kterých se to týká, a prostředí, ve kterém je nasazené. Přečtěte si poznámky k transparentnosti a seznamte se s zodpovědným používáním a nasazením umělé inteligence ve vašich systémech.
Události
Vytváření aplikací a agentů AI
17. 3. 21 - 21. 3. 10
Připojte se k řadě meetupů a vytvořte škálovatelná řešení AI založená na skutečných případech použití s kolegy vývojáři a odborníky.
ZaregistrovatŠkolení
Modul
Vytváření aplikací s podporou řeči pomocí služeb Azure AI - Training
Vytvářejte aplikace s podporou řeči pomocí služeb Azure AI.
Certifikace
Microsoft Certified: Inženýr AI služby Azure Associate - Certifications
Návrh a implementace řešení Azure AI pomocí služeb Azure AI, Azure AI Search a Azure Open AI