Rozhraní REST API pro převod řeči na text

Článek
11/12/2024

Rozhraní REST API pro převod řeči na text se používá k dávkovému přepisu a vlastní řeči.

Důležité

Verze 2024-11-15 rozhraní REST API pro převod řeči na text je obecně dostupná nejnovější verze.

Verze 2024-05-15-preview rozhraní REST API pro převod řeči na text bude k datu oznámení vyřazena.
Rozhraní REST API v3.0pro převod řeči na text , , 3.2-preview.1v3.1v3.2, a 3.2-preview.2 bude vyřazeno 1. dubna 2026.

Další informace o upgradu najdete v průvodcích migrací rozhraní REST API pro převod řeči na text v3.0 na verzi 3.1, v3.1 na verzi 3.2 a v3.2 až 2024-11-15 .

Referenční dokumentace k rozhraní REST API pro převod řeči na text 2024-11-15

Použití služby Speech k textovému rozhraní REST API pro:

Rychlý přepis: Přepis zvukových souborů se synchronně vrací výsledky a mnohem rychleji než zvuk v reálném čase. Rozhraní API pro rychlý přepis (/speechtotext/přepisy:přepis) použijte ve scénářích, které potřebujete co nejrychleji přepis zvukového záznamu s předvídatelnou latencí, jako je například rychlý přepis zvuku nebo video transkripce nebo překlad videa.
Vlastní řeč: Nahrajte vlastní data, otestujte a vytrénujte vlastní model, porovnejte přesnost mezi modely a nasaďte model do vlastního koncového bodu. Pokud chcete, aby kolegové měli přístup k vytvořenému modelu nebo pokud chcete model nasadit do více než jedné oblasti, zkopírujte modely do jiných předplatných.
Dávkový přepis: Přepis zvukových souborů jako dávky z několika adres URL nebo kontejneru Azure.

Rozhraní REST API pro převod řeči na text zahrnuje například tyto funkce:

Pokud jsou pro tento koncový bod požadovány protokoly, získejte protokoly pro každý koncový bod.
Požádejte manifest modelů, které vytvoříte, a nastavte místní kontejnery.
Nahrajte data z účtů úložiště Azure pomocí identifikátoru URI sdíleného přístupového podpisu (SAS).
Přineste si vlastní úložiště. Pro protokoly, soubory přepisu a další data použijte vlastní účty úložiště.
Některé operace podporují oznámení webhooků. Můžete zaregistrovat webhooky, kde se odesílají oznámení.

Dávkový přepis

Pro dávkový přepis platí následující skupiny operací.

Skupina operací	Popis
Modely	K přepisu zvukových souborů použijte základní modely nebo vlastní modely. Modely můžete používat s vlastní řečí a dávkovým přepisem. K přepisu zvukových souborů můžete například použít model natrénovaný s konkrétní datovou sadou. Příklady trénování a správy vlastních modelů řeči najdete v tématu Trénování modelu a životního cyklu vlastního modelu řeči.
Přepisy	Přepisy slouží k přepisu velkého množství zvuku v úložišti. Při použití dávkového přepisu odešlete více souborů na požadavek nebo nasměrujete do kontejneru služby Azure Blob Storage se zvukovými soubory, které se mají přepisovat. Příklady vytvoření přepisu z více zvukových souborů najdete v tématu Vytvoření přepisu .
Webhooky	Pomocí webhooků můžete dostávat oznámení o událostech vytváření, zpracování, dokončování a odstraňování. Webhooky můžete používat s vlastní řečí a dávkovým přepisem. Webové hooky se vztahují na datové sady, koncové body, vyhodnocení, modely a přepisy.

Vlastní řeč

Následující skupiny operací platí pro vlastní řeč.

Skupina operací	Popis
Datové sady	Pomocí datových sad můžete trénovat a testovat vlastní modely řeči. Můžete například porovnat výkon vlastní řeči natrénované s konkrétní datovou sadou s výkonem základního modelu nebo vlastního speech modelu natrénovaného s jinou datovou sadou. Příklady nahrávání datových sad najdete v tématu Nahrání trénovacích a testovacích datových sad.
Koncové body	Nasaďte vlastní modely řeči do koncových bodů. Pokud chcete použít vlastní model řeči , musíte nasadit vlastní koncový bod. Příklady správy koncových bodů nasazení najdete v tématu Nasazení modelu .
Evakuace	Pomocí vyhodnocení můžete porovnat výkon různých modelů. Můžete například porovnat výkon vlastního modelu řeči natrénovaného s konkrétní datovou sadou s výkonem základního modelu nebo vlastního modelu natrénovaného s jinou datovou sadou. Příklady, jak testovat a vyhodnotit vlastní modely řeči, najdete v tématu o kvalitě rozpoznávání testů a přesnosti testů.
Modely	K přepisu zvukových souborů použijte základní modely nebo vlastní modely. Modely můžete používat s vlastní řečí a dávkovým přepisem. K přepisu zvukových souborů můžete například použít model natrénovaný s konkrétní datovou sadou. Příklady trénování a správy vlastních modelů řeči najdete v tématu Trénování modelu a životního cyklu vlastního modelu řeči.
Projekty	Pomocí projektů můžete spravovat vlastní modely řeči, trénovací a testovací datové sady a koncové body nasazení. Vlastní projekty řeči obsahují modely, trénovací a testovací datové sady a koncové body nasazení. Každý projekt je specifický pro národní prostředí. Můžete například vytvořit projekt pro angličtinu v USA. Příklady vytvoření projektů najdete v tématu Vytvoření projektu .
Webhooky	Pomocí webhooků můžete dostávat oznámení o událostech vytváření, zpracování, dokončování a odstraňování. Webhooky můžete používat s vlastní řečí a dávkovým přepisem. Webové hooky se vztahují na datové sady, koncové body, vyhodnocení, modely a přepisy.

Stav služeb

Stav služby poskytuje přehled o celkovém stavu služby a dílčích součástech. Další informace najdete v tématu Service Health .

Sdílet prostřednictvím

Rozhraní REST API pro převod řeči na text

Dávkový přepis

Vlastní řeč

Stav služeb

Další kroky

Váš názor

Další materiály