Migrace kódu z verze 3.0 do verze 3.1 rozhraní REST API

Rozhraní REST API pro převod řeči na text se používá pro dávkový přepis a vlastní řeč. Změny z verze 3.0 na 3.1 jsou popsány v následujících částech.

Důležité

Rozhraní REST API pro převod řeči na text verze 3.2 je k dispozici ve verzi Preview. Rozhraní REST API pro převod řeči na text verze 3.1 je obecně dostupné. Rozhraní REST API pro převod řeči na text verze 3.0 bude vyřazeno 1. dubna 2026. Další informace najdete v průvodcích migrací rozhraní REST API pro převod řeči na text v3.0 na verzi 3.1 a v3.1 do verze 3.2 .

Základní cesta

Je nutné aktualizovat základní cestu v kódu z /speechtotext/v3.0 do /speechtotext/v3.1. Pokud například chcete získat základní modely v eastus oblasti, použijte https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base místo https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/base.

Všimněte si těchto dalších změn:

  • Operace /models/{id}/copyto (včetně /) ve verzi 3.0 se nahradí /models/{id}:copyto operací (včetně :) ve verzi 3.1.
  • Operace /webhooks/{id}/ping (včetně /) ve verzi 3.0 se nahradí /webhooks/{id}:ping operací (včetně :) ve verzi 3.1.
  • Operace /webhooks/{id}/test (včetně /) ve verzi 3.0 se nahradí /webhooks/{id}:test operací (včetně :) ve verzi 3.1.

Další informace najdete v části ID operací dále v této příručce.

Dávkový přepis

Poznámka:

Nepoužívejte službu Speech k textovému rozhraní REST API v3.0 k načtení přepisu vytvořeného prostřednictvím rozhraní REST API pro převod řeči na text v3.1. Zobrazí se například chybová zpráva: "Verzi rozhraní API nelze použít pro přístup k tomuto přepisu. Použijte prosím rozhraní API verze 3.1 nebo vyšší."

V operaci Transcriptions_Create jsou přidány následující tři vlastnosti:

  • Vlastnost displayFormWordLevelTimestampsEnabled lze použít k povolení generování sestav časových razítek na úrovni slova ve formě zobrazení výsledků přepisu. Výsledky se vrátí ve displayWords vlastnosti souboru přepisu.
  • Vlastnost diarization lze použít k určení nápovědy pro minimální a maximální počet popisků mluvčího, které se generují při provádění volitelné diarizace (oddělení mluvčího). Díky této funkci teď služba dokáže generovat popisky mluvčího pro více než dva reproduktory. Chcete-li použít tuto vlastnost, musíte také nastavit diarizationEnabled vlastnost na true. S rozhraním API v3.1 jsme zvýšili počet mluvčích, které je možné identifikovat prostřednictvím diarizace ze dvou reproduktorů podporovaných rozhraním API verze 3.0. Doporučujeme zachovat počet reproduktorů pod 30, aby byl výkon lepší.
  • Vlastnost languageIdentification lze použít k určení nastavení pro identifikaci jazyka na vstupu před přepisem. Pro identifikaci jazyka se podporuje až 10 kandidátských národních prostředí. Vrácený přepis obsahuje novou locale vlastnost pro rozpoznaný jazyk nebo národní prostředí, které jste zadali.

Vlastnost filter se přidá do operací Transcriptions_List, Transcriptions_ListFiles a Projects_ListTranscriptions . Výraz filter lze použít k výběru podmnožina dostupných prostředků. Můžete filtrovat podle displayName, , descriptioncreatedDateTime, lastActionDateTimestatusa locale. Příklad: filter=createdDateTime gt 2022-02-01T11:00:00Z

Pokud k příjmu oznámení o stavu přepisu používáte webhook, mějte na paměti, že webhooky vytvořené prostřednictvím rozhraní API verze 3.0 nemůžou přijímat oznámení o žádostech o přepis V3.1. Abyste mohli přijímat oznámení o požadavcích přepisu verze 3.1, musíte vytvořit nový koncový bod webhooku prostřednictvím rozhraní API verze 3.1.

Vlastní řeč

Datové sady

Pro nahrávání a správu více datových bloků datové sady se přidávají následující operace:

  • Datasets_UploadBlock – Nahrajte blok dat pro datovou sadu. Maximální velikost bloku je 8MiB.
  • Datasets_GetBlocks – Získejte seznam nahraných bloků pro tuto datovou sadu.
  • Datasets_CommitBlocks – Potvrzení seznamu blokovaných položek pro dokončení nahrávání datové sady

Pokud chcete podporovat přizpůsobení modelu strukturovaným textem v datech markdownu , operace Datasets_Create teď podporuje datový typ LanguageMarkdown . Další informace najdete v tématu nahrání datových sad.

Modely

Operace Models_ListBaseModels a Models_GetBaseModel vrací informace o typu přizpůsobení podporovaném jednotlivými základními modely.

"features": {
    "supportsAdaptationsWith": [
        "Acoustic",
        "Language",
        "LanguageMarkdown",
        "Pronunciation"
    ]
}

Operace Models_Create má novou customModelWeightPercent vlastnost, kde můžete určit váhu použitou při použití vlastního jazykového modelu (trénovaného z prostých nebo strukturovaných textových dat) v kombinaci se základním jazykovým modelem. Platné hodnoty jsou celá čísla od 1 do 100. Výchozí hodnota je aktuálně 30.

Vlastnost filter se přidá do následujících operací:

Výraz filter lze použít k výběru podmnožina dostupných prostředků. Můžete filtrovat podle displayName, , descriptioncreatedDateTime, lastActionDateTimestatus, , locale, , a kind. Příklad: filter=locale eq 'en-US'

Přidání operace Models_ListFiles pro získání souborů modelu identifikovaných daným ID.

Přidání operace Models_GetFile pro získání jednoho konkrétního souboru (identifikovaného pomocí fileId) z modelu (identifikovaného s ID). To vám umožní načíst soubor ModelReport , který poskytuje informace o datech zpracovávaných během trénování.

ID operací

Je nutné aktualizovat základní cestu v kódu z /speechtotext/v3.0 do /speechtotext/v3.1. Pokud například chcete získat základní modely v eastus oblasti, použijte https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base místo https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/base.

Název každého z nich operationId ve verzi 3.1 má předponu názvu objektu. Například při vytvoření modelu ve verzi 3.0 došlo ke změně objektu operationId CreateModel ve verzi 3.0 na Models_Create ve verzi 3.1.

Operace /models/{id}/copyto (včetně /) ve verzi 3.0 se nahradí /models/{id}:copyto operací (včetně :) ve verzi 3.1.

Operace /webhooks/{id}/ping (včetně /) ve verzi 3.0 se nahradí /webhooks/{id}:ping operací (včetně :) ve verzi 3.1.

Operace /webhooks/{id}/test (včetně /) ve verzi 3.0 se nahradí /webhooks/{id}:test operací (včetně :) ve verzi 3.1.

Další kroky