Kód áttelepítése a 3.0-s verzióról a REST API 3.1-es verziójára

A Speech to text REST API a Batch átírásához és az egyéni beszédhez használatos. A 3.0-ról 3.1-es verzióra történő módosításokat az alábbi szakaszok ismertetik.

Fontos

A Speech to text REST API v3.2 előzetes verzióban érhető el. Általánosan elérhető a Beszéd a szöveghez REST API 3.1-es verzió. A speech to text REST API 3.0 2026. április 1-jén megszűnik. További információ: Speech to text REST API v3.0–v3.1 és v3.1–v3.2 migrálási útmutatók.

Alap elérési út

Frissítenie kell a kód alap elérési útját a kezdőpontról /speechtotext/v3.0 a következőre /speechtotext/v3.1: . Ha például alapmodelleket szeretne lekérni a eastus régióban, használja https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base ahelyett https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/base, hogy a .

Figyelje meg az alábbi egyéb módosításokat:

  • A /models/{id}/copyto 3.0-s verzióban lévő műveletet (beleértve a "/"-t) a 3.1-es verzióban lévő /models/{id}:copyto művelet váltja fel (beleértve a ":"-t is).
  • A /webhooks/{id}/ping 3.0-s verzióban lévő műveletet (beleértve a "/"-t) a 3.1-es verzióban lévő /webhooks/{id}:ping művelet váltja fel (beleértve a ":"-t is).
  • A /webhooks/{id}/test 3.0-s verzióban lévő műveletet (beleértve a "/"-t) a 3.1-es verzióban lévő /webhooks/{id}:test művelet váltja fel (beleértve a ":"-t is).

További információkért lásd az útmutató későbbi, műveleti azonosítóit .

Kötegelt átírás

Feljegyzés

Ne használja a Speech to text REST API 3.0-s verziót a Speech to text REST API 3.1-es verzióval létrehozott átirat lekéréséhez. A következőhöz hasonló hibaüzenet jelenik meg: "Az API-verzió nem használható az átírás eléréséhez. Használja az API 3.1-es vagy újabb verzióját."

A Transcriptions_Create műveletben a következő három tulajdonság van hozzáadva:

  • A displayFormWordLevelTimestampsEnabled tulajdonság lehetővé teszi a szószintű időbélyegek jelentését az átírási eredmények megjelenítési formájában. Az eredmények az displayWords átiratfájl tulajdonságában jelennek meg.
  • A diarization tulajdonság segítségével megadható az opcionális diarizálás (hangszóróleválasztás) során létrehozandó hangszórócímkék minimális és maximális száma. Ezzel a funkcióval a szolgáltatás mostantól több hangszóróhoz is képes előadói címkéket létrehozni. A tulajdonság használatához a tulajdonságot trueis be kell állítaniadiarizationEnabled. A v3.1 API-val növeltük a v3.0 API által támogatott két hangszóróból történő diarizálással azonosítható hangszórók számát. A jobb teljesítmény érdekében ajánlott 30 alatt tartani a hangszórók számát.
  • A languageIdentification tulajdonság az átírás előtt megadhatja a bemenet nyelvazonosítási beállításait. A nyelvazonosításhoz legfeljebb 10 jelölt területi beállítás támogatott. A visszaadott átirat egy új locale tulajdonságot tartalmaz a felismert nyelvhez vagy a megadott területi beállításhoz.

A filter tulajdonság hozzáadódik a Transcriptions_List, Transcriptions_ListFiles és Projects_ListTranscriptions műveletekhez. A filter kifejezés a rendelkezésre álló erőforrások egy részhalmazának kiválasztására használható. Szűrhet displayName, description, createdDateTime, lastActionDateTime, statusés locale. Például: filter=createdDateTime gt 2022-02-01T11:00:00Z

Ha a webhook használatával kap értesítéseket az átírás állapotáról, vegye figyelembe, hogy a V3.0 API-val létrehozott webhookok nem tudnak értesítéseket fogadni a V3.1 átírási kérelmekről. Új webhookvégpontot kell létrehoznia a V3.1 API-val, hogy értesítéseket kapjon a V3.1 átírási kérelmekről.

Egyéni beszéd

Adathalmazok

A következő műveletek jelennek meg egy adathalmaz több adatblokkjának feltöltéséhez és kezeléséhez:

  • Datasets_UploadBlock – Adatblokk feltöltése az adathalmazhoz. A blokk maximális mérete 8MiB.
  • Datasets_GetBlocks – Az adatkészlethez feltöltött blokkok listájának lekérése.
  • Datasets_CommitBlocks – Tiltólista véglegesítése az adathalmaz feltöltésének befejezéséhez.

A markdown-adatok strukturált szöveggel történő modelladaptálásának támogatása érdekében a Datasets_Create művelet mostantól támogatja a LanguageMarkdown adattípust. További információ: adathalmazok feltöltése.

Modellek

A Models_ListBaseModels és Models_GetBaseModel műveletek információkat adnak vissza az egyes alapmodellek által támogatott alkalmazkodás típusáról.

"features": {
    "supportsAdaptationsWith": [
        "Acoustic",
        "Language",
        "LanguageMarkdown",
        "Pronunciation"
    ]
}

A Models_Create művelet új customModelWeightPercent tulajdonsággal rendelkezik, ahol megadhatja az egyéni nyelvi modell (egyszerű vagy strukturált szöveges adatokból betanított) és az alapnyelvi modell kombinálásakor használt súlyt. Az érvényes értékek 1 és 100 közötti egész számok. Az alapértelmezett érték jelenleg 30.

A filter tulajdonság a következő műveletekhez lesz hozzáadva:

A filter kifejezés a rendelkezésre álló erőforrások egy részhalmazának kiválasztására használható. Szűrhet displayName, description, createdDateTime, lastActionDateTime, status, localeés kind. Például: filter=locale eq 'en-US'

Hozzáadta a Models_ListFiles műveletet a megadott azonosító által azonosított modell fájljainak lekéréséhez.

Hozzáadta a Models_GetFile műveletet egy adott (fileId azonosítóval azonosított) fájl lekéréséhez egy modellből (azonosítóval azonosítva). Ez lehetővé teszi egy ModelReport-fájl lekérését, amely információkat nyújt a betanítás során feldolgozott adatokról.

Műveleti azonosítók

Frissítenie kell a kód alap elérési útját a kezdőpontról /speechtotext/v3.0 a következőre /speechtotext/v3.1: . Ha például alapmodelleket szeretne lekérni a eastus régióban, használja https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base ahelyett https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/base, hogy a .

A 3.1-es verzió mindegyikének operationId neve az objektum nevével van előtagban. A "Modell létrehozása" kifejezés például a operationId 3.0-s verzióban a CreateModel-ről Models_Create a 3.1-es verzióban.

A /models/{id}/copyto 3.0-s verzióban lévő műveletet (beleértve a "/"-t) a 3.1-es verzióban lévő /models/{id}:copyto művelet váltja fel (beleértve a ":"-t is).

A /webhooks/{id}/ping 3.0-s verzióban lévő műveletet (beleértve a "/"-t) a 3.1-es verzióban lévő /webhooks/{id}:ping művelet váltja fel (beleértve a ":"-t is).

A /webhooks/{id}/test 3.0-s verzióban lévő műveletet (beleértve a "/"-t) a 3.1-es verzióban lévő /webhooks/{id}:test művelet váltja fel (beleértve a ":"-t is).

Következő lépések