Kód áttelepítése a 3.0-s verzióról a REST API 3.1-es verziójára
A Speech to text REST API a Batch átírásához és az egyéni beszédhez használatos. A 3.0-ról 3.1-es verzióra történő módosításokat az alábbi szakaszok ismertetik.
Fontos
A Speech to text REST API v3.2 előzetes verzióban érhető el. Általánosan elérhető a Beszéd a szöveghez REST API 3.1-es verzió. A speech to text REST API 3.0 2026. április 1-jén megszűnik. További információ: Speech to text REST API v3.0–v3.1 és v3.1–v3.2 migrálási útmutatók.
Alap elérési út
Frissítenie kell a kód alap elérési útját a kezdőpontról /speechtotext/v3.0
a következőre /speechtotext/v3.1
: . Ha például alapmodelleket szeretne lekérni a eastus
régióban, használja https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base
ahelyett https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/base
, hogy a .
Figyelje meg az alábbi egyéb módosításokat:
- A
/models/{id}/copyto
3.0-s verzióban lévő műveletet (beleértve a "/"-t) a 3.1-es verzióban lévő/models/{id}:copyto
művelet váltja fel (beleértve a ":"-t is). - A
/webhooks/{id}/ping
3.0-s verzióban lévő műveletet (beleértve a "/"-t) a 3.1-es verzióban lévő/webhooks/{id}:ping
művelet váltja fel (beleértve a ":"-t is). - A
/webhooks/{id}/test
3.0-s verzióban lévő műveletet (beleértve a "/"-t) a 3.1-es verzióban lévő/webhooks/{id}:test
művelet váltja fel (beleértve a ":"-t is).
További információkért lásd az útmutató későbbi, műveleti azonosítóit .
Kötegelt átírás
Feljegyzés
Ne használja a Speech to text REST API 3.0-s verziót a Speech to text REST API 3.1-es verzióval létrehozott átirat lekéréséhez. A következőhöz hasonló hibaüzenet jelenik meg: "Az API-verzió nem használható az átírás eléréséhez. Használja az API 3.1-es vagy újabb verzióját."
A Transcriptions_Create műveletben a következő három tulajdonság van hozzáadva:
- A
displayFormWordLevelTimestampsEnabled
tulajdonság lehetővé teszi a szószintű időbélyegek jelentését az átírási eredmények megjelenítési formájában. Az eredmények azdisplayWords
átiratfájl tulajdonságában jelennek meg. - A
diarization
tulajdonság segítségével megadható az opcionális diarizálás (hangszóróleválasztás) során létrehozandó hangszórócímkék minimális és maximális száma. Ezzel a funkcióval a szolgáltatás mostantól több hangszóróhoz is képes előadói címkéket létrehozni. A tulajdonság használatához a tulajdonságottrue
is be kell állítaniadiarizationEnabled
. A v3.1 API-val növeltük a v3.0 API által támogatott két hangszóróból történő diarizálással azonosítható hangszórók számát. A jobb teljesítmény érdekében ajánlott 30 alatt tartani a hangszórók számát. - A
languageIdentification
tulajdonság az átírás előtt megadhatja a bemenet nyelvazonosítási beállításait. A nyelvazonosításhoz legfeljebb 10 jelölt területi beállítás támogatott. A visszaadott átirat egy újlocale
tulajdonságot tartalmaz a felismert nyelvhez vagy a megadott területi beállításhoz.
A filter
tulajdonság hozzáadódik a Transcriptions_List, Transcriptions_ListFiles és Projects_ListTranscriptions műveletekhez. A filter
kifejezés a rendelkezésre álló erőforrások egy részhalmazának kiválasztására használható. Szűrhet displayName
, description
, createdDateTime
, lastActionDateTime
, status
és locale
. Például: filter=createdDateTime gt 2022-02-01T11:00:00Z
Ha a webhook használatával kap értesítéseket az átírás állapotáról, vegye figyelembe, hogy a V3.0 API-val létrehozott webhookok nem tudnak értesítéseket fogadni a V3.1 átírási kérelmekről. Új webhookvégpontot kell létrehoznia a V3.1 API-val, hogy értesítéseket kapjon a V3.1 átírási kérelmekről.
Egyéni beszéd
Adathalmazok
A következő műveletek jelennek meg egy adathalmaz több adatblokkjának feltöltéséhez és kezeléséhez:
- Datasets_UploadBlock – Adatblokk feltöltése az adathalmazhoz. A blokk maximális mérete 8MiB.
- Datasets_GetBlocks – Az adatkészlethez feltöltött blokkok listájának lekérése.
- Datasets_CommitBlocks – Tiltólista véglegesítése az adathalmaz feltöltésének befejezéséhez.
A markdown-adatok strukturált szöveggel történő modelladaptálásának támogatása érdekében a Datasets_Create művelet mostantól támogatja a LanguageMarkdown adattípust. További információ: adathalmazok feltöltése.
Modellek
A Models_ListBaseModels és Models_GetBaseModel műveletek információkat adnak vissza az egyes alapmodellek által támogatott alkalmazkodás típusáról.
"features": {
"supportsAdaptationsWith": [
"Acoustic",
"Language",
"LanguageMarkdown",
"Pronunciation"
]
}
A Models_Create művelet új customModelWeightPercent
tulajdonsággal rendelkezik, ahol megadhatja az egyéni nyelvi modell (egyszerű vagy strukturált szöveges adatokból betanított) és az alapnyelvi modell kombinálásakor használt súlyt. Az érvényes értékek 1 és 100 közötti egész számok. Az alapértelmezett érték jelenleg 30.
A filter
tulajdonság a következő műveletekhez lesz hozzáadva:
- Datasets_List
- Datasets_ListFiles
- Endpoints_List
- Evaluations_List
- Evaluations_ListFiles
- Models_ListBaseModels
- Models_ListCustomModels
- Projects_List
- Projects_ListDatasets
- Projects_ListEndpoints
- Projects_ListEvaluations
- Projects_ListModels
A filter
kifejezés a rendelkezésre álló erőforrások egy részhalmazának kiválasztására használható. Szűrhet displayName
, description
, createdDateTime
, lastActionDateTime
, status
, locale
és kind
. Például: filter=locale eq 'en-US'
Hozzáadta a Models_ListFiles műveletet a megadott azonosító által azonosított modell fájljainak lekéréséhez.
Hozzáadta a Models_GetFile műveletet egy adott (fileId azonosítóval azonosított) fájl lekéréséhez egy modellből (azonosítóval azonosítva). Ez lehetővé teszi egy ModelReport-fájl lekérését, amely információkat nyújt a betanítás során feldolgozott adatokról.
Műveleti azonosítók
Frissítenie kell a kód alap elérési útját a kezdőpontról /speechtotext/v3.0
a következőre /speechtotext/v3.1
: . Ha például alapmodelleket szeretne lekérni a eastus
régióban, használja https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base
ahelyett https://eastus.api.cognitive.microsoft.com/speechtotext/v3.0/models/base
, hogy a .
A 3.1-es verzió mindegyikének operationId
neve az objektum nevével van előtagban. A "Modell létrehozása" kifejezés például a operationId
3.0-s verzióban a CreateModel-ről Models_Create a 3.1-es verzióban.
A /models/{id}/copyto
3.0-s verzióban lévő műveletet (beleértve a "/"-t) a 3.1-es verzióban lévő /models/{id}:copyto
művelet váltja fel (beleértve a ":"-t is).
A /webhooks/{id}/ping
3.0-s verzióban lévő műveletet (beleértve a "/"-t) a 3.1-es verzióban lévő /webhooks/{id}:ping
művelet váltja fel (beleértve a ":"-t is).
A /webhooks/{id}/test
3.0-s verzióban lévő műveletet (beleértve a "/"-t) a 3.1-es verzióban lévő /webhooks/{id}:test
művelet váltja fel (beleértve a ":"-t is).