Kód áttelepítése a REST API 3.1-es verziójáról a 3.2-es verzióra
A Speech to text REST API a Batch átírásához és az egyéni beszédhez használatos. Ez a cikk a 3.1-es és a 3.2-es verzió közötti változásokat ismerteti.
Fontos
A Speech to text REST API v3.2 előzetes verzióban érhető el. Általánosan elérhető a Beszéd a szöveghez REST API 3.1-es verzió. A speech to text REST API 3.0 2026. április 1-jén megszűnik. További információ: Speech to text REST API v3.0–v3.1 és v3.1–v3.2 migrálási útmutatók.
Alap elérési út
Frissítenie kell a kód alap elérési útját a kezdőpontról /speechtotext/v3.1
a következőre /speechtotext/v3.2-preview.2
: . Ha például alapmodelleket szeretne lekérni a eastus
régióban, használja https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/models/base
ahelyett https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base
, hogy a .
További információkért lásd az útmutató későbbi, műveleti azonosítóit .
Kötegelt átírás
Fontos
Az új díjszabás a Speech to text REST API 3.2-es verzióval történő kötegelt átírására érvényes. További információkért tekintse meg a díjszabási útmutatót.
Visszamenőleges kompatibilitási korlátozások
Ne használja a Speechet a REST API 3.0-s vagy 3.1-es verziójának szöveggé alakításához a Speech to text REST API 3.2-es verziójával létrehozott átirat lekéréséhez. Előfordulhat, hogy egy hibaüzenet jelenik meg, például: "Az API-verzió nem használható az átirat eléréséhez. Az API 3.2-es vagy újabb verziójának használata."
Nyelvazonosítási mód
A LanguageIdentificationMode
hozzá van adva, LanguageIdentificationProperties
mint testvére candidateLocales
és speechModelMapping
. A nyelvi azonosításhoz rendelkezésre álló módok a következők Continuous
: vagy Single
. A folyamatos nyelvazonosítás az alapértelmezett. További információ: Nyelvazonosítás.
Suttogó modellek
Az Azure AI Speech mostantól támogatja az OpenAI Whisper modelljét a Speech to text REST API 3.2-es verzióval. További információért tekintse meg a Köteg átírási útmutatót.
Feljegyzés
Az Azure OpenAI szolgáltatás támogatja az OpenAI Suttogó modelljét is a szöveghez való beszédhez szinkron REST API-val. További információért tekintse meg a rövid útmutatót. További információ az Azure AI Speech és az Azure OpenAI szolgáltatás használatáról: Mi a Whisper-modell?
Egyéni beszéd
Fontos
Ha az alapmodell 2023. október 1-jén és később lett létrehozva, az egyéni beszédmodell betanításáért díjat számítunk fel. A betanításért nem kell fizetnie, ha az alapmodell 2023 októbere előtt lett létrehozva. További információkért tekintse meg az Azure AI Speech díjszabását.
Ha programozott módon szeretné meghatározni, hogy 2023. október 1. előtt vagy után hoztak-e létre modellt, használja a chargedForAdaptation
3.2-es verzióban új tulajdonságot.
Egyéni megjelenítési szövegformázás
Ha egyéni megjelenítési szövegformázási adatokkal szeretné támogatni a modelladaptálást, a Datasets_Create művelet támogatja az OutputFormatting adattípust. További információ: adathalmazok feltöltése.
Hozzáadott egy definíciót a következőhöz OutputFormatType
: with Lexical
and Display
enum values.
"OutputFormatType": {
"title": "OutputFormatType",
"enum": [
"Lexical",
"Display"
],
"type": "string",
"x-ms-enum": {
"name": "OutputFormatType",
"modelAsString": true,
"values": [
{
"value": "Lexical",
"description": "Model provides the transcription output without formatting."
},
{
"value": "Display",
"description": "Model supports display formatting transcriptions output or endpoints."
}
]
}
},
A OutputFormattingData
rendszer hozzáadja FileKind
az enumerálási értéket (bemeneti adatok típusa).
A supportedOutputFormat
tulajdonság hozzá lesz adva a .BaseModelFeatures
Ez a tulajdonság a definíción BaseModel
belül található.
"BaseModelFeatures": {
"title": "BaseModelFeatures",
"description": "Features supported by the model.",
"type": "object",
"allOf": [
{
"$ref": "#/definitions/SharedModelFeatures"
}
],
"properties": {
"supportsAdaptationsWith": {
"description": "Supported dataset kinds to adapt the model.",
"type": "array",
"items": {
"$ref": "#/definitions/DatasetKind"
},
"readOnly": true
},
"supportedOutputFormat": {
"description": "Supported output formats.",
"type": "array",
"items": {
"$ref": "#/definitions/OutputFormatType"
},
"readOnly": true
}
}
},
Az alkalmazkodás díja
A chargeForAdaptation
tulajdonság hozzá lesz adva a .BaseModelProperties
Ez a tulajdonság a definíción BaseModel
belül található.
Fontos
Ha az alapmodell 2023. október 1-jén és később lett létrehozva, az egyéni beszédmodell betanításáért díjat számítunk fel. A betanításért nem kell fizetnie, ha az alapmodell 2023 októbere előtt lett létrehozva. További információkért tekintse meg az Azure AI Speech díjszabását.
Ha az érték chargeForAdaptation
az true
, a modell betanításáért díjat számítunk fel. Ha az érték az false
, a modell betanításáért díjat számítunk fel. A létrehozott dátum helyett használja a chargeForAdaptation
tulajdonságot annak programozott meghatározásához, hogy a modell betanításáért díjat számít-e fel.
"BaseModelProperties": {
"title": "BaseModelProperties",
"type": "object",
"properties": {
"deprecationDates": {
"$ref": "#/definitions/BaseModelDeprecationDates"
},
"features": {
"$ref": "#/definitions/BaseModelFeatures"
},
"chargeForAdaptation": {
"description": "A value indicating whether model adaptation is charged.",
"type": "boolean",
"readOnly": true
}
}
},
Szöveg normalizálása
A textNormalizationKind
tulajdonság hozzá lesz adva a .DatasetProperties
TextNormalizationKind entitásdefiníciója: A szöveg normalizálásának típusa.
- Alapértelmezett: Alapértelmezett szöveg normalizálása (például az en-US -ben a "2–3" helyére a "kettő–három" szöveg lép).
- Nincs: A szöveg normalizálása nincs alkalmazva a bemeneti szövegre. Ez az érték egy felülbírálási beállítás, amelyet csak akkor érdemes használni, ha a feltöltés előtt normalizálja a szöveget.
Kiértékelési tulajdonságok
Jogkivonatok száma és jogkivonat hibatulajdonságai hozzáadva a EvaluationProperties
tulajdonságokhoz:
correctTokenCount1
: A helyesen felismert jogkivonatok száma modell1 szerint.tokenCount1
: A feldolgozott jogkivonatok száma modell1 szerint.tokenDeletionCount1
: A törölt 1. modell által felismert jogkivonatok száma.tokenErrorRate1
: A jogkivonat hibaaránya a modell1 esetében.tokenInsertionCount1
: A modell1 által felismert tokenek száma, amelyek beszúrások.tokenSubstitutionCount1
: Az 1. modell által felismert szavak száma, amelyek helyettesítések.correctTokenCount2
: A helyesen felismert jogkivonatok száma modell szerint2.tokenCount2
: A feldolgozott jogkivonatok száma modell szerint2.tokenDeletionCount2
: A 2. modell által felismert jogkivonatok száma, amelyek törlések.tokenErrorRate2
: A felismerés tokenhibáinak aránya a model2-vel.tokenInsertionCount2
: A 2. modell által felismert tokenek száma, amelyek beszúrások.tokenSubstitutionCount2
: A 2. modell által felismert szavak száma, amelyek helyettesítések.
Modell másolása
A következő módosítások a modell másolásának forgatókönyvét ismertetik.
- Hozzáadta az új Models_Copy műveletet. Az új másolási művelet sémája a következő:
"$ref": "#/definitions/ModelCopyAuthorization"
- A Models_CopyTo művelet elavult. Az elavult másolási művelet sémája a következő:
"$ref": "#/definitions/ModelCopy"
- Hozzáadta a visszaadott
"$ref": "#/definitions/ModelCopyAuthorization"
új Models_AuthorizeCopy műveletet. Ez a visszaadott entitás használható az új Models_Copy műveletben.
Új entitásdefiníciót adott hozzá a következőhöz ModelCopyAuthorization
:
"ModelCopyAuthorization": {
"title": "ModelCopyAuthorization",
"required": [
"expirationDateTime",
"id",
"sourceResourceId",
"targetResourceEndpoint",
"targetResourceId",
"targetResourceRegion"
],
"type": "object",
"properties": {
"targetResourceRegion": {
"description": "The region (aka location) of the target speech resource (e.g., westus2).",
"minLength": 1,
"type": "string"
},
"targetResourceId": {
"description": "The Azure Resource ID of the target speech resource.",
"minLength": 1,
"type": "string"
},
"targetResourceEndpoint": {
"description": "The endpoint (base url) of the target resource (with custom domain name when it is used).",
"minLength": 1,
"type": "string"
},
"sourceResourceId": {
"description": "The Azure Resource ID of the source speech resource.",
"minLength": 1,
"type": "string"
},
"expirationDateTime": {
"format": "date-time",
"description": "The expiration date of this copy authorization.",
"type": "string"
},
"id": {
"description": "The ID of this copy authorization.",
"minLength": 1,
"type": "string"
}
}
},
Új entitásdefiníciót adott hozzá a következőhöz ModelCopyAuthorizationDefinition
:
"ModelCopyAuthorizationDefinition": {
"title": "ModelCopyAuthorizationDefinition",
"required": [
"sourceResourceId"
],
"type": "object",
"properties": {
"sourceResourceId": {
"description": "The Azure Resource ID of the source speech resource.",
"minLength": 1,
"type": "string"
}
}
},
CustomModelLinks másolási tulajdonságai
Új tulajdonságot adott copy
hozzá.
copyTo
URI: Az elavult modell másolási műveletének helye. További részletekért tekintse meg a Models_CopyTo műveletet.copy
URI: A modell másolási műveletének helye. További részletekért tekintse meg a Models_Copy műveletet.
"CustomModelLinks": {
"title": "CustomModelLinks",
"type": "object",
"properties": {
"copyTo": {
"format": "uri",
"description": "The location to the obsolete model copy action. See operation \"Models_CopyTo\" for more details.",
"type": "string",
"readOnly": true
},
"copy": {
"format": "uri",
"description": "The location to the model copy action. See operation \"Models_Copy\" for more details.",
"type": "string",
"readOnly": true
},
"files": {
"format": "uri",
"description": "The location to get all files of this entity. See operation \"Models_ListFiles\" for more details.",
"type": "string",
"readOnly": true
},
"manifest": {
"format": "uri",
"description": "The location to get a manifest for this model to be used in the on-prem container. See operation \"Models_GetCustomModelManifest\" for more details.",
"type": "string",
"readOnly": true
}
},
"readOnly": true
},
Műveleti azonosítók
Frissítenie kell a kód alap elérési útját a kezdőpontról /speechtotext/v3.1
a következőre /speechtotext/v3.2-preview.2
: . Ha például alapmodelleket szeretne lekérni a eastus
régióban, használja https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/models/base
ahelyett https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base
, hogy a .