Share via


Kód áttelepítése a REST API 3.1-es verziójáról a 3.2-es verzióra

A Speech to text REST API a Batch átírásához és az egyéni beszédhez használatos. Ez a cikk a 3.1-es és a 3.2-es verzió közötti változásokat ismerteti.

Fontos

A Speech to text REST API v3.2 előzetes verzióban érhető el. Általánosan elérhető a Beszéd a szöveghez REST API 3.1-es verzió. A speech to text REST API 3.0 2026. április 1-jén megszűnik. További információ: Speech to text REST API v3.0–v3.1 és v3.1–v3.2 migrálási útmutatók.

Alap elérési út

Frissítenie kell a kód alap elérési útját a kezdőpontról /speechtotext/v3.1 a következőre /speechtotext/v3.2-preview.2: . Ha például alapmodelleket szeretne lekérni a eastus régióban, használja https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/models/base ahelyett https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base, hogy a .

További információkért lásd az útmutató későbbi, műveleti azonosítóit .

Kötegelt átírás

Fontos

Az új díjszabás a Speech to text REST API 3.2-es verzióval történő kötegelt átírására érvényes. További információkért tekintse meg a díjszabási útmutatót.

Visszamenőleges kompatibilitási korlátozások

Ne használja a Speechet a REST API 3.0-s vagy 3.1-es verziójának szöveggé alakításához a Speech to text REST API 3.2-es verziójával létrehozott átirat lekéréséhez. Előfordulhat, hogy egy hibaüzenet jelenik meg, például: "Az API-verzió nem használható az átirat eléréséhez. Az API 3.2-es vagy újabb verziójának használata."

Nyelvazonosítási mód

A LanguageIdentificationMode hozzá van adva, LanguageIdentificationProperties mint testvére candidateLocales és speechModelMapping. A nyelvi azonosításhoz rendelkezésre álló módok a következők Continuous : vagy Single. A folyamatos nyelvazonosítás az alapértelmezett. További információ: Nyelvazonosítás.

Suttogó modellek

Az Azure AI Speech mostantól támogatja az OpenAI Whisper modelljét a Speech to text REST API 3.2-es verzióval. További információért tekintse meg a Köteg átírási útmutatót.

Feljegyzés

Az Azure OpenAI szolgáltatás támogatja az OpenAI Suttogó modelljét is a szöveghez való beszédhez szinkron REST API-val. További információért tekintse meg a rövid útmutatót. További információ az Azure AI Speech és az Azure OpenAI szolgáltatás használatáról: Mi a Whisper-modell?

Egyéni beszéd

Fontos

Ha az alapmodell 2023. október 1-jén és később lett létrehozva, az egyéni beszédmodell betanításáért díjat számítunk fel. A betanításért nem kell fizetnie, ha az alapmodell 2023 októbere előtt lett létrehozva. További információkért tekintse meg az Azure AI Speech díjszabását.

Ha programozott módon szeretné meghatározni, hogy 2023. október 1. előtt vagy után hoztak-e létre modellt, használja a chargedForAdaptation 3.2-es verzióban új tulajdonságot.

Egyéni megjelenítési szövegformázás

Ha egyéni megjelenítési szövegformázási adatokkal szeretné támogatni a modelladaptálást, a Datasets_Create művelet támogatja az OutputFormatting adattípust. További információ: adathalmazok feltöltése.

Hozzáadott egy definíciót a következőhöz OutputFormatType : with Lexical and Display enum values.

"OutputFormatType": {
    "title": "OutputFormatType",
    "enum": [
        "Lexical",
        "Display"
    ],
    "type": "string",
    "x-ms-enum": {
        "name": "OutputFormatType",
        "modelAsString": true,
        "values": [
            {
                "value": "Lexical",
                "description": "Model provides the transcription output without formatting."
            },
            {
                "value": "Display",
                "description": "Model supports display formatting transcriptions output or endpoints."
            }
        ]
    }
},

A OutputFormattingData rendszer hozzáadja FileKind az enumerálási értéket (bemeneti adatok típusa).

A supportedOutputFormat tulajdonság hozzá lesz adva a .BaseModelFeatures Ez a tulajdonság a definíción BaseModel belül található.

"BaseModelFeatures": {
    "title": "BaseModelFeatures",
    "description": "Features supported by the model.",
    "type": "object",
    "allOf": [
        {
            "$ref": "#/definitions/SharedModelFeatures"
        }
    ],
    "properties": {
        "supportsAdaptationsWith": {
            "description": "Supported dataset kinds to adapt the model.",
            "type": "array",
            "items": {
                "$ref": "#/definitions/DatasetKind"
            },
            "readOnly": true
        },
        "supportedOutputFormat": {
            "description": "Supported output formats.",
            "type": "array",
            "items": {
                "$ref": "#/definitions/OutputFormatType"
            },
            "readOnly": true
        }
    }
},

Az alkalmazkodás díja

A chargeForAdaptation tulajdonság hozzá lesz adva a .BaseModelProperties Ez a tulajdonság a definíción BaseModel belül található.

Fontos

Ha az alapmodell 2023. október 1-jén és később lett létrehozva, az egyéni beszédmodell betanításáért díjat számítunk fel. A betanításért nem kell fizetnie, ha az alapmodell 2023 októbere előtt lett létrehozva. További információkért tekintse meg az Azure AI Speech díjszabását.

Ha az érték chargeForAdaptation az true, a modell betanításáért díjat számítunk fel. Ha az érték az false, a modell betanításáért díjat számítunk fel. A létrehozott dátum helyett használja a chargeForAdaptation tulajdonságot annak programozott meghatározásához, hogy a modell betanításáért díjat számít-e fel.

"BaseModelProperties": {
    "title": "BaseModelProperties",
    "type": "object",
    "properties": {
        "deprecationDates": {
            "$ref": "#/definitions/BaseModelDeprecationDates"
        },
        "features": {
            "$ref": "#/definitions/BaseModelFeatures"
        },
        "chargeForAdaptation": {
            "description": "A value indicating whether model adaptation is charged.",
            "type": "boolean",
            "readOnly": true
        }
    }
},

Szöveg normalizálása

A textNormalizationKind tulajdonság hozzá lesz adva a .DatasetProperties

TextNormalizationKind entitásdefiníciója: A szöveg normalizálásának típusa.

  • Alapértelmezett: Alapértelmezett szöveg normalizálása (például az en-US -ben a "2–3" helyére a "kettő–három" szöveg lép).
  • Nincs: A szöveg normalizálása nincs alkalmazva a bemeneti szövegre. Ez az érték egy felülbírálási beállítás, amelyet csak akkor érdemes használni, ha a feltöltés előtt normalizálja a szöveget.

Kiértékelési tulajdonságok

Jogkivonatok száma és jogkivonat hibatulajdonságai hozzáadva a EvaluationProperties tulajdonságokhoz:

  • correctTokenCount1: A helyesen felismert jogkivonatok száma modell1 szerint.
  • tokenCount1: A feldolgozott jogkivonatok száma modell1 szerint.
  • tokenDeletionCount1: A törölt 1. modell által felismert jogkivonatok száma.
  • tokenErrorRate1: A jogkivonat hibaaránya a modell1 esetében.
  • tokenInsertionCount1: A modell1 által felismert tokenek száma, amelyek beszúrások.
  • tokenSubstitutionCount1: Az 1. modell által felismert szavak száma, amelyek helyettesítések.
  • correctTokenCount2: A helyesen felismert jogkivonatok száma modell szerint2.
  • tokenCount2: A feldolgozott jogkivonatok száma modell szerint2.
  • tokenDeletionCount2: A 2. modell által felismert jogkivonatok száma, amelyek törlések.
  • tokenErrorRate2: A felismerés tokenhibáinak aránya a model2-vel.
  • tokenInsertionCount2: A 2. modell által felismert tokenek száma, amelyek beszúrások.
  • tokenSubstitutionCount2: A 2. modell által felismert szavak száma, amelyek helyettesítések.

Modell másolása

A következő módosítások a modell másolásának forgatókönyvét ismertetik.

  • Hozzáadta az új Models_Copy műveletet. Az új másolási művelet sémája a következő: "$ref": "#/definitions/ModelCopyAuthorization"
  • A Models_CopyTo művelet elavult. Az elavult másolási művelet sémája a következő: "$ref": "#/definitions/ModelCopy"
  • Hozzáadta a visszaadott "$ref": "#/definitions/ModelCopyAuthorization"új Models_AuthorizeCopy műveletet. Ez a visszaadott entitás használható az új Models_Copy műveletben.

Új entitásdefiníciót adott hozzá a következőhöz ModelCopyAuthorization:

"ModelCopyAuthorization": {
    "title": "ModelCopyAuthorization",
    "required": [
        "expirationDateTime",
        "id",
        "sourceResourceId",
        "targetResourceEndpoint",
        "targetResourceId",
        "targetResourceRegion"
    ],
    "type": "object",
    "properties": {
        "targetResourceRegion": {
            "description": "The region (aka location) of the target speech resource (e.g., westus2).",
            "minLength": 1,
            "type": "string"
        },
        "targetResourceId": {
            "description": "The Azure Resource ID of the target speech resource.",
            "minLength": 1,
            "type": "string"
        },
        "targetResourceEndpoint": {
            "description": "The endpoint (base url) of the target resource (with custom domain name when it is used).",
            "minLength": 1,
            "type": "string"
        },
        "sourceResourceId": {
            "description": "The Azure Resource ID of the source speech resource.",
            "minLength": 1,
            "type": "string"
        },
        "expirationDateTime": {
            "format": "date-time",
            "description": "The expiration date of this copy authorization.",
            "type": "string"
        },
        "id": {
            "description": "The ID of this copy authorization.",
            "minLength": 1,
            "type": "string"
        }
    }
},

Új entitásdefiníciót adott hozzá a következőhöz ModelCopyAuthorizationDefinition:

"ModelCopyAuthorizationDefinition": {
    "title": "ModelCopyAuthorizationDefinition",
    "required": [
        "sourceResourceId"
    ],
    "type": "object",
    "properties": {
        "sourceResourceId": {
            "description": "The Azure Resource ID of the source speech resource.",
            "minLength": 1,
            "type": "string"
        }
    }
},

Új tulajdonságot adott copy hozzá.

  • copyTo URI: Az elavult modell másolási műveletének helye. További részletekért tekintse meg a Models_CopyTo műveletet.
  • copy URI: A modell másolási műveletének helye. További részletekért tekintse meg a Models_Copy műveletet.
"CustomModelLinks": {
    "title": "CustomModelLinks",
    "type": "object",
    "properties": {
      "copyTo": {
        "format": "uri",
        "description": "The location to the obsolete model copy action. See operation \"Models_CopyTo\" for more details.",
        "type": "string",
        "readOnly": true
      },
      "copy": {
        "format": "uri",
        "description": "The location to the model copy action. See operation \"Models_Copy\" for more details.",
        "type": "string",
        "readOnly": true
      },
      "files": {
        "format": "uri",
        "description": "The location to get all files of this entity. See operation \"Models_ListFiles\" for more details.",
        "type": "string",
        "readOnly": true
      },
      "manifest": {
        "format": "uri",
        "description": "The location to get a manifest for this model to be used in the on-prem container. See operation \"Models_GetCustomModelManifest\" for more details.",
        "type": "string",
        "readOnly": true
      }
    },
    "readOnly": true
},

Műveleti azonosítók

Frissítenie kell a kód alap elérési útját a kezdőpontról /speechtotext/v3.1 a következőre /speechtotext/v3.2-preview.2: . Ha például alapmodelleket szeretne lekérni a eastus régióban, használja https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/models/base ahelyett https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base, hogy a .

Következő lépések