Delen via


Code migreren van v3.1 naar v3.2 van de REST API

De REST API voor spraak-naar-tekst wordt gebruikt voor batchtranscriptie en aangepaste spraak. In dit artikel worden wijzigingen van versie 3.1 in 3.2 beschreven.

Belangrijk

Rest API v3.2 voor spraak-naar-tekst is beschikbaar in de preview-versie. Spraak-naar-tekst REST API v3.1 is algemeen beschikbaar. Spraak-naar-tekst-REST API v3.0 wordt op 1 april 2026 buiten gebruik gesteld. Zie de migratiehandleidingen spraak-naar-tekst-REST API v3.0 naar v3.1 en v3.1 naar v3.2 voor meer informatie.

Basispad

U moet het basispad in uw code bijwerken van /speechtotext/v3.1 naar /speechtotext/v3.2-preview.2. Als u bijvoorbeeld basismodellen in de eastus regio wilt ophalen, gebruikt https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/models/base u in plaats van https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base.

Zie bewerkings-id's verderop in deze handleiding voor meer informatie.

Batchtranscriptie

Belangrijk

Nieuwe prijzen zijn van kracht voor batchtranscriptie via Spraak naar tekst REST API v3.2. Zie de prijshandleiding voor meer informatie.

Beperkingen voor compatibiliteit met eerdere versies

Gebruik Spraak niet voor tekst van REST API v3.0 of v3.1 om een transcriptie op te halen die is gemaakt via Spraak naar tekst REST API v3.2. Mogelijk ziet u een foutbericht zoals: 'De API-versie kan niet worden gebruikt voor toegang tot deze transcriptie. API-versie v3.2 of hoger gebruiken.

Taalidentificatiemodus

De LanguageIdentificationMode wordt toegevoegd aan LanguageIdentificationProperties als hetzelfde niveau van candidateLocales en speechModelMapping. De modi die beschikbaar zijn voor taalidentificatie zijn Continuous of Single. Continue taalidentificatie is de standaardinstelling. Zie Taalidentificatie voor meer informatie.

Fluistermodellen

Azure AI Speech ondersteunt nu het Fluistermodel van OpenAI via Spraak naar tekst REST API v3.2. Raadpleeg de handleiding Een batchtranscriptie maken voor meer informatie.

Notitie

Azure OpenAI Service biedt ook ondersteuning voor het Fluistermodel van OpenAI voor spraak-naar-tekst met een synchrone REST API. Bekijk de quickstart voor meer informatie. Bekijk wat is het Fluistermodel? voor meer informatie over wanneer u Azure AI Speech versus Azure OpenAI Service gebruikt.

Aangepaste spraak

Belangrijk

Er worden kosten in rekening gebracht voor het trainen van aangepaste spraakmodellen als het basismodel is gemaakt op 1 oktober 2023 en hoger. Er worden geen kosten in rekening gebracht voor training als het basismodel vóór oktober 2023 is gemaakt. Zie prijzen voor Azure AI Speech voor meer informatie.

Als u programmatisch wilt bepalen of een model vóór of na 1 oktober 2023 is gemaakt, gebruikt u de chargedForAdaptation eigenschap die nieuw is in versie 3.2.

Aangepaste weergavetekstopmaak

Ter ondersteuning van modelaanpassing met aangepaste weergavetekstopmaakgegevens ondersteunt de Datasets_Create bewerking het gegevenstype OutputFormatting . Zie gegevenssets uploaden voor meer informatie.

Er is een definitie toegevoegd voor OutputFormatType met Lexical en Display opsommingswaarden.

"OutputFormatType": {
    "title": "OutputFormatType",
    "enum": [
        "Lexical",
        "Display"
    ],
    "type": "string",
    "x-ms-enum": {
        "name": "OutputFormatType",
        "modelAsString": true,
        "values": [
            {
                "value": "Lexical",
                "description": "Model provides the transcription output without formatting."
            },
            {
                "value": "Display",
                "description": "Model supports display formatting transcriptions output or endpoints."
            }
        ]
    }
},

De OutputFormattingData enumwaarde wordt toegevoegd aan FileKind (type invoergegevens).

De supportedOutputFormat eigenschap wordt toegevoegd aan BaseModelFeatures. Deze eigenschap bevindt zich binnen de BaseModel definitie.

"BaseModelFeatures": {
    "title": "BaseModelFeatures",
    "description": "Features supported by the model.",
    "type": "object",
    "allOf": [
        {
            "$ref": "#/definitions/SharedModelFeatures"
        }
    ],
    "properties": {
        "supportsAdaptationsWith": {
            "description": "Supported dataset kinds to adapt the model.",
            "type": "array",
            "items": {
                "$ref": "#/definitions/DatasetKind"
            },
            "readOnly": true
        },
        "supportedOutputFormat": {
            "description": "Supported output formats.",
            "type": "array",
            "items": {
                "$ref": "#/definitions/OutputFormatType"
            },
            "readOnly": true
        }
    }
},

Kosten voor aanpassing

De chargeForAdaptation eigenschap wordt toegevoegd aan BaseModelProperties. Deze eigenschap bevindt zich binnen de BaseModel definitie.

Belangrijk

Er worden kosten in rekening gebracht voor het trainen van aangepaste spraakmodellen als het basismodel is gemaakt op 1 oktober 2023 en hoger. Er worden geen kosten in rekening gebracht voor training als het basismodel vóór oktober 2023 is gemaakt. Zie prijzen voor Azure AI Speech voor meer informatie.

Als de waarde istrue, worden er kosten in rekening gebracht voor het trainen van chargeForAdaptation het model. Als de waarde is false, worden er kosten in rekening gebracht voor het trainen van het model. Gebruik de chargeForAdaptation eigenschap in plaats van de gemaakte datum om programmatisch te bepalen of er kosten in rekening worden gebracht voor het trainen van een model.

"BaseModelProperties": {
    "title": "BaseModelProperties",
    "type": "object",
    "properties": {
        "deprecationDates": {
            "$ref": "#/definitions/BaseModelDeprecationDates"
        },
        "features": {
            "$ref": "#/definitions/BaseModelFeatures"
        },
        "chargeForAdaptation": {
            "description": "A value indicating whether model adaptation is charged.",
            "type": "boolean",
            "readOnly": true
        }
    }
},

Tekstnormalisatie

De textNormalizationKind eigenschap wordt toegevoegd aan DatasetProperties.

Entiteitsdefinitie voor TextNormalizationKind: het soort tekstnormalisatie.

  • Standaard: standaardtekstnormalisatie (bijvoorbeeld 'twee tot drie' vervangt '2 tot 3' in en-US).
  • Geen: Er wordt geen tekstnormalisatie toegepast op de invoertekst. Deze waarde is een onderdrukkingsoptie die alleen moet worden gebruikt wanneer tekst vóór de upload wordt genormaliseerd.

Evaluatie-eigenschappen

Eigenschappen van tokenaantal en tokenfout toegevoegd aan de EvaluationProperties eigenschappen:

  • correctTokenCount1: het aantal correct herkende tokens door model1.
  • tokenCount1: het aantal verwerkte tokens per model1.
  • tokenDeletionCount1: Het aantal herkende tokens per model1 dat verwijderingen zijn.
  • tokenErrorRate1: Het tokenfoutpercentage van herkenning met model1.
  • tokenInsertionCount1: Het aantal herkende tokens door model1 dat invoegingen zijn.
  • tokenSubstitutionCount1: Het aantal herkende woorden door model1 dat vervangingen zijn.
  • correctTokenCount2: Het aantal correct herkende tokens door model2.
  • tokenCount2: Het aantal verwerkte tokens per model2.
  • tokenDeletionCount2: Het aantal herkende tokens door model2 dat verwijderingen zijn.
  • tokenErrorRate2: Het tokenfoutpercentage van herkenning met model2.
  • tokenInsertionCount2: Het aantal herkende tokens per model2 dat invoegingen zijn.
  • tokenSubstitutionCount2: Het aantal herkende woorden door model2 dat vervangingen zijn.

Modelkopie

De volgende wijzigingen zijn voor het scenario waarin u een model kopieert.

  • De nieuwe Models_Copy-bewerking toegevoegd. Dit is het schema in de nieuwe kopieerbewerking: "$ref": "#/definitions/ModelCopyAuthorization"
  • De Models_CopyTo-bewerking is afgeschaft. Dit is het schema in de afgeschafte kopieerbewerking: "$ref": "#/definitions/ModelCopy"
  • De nieuwe Models_AuthorizeCopy-bewerking toegevoegd die wordt geretourneerd "$ref": "#/definitions/ModelCopyAuthorization". Deze geretourneerde entiteit kan worden gebruikt in de nieuwe Models_Copy bewerking.

Er is een nieuwe entiteitsdefinitie toegevoegd voor ModelCopyAuthorization:

"ModelCopyAuthorization": {
    "title": "ModelCopyAuthorization",
    "required": [
        "expirationDateTime",
        "id",
        "sourceResourceId",
        "targetResourceEndpoint",
        "targetResourceId",
        "targetResourceRegion"
    ],
    "type": "object",
    "properties": {
        "targetResourceRegion": {
            "description": "The region (aka location) of the target speech resource (e.g., westus2).",
            "minLength": 1,
            "type": "string"
        },
        "targetResourceId": {
            "description": "The Azure Resource ID of the target speech resource.",
            "minLength": 1,
            "type": "string"
        },
        "targetResourceEndpoint": {
            "description": "The endpoint (base url) of the target resource (with custom domain name when it is used).",
            "minLength": 1,
            "type": "string"
        },
        "sourceResourceId": {
            "description": "The Azure Resource ID of the source speech resource.",
            "minLength": 1,
            "type": "string"
        },
        "expirationDateTime": {
            "format": "date-time",
            "description": "The expiration date of this copy authorization.",
            "type": "string"
        },
        "id": {
            "description": "The ID of this copy authorization.",
            "minLength": 1,
            "type": "string"
        }
    }
},

Er is een nieuwe entiteitsdefinitie toegevoegd voor ModelCopyAuthorizationDefinition:

"ModelCopyAuthorizationDefinition": {
    "title": "ModelCopyAuthorizationDefinition",
    "required": [
        "sourceResourceId"
    ],
    "type": "object",
    "properties": {
        "sourceResourceId": {
            "description": "The Azure Resource ID of the source speech resource.",
            "minLength": 1,
            "type": "string"
        }
    }
},

Er is een nieuwe copy eigenschap toegevoegd.

  • copyTo URI: De locatie van de verouderde actie voor het kopiëren van modellen. Zie de bewerking Models_CopyTo voor meer informatie.
  • copy URI: De locatie van de actie voor het kopiëren van het model. Zie de Models_Copy-bewerking voor meer informatie.
"CustomModelLinks": {
    "title": "CustomModelLinks",
    "type": "object",
    "properties": {
      "copyTo": {
        "format": "uri",
        "description": "The location to the obsolete model copy action. See operation \"Models_CopyTo\" for more details.",
        "type": "string",
        "readOnly": true
      },
      "copy": {
        "format": "uri",
        "description": "The location to the model copy action. See operation \"Models_Copy\" for more details.",
        "type": "string",
        "readOnly": true
      },
      "files": {
        "format": "uri",
        "description": "The location to get all files of this entity. See operation \"Models_ListFiles\" for more details.",
        "type": "string",
        "readOnly": true
      },
      "manifest": {
        "format": "uri",
        "description": "The location to get a manifest for this model to be used in the on-prem container. See operation \"Models_GetCustomModelManifest\" for more details.",
        "type": "string",
        "readOnly": true
      }
    },
    "readOnly": true
},

Bewerkings-id's

U moet het basispad in uw code bijwerken van /speechtotext/v3.1 naar /speechtotext/v3.2-preview.2. Als u bijvoorbeeld basismodellen in de eastus regio wilt ophalen, gebruikt https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2-preview.2/models/base u in plaats van https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base.

Volgende stappen