Aracılığıyla paylaş


Kodu v3.1'den REST API'nin v3.2'sine geçirme

Konuşmayı metne dönüştürme REST API'si Batch transkripsiyonu ve özel konuşma için kullanılır. Bu makalede 3.1 sürümünden 3.2 sürümüne yapılan değişiklikler açıklanmaktadır.

Önemli

Konuşmayı metne dönüştürme REST API v3.2, genel kullanıma sunulan en son sürümdür. Önizleme sürümleri 3.2-preview.1 ve 3.2-preview.2* Eylül 2024'te kaldırılacaktır. Metne konuşma REST API v3.1 duyurulacak bir tarihte kullanımdan kaldırılacaktır. Konuşmayı metne dönüştürme REST API v3.0, 1 Nisan 2026'da kullanımdan kaldırılacaktır.

Temel yol

Kodunuzdaki temel yolu olarak /speechtotext/v3.1 /speechtotext/v3.2güncelleştirmeniz gerekir. Örneğin, bölgedeki temel modelleri eastus almak için yerine https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/basekullanınhttps://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/base.

Daha fazla bilgi için bu kılavuzun devamında yer alan İşlem Kimlikleri bölümüne bakın.

Toplu transkripsiyon

Önemli

Konuşmadan metne REST API v3.2 aracılığıyla toplu transkripsiyon için yeni fiyatlandırma uygulanır. Daha fazla bilgi için fiyatlandırma kılavuzuna bakın.

Geriye dönük uyumluluk sınırlamaları

Konuşmayı metne dönüştürme REST API v3.2 aracılığıyla oluşturulan transkripsiyonu almak için REST API v3.0 veya v3.1'e metin eklemek için Konuşmayı kullanmayın. Şu hata iletisini görebilirsiniz: "API sürümü bu döküme erişmek için kullanılamaz. API sürümü v3.2 veya üzerini kullanın."

Dil tanımlama modu

LanguageIdentificationMode öğesine ile speechModelMappingeşdüzey candidateLocales olarak eklenirLanguageIdentificationProperties. Dil belirleme için kullanılabilen modlar veya SingleşeklindedirContinuous. Sürekli dil belirleme varsayılandır. Daha fazla bilgi için bkz . Dil belirleme.

Fısıltı modelleri

Azure AI Speech artık Konuşmayı metne dönüştürme REST API v3.2 aracılığıyla OpenAI'nin Fısıltı modelini destekliyor. Daha fazla bilgi edinmek için Toplu transkripsiyon oluşturma kılavuzuna göz atın.

Not

Azure OpenAI Hizmeti, zaman uyumlu REST API'siyle konuşmayı metne dönüştürmeye yönelik OpenAI Fısıltı modelini de destekler. Daha fazla bilgi edinmek için hızlı başlangıç bölümüne göz atın. Azure AI Konuşma ve Azure OpenAI Hizmeti'nin ne zaman kullanılacağı hakkında daha fazla bilgi edinmek için Fısıltı modeli nedir? konusuna göz atın.

Özel konuşma

Önemli

Temel model 1 Ekim 2023 ve sonrasında oluşturulduysa özel konuşma modeli eğitimi için ücretlendirilirsiniz. Temel model Ekim 2023'e kadar oluşturulduysa eğitim için ücret alınmaz. Daha fazla bilgi için bkz . Azure AI Konuşma fiyatlandırması.

Bir modelin 1 Ekim 2023'te önce mi yoksa sonra mı oluşturulduğunu program aracılığıyla belirlemek için sürüm 3.2'de yeni olan özelliği kullanınchargedForAdaptation.

Özel görüntüleme metni biçimlendirmesi

Özel görüntüleme metni biçimlendirme verileriyle model uyarlamasını desteklemek için Datasets_Create işlemi OutputFormatting veri türünü destekler. Daha fazla bilgi için bkz . Veri kümelerini karşıya yükleme.

ve Lexical Display sabit listesi değerleri için OutputFormatType bir tanım eklendi.

"OutputFormatType": {
    "title": "OutputFormatType",
    "enum": [
        "Lexical",
        "Display"
    ],
    "type": "string",
    "x-ms-enum": {
        "name": "OutputFormatType",
        "modelAsString": true,
        "values": [
            {
                "value": "Lexical",
                "description": "Model provides the transcription output without formatting."
            },
            {
                "value": "Display",
                "description": "Model supports display formatting transcriptions output or endpoints."
            }
        ]
    }
},

sabit OutputFormattingData listesi değeri öğesine FileKind eklenir (giriş verilerinin türü).

supportedOutputFormat özelliği öğesine BaseModelFeatureseklenir. Bu özellik tanımın BaseModel içindedir.

"BaseModelFeatures": {
    "title": "BaseModelFeatures",
    "description": "Features supported by the model.",
    "type": "object",
    "allOf": [
        {
            "$ref": "#/definitions/SharedModelFeatures"
        }
    ],
    "properties": {
        "supportsAdaptationsWith": {
            "description": "Supported dataset kinds to adapt the model.",
            "type": "array",
            "items": {
                "$ref": "#/definitions/DatasetKind"
            },
            "readOnly": true
        },
        "supportedOutputFormat": {
            "description": "Supported output formats.",
            "type": "array",
            "items": {
                "$ref": "#/definitions/OutputFormatType"
            },
            "readOnly": true
        }
    }
},

Uyarlama ücreti

chargeForAdaptation özelliği öğesine BaseModelPropertieseklenir. Bu özellik tanımın BaseModel içindedir.

Önemli

Temel model 1 Ekim 2023 ve sonrasında oluşturulduysa özel konuşma modeli eğitimi için ücretlendirilirsiniz. Temel model Ekim 2023'e kadar oluşturulduysa eğitim için ücret alınmaz. Daha fazla bilgi için bkz . Azure AI Konuşma fiyatlandırması.

değeri chargeForAdaptation ise true, modeli eğittiğiniz için ücretlendirilirsiniz. Değer ise falsemodeli eğittiğiniz için ücretlendirilirsiniz. chargeForAdaptation Bir modeli eğitmek için ücretlendirilip ücretlendirilmediğinizi program aracılığıyla belirlemek için oluşturma tarihi yerine özelliğini kullanın.

"BaseModelProperties": {
    "title": "BaseModelProperties",
    "type": "object",
    "properties": {
        "deprecationDates": {
            "$ref": "#/definitions/BaseModelDeprecationDates"
        },
        "features": {
            "$ref": "#/definitions/BaseModelFeatures"
        },
        "chargeForAdaptation": {
            "description": "A value indicating whether model adaptation is charged.",
            "type": "boolean",
            "readOnly": true
        }
    }
},

Metin normalleştirme

textNormalizationKind özelliği öğesine DatasetPropertieseklenir.

TextNormalizationKind için varlık tanımı: Metin normalleştirme türü.

  • Varsayılan: Varsayılan metin normalleştirmesi (örneğin, 'iki- üç', en-US'da '2 ile 3' arasının yerini alır).
  • Hiçbiri: Giriş metnine metin normalleştirmesi uygulanmaz. Bu değer, yalnızca karşıya yüklemeden önce metin normalleştirildiğinde kullanılması gereken bir geçersiz kılma seçeneğidir.

Değerlendirme özellikleri

Özelliklere EvaluationProperties belirteç sayısı ve belirteç hatası özellikleri eklendi:

  • correctTokenCount1: Model1'e göre doğru tanınan belirteçlerin sayısı.
  • tokenCount1: Model1'e göre işlenen belirteçlerin sayısı.
  • tokenDeletionCount1: Model1'e göre silinen tanınan belirteçlerin sayısı.
  • tokenErrorRate1: Model1 ile tanımanın belirteç hata oranı.
  • tokenInsertionCount1: Model1'e göre eklenen tanınan belirteçlerin sayısı.
  • tokenSubstitutionCount1: Model1'e göre tanınan ve değiştirme olan sözcüklerin sayısı.
  • correctTokenCount2: Model2'ye göre doğru tanınan belirteçlerin sayısı.
  • tokenCount2: Model2'ye göre işlenen belirteçlerin sayısı.
  • tokenDeletionCount2: Model2'ye göre silinen tanınan belirteçlerin sayısı.
  • tokenErrorRate2: Model2 ile tanımanın belirteç hata oranı.
  • tokenInsertionCount2: Model2'ye göre eklenen tanınan belirteçlerin sayısı.
  • tokenSubstitutionCount2: Model2'ye göre tanınan ve değiştirme olan sözcüklerin sayısı.

Model kopyalama

Aşağıdaki değişiklikler, modeli kopyaladığınız senaryoya yönelik olarak güncelleştirilir.

  • Yeni Models_Copy işlemi eklendi. Yeni kopyalama işlemindeki şema şu şekildedir: "$ref": "#/definitions/ModelCopyAuthorization"
  • Models_CopyTo işlemi kullanım dışı bırakıldı. Kullanım dışı bırakılan kopyalama işlemindeki şema şu şekildedir: "$ref": "#/definitions/ModelCopy"
  • döndüren "$ref": "#/definitions/ModelCopyAuthorization"yeni Models_AuthorizeCopy işlemi eklendi. Bu döndürülen varlık yeni Models_Copy işleminde kullanılabilir.

için ModelCopyAuthorizationyeni bir varlık tanımı eklendi:

"ModelCopyAuthorization": {
    "title": "ModelCopyAuthorization",
    "required": [
        "expirationDateTime",
        "id",
        "sourceResourceId",
        "targetResourceEndpoint",
        "targetResourceId",
        "targetResourceRegion"
    ],
    "type": "object",
    "properties": {
        "targetResourceRegion": {
            "description": "The region (aka location) of the target speech resource (e.g., westus2).",
            "minLength": 1,
            "type": "string"
        },
        "targetResourceId": {
            "description": "The Azure Resource ID of the target speech resource.",
            "minLength": 1,
            "type": "string"
        },
        "targetResourceEndpoint": {
            "description": "The endpoint (base url) of the target resource (with custom domain name when it is used).",
            "minLength": 1,
            "type": "string"
        },
        "sourceResourceId": {
            "description": "The Azure Resource ID of the source speech resource.",
            "minLength": 1,
            "type": "string"
        },
        "expirationDateTime": {
            "format": "date-time",
            "description": "The expiration date of this copy authorization.",
            "type": "string"
        },
        "id": {
            "description": "The ID of this copy authorization.",
            "minLength": 1,
            "type": "string"
        }
    }
},

için ModelCopyAuthorizationDefinitionyeni bir varlık tanımı eklendi:

"ModelCopyAuthorizationDefinition": {
    "title": "ModelCopyAuthorizationDefinition",
    "required": [
        "sourceResourceId"
    ],
    "type": "object",
    "properties": {
        "sourceResourceId": {
            "description": "The Azure Resource ID of the source speech resource.",
            "minLength": 1,
            "type": "string"
        }
    }
},

Yeni copy bir özellik eklendi.

"CustomModelLinks": {
    "title": "CustomModelLinks",
    "type": "object",
    "properties": {
      "copyTo": {
        "format": "uri",
        "description": "The location to the obsolete model copy action. See operation \"Models_CopyTo\" for more details.",
        "type": "string",
        "readOnly": true
      },
      "copy": {
        "format": "uri",
        "description": "The location to the model copy action. See operation \"Models_Copy\" for more details.",
        "type": "string",
        "readOnly": true
      },
      "files": {
        "format": "uri",
        "description": "The location to get all files of this entity. See operation \"Models_ListFiles\" for more details.",
        "type": "string",
        "readOnly": true
      },
      "manifest": {
        "format": "uri",
        "description": "The location to get a manifest for this model to be used in the on-prem container. See operation \"Models_GetCustomModelManifest\" for more details.",
        "type": "string",
        "readOnly": true
      }
    },
    "readOnly": true
},

İşlem Kimlikleri

Kodunuzdaki temel yolu olarak /speechtotext/v3.1 /speechtotext/v3.2güncelleştirmeniz gerekir. Örneğin, bölgedeki temel modelleri eastus almak için yerine https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/basekullanınhttps://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/base.

Sonraki adımlar