Lebenszyklus eines benutzerdefinierten Sprachmodells

Artikel
01/19/2024

Sie können ein benutzerdefiniertes Sprachmodell nach der Bereitstellung auf Ihrem benutzerdefinierten Endpunkt eine gewisse Zeit lang verwenden. Aber wenn neue Modelle verfügbar gemacht werden, werden die älteren Modelle als veraltet eingestuft. Jedoch müssen Sie Ihr benutzerdefiniertes Modell ausgehend vom neuesten Basismodell regelmäßig neu erstellen und trainieren, um die verbesserte Genauigkeit und Qualität zu nutzen.

Dies sind einige Schlüsselbegriffe im Zusammenhang mit dem Modelllebenszyklus:

Training: Die Übernahme eines Basismodells und dessen Anpassung mithilfe von Text- und/oder Audiodaten an Ihre Domäne/Ihr Szenario. In einigen Kontexten wie den REST-API-Eigenschaften wird das Training auch als Anpassung bezeichnet.
Transkription: Verwendung eines Modells und Durchführung der Spracherkennung (Decodierung von Audio- in Textdaten).
Endpunkt: Eine bestimmte Bereitstellung eines Basismodells oder eines benutzerdefinierten Modells, auf die nur Sie zugreifen können.

Hinweis

Endpunkte, die von F0-Speech-Ressourcen verwendet werden, werden nach sieben Tagen gelöscht.

Zeitskala für den Ablauf

Dies sind die Zeitachsen für die Modellanpassung und den Transkriptionsablauf:

Training ist nach dem Quartal, in dem Microsoft das Basismodell erstellt hat, ein Jahr lang verfügbar.
Transkription ist für ein Basismodell nach dem Quartal, in dem Microsoft das Basismodell erstellt hat, zwei Jahre lang verfügbar.
Transkription ist für ein benutzerdefiniertes Modell nach dem Quartal, in dem Sie das benutzerdefinierte Modell erstellt haben, zwei Jahre lang verfügbar.

In diesem Zusammenhang enden Quartale am 15. Januar, 15. April, 15. Juli und 15. Oktober.

Was beim Ablaufen eines Modells zu tun ist

Wenn ein benutzerdefiniertes Modell oder Basismodell abläuft, ist es für die Transkription nicht mehr verfügbar. Sie können das von Ihrem benutzerdefinierten Speech-Endpunkt verwendete Modell ohne Ausfallzeit ändern:

Transkriptionsroute	Ergebnis des abgelaufenen Modells	Empfehlung
Benutzerdefinierter Endpunkt	Spracherkennungsanforderungen greifen auf das neueste Basismodell für dasselbe Gebietsschema zurück. Sie erhalten Ergebnisse, aber die Erkennung transkribiert Daten aus Ihrem Fachgebiet möglicherweise nicht genau.	Aktualisieren Sie das Modell des Endpunkts wie im Leitfaden zum Bereitstellen eines benutzerdefinierten Sprachmodells beschrieben.
Batch-Transkription	Batch-Transkriptionsanforderungen für abgelaufene Modelle führen zu einem 4xx-Fehler.	Legen Sie in jedem REST-API-Anforderungstext für Transcriptions_Create die `model`-Eigenschaft auf ein Basismodell oder ein benutzerdefiniertes Modell fest, das noch nicht abgelaufen ist. Schließen Sie andernfalls die `model`-Eigenschaft nicht ein, dann wird immer das neueste Basismodell verwendet.

Abrufen von Basismodell-Ablaufterminen

Das letzte Datum, an dem Sie das Basismodell zum Training verwenden können, wurde angezeigt, als Sie das benutzerdefinierte Modell erstellten. Weitere Informationen finden Sie unter Trainieren eines benutzerdefinierten Sprachmodells.

Folgen Sie diesen Anweisungen, um das Transkriptionsablaufdatum für ein Basismodell abzurufen:

Melden Sie sich in Speech Studio an.
Wählen Sie Custom Speech> Ihr Projektname >Modelle bereitstellen aus.
Das Ablaufdatum für das Modell wird in der Spalte Ablauf angezeigt. Dies ist das letzte Datum, an dem Sie das Modell für Transkriptionen verwenden können.

Zum Abrufen der Ablaufdaten für Training und Transkription für ein Basismodell verwenden Sie den Befehl spx csr model status. Erstellen Sie die Anforderungsparameter gemäß den folgenden Anweisungen:

Legen Sie den url-Parameter auf den URI des Basismodells fest, das Sie abrufen möchten. Sie können den Befehl spx csr list --base ausführen, um verfügbare Basismodelle für alle Gebietsschemas abzurufen.

Hier sehen Sie einen Beispielbefehl der Speech-CLI zum Abrufen der Ablaufdaten für Training und Transkription für ein Basismodell:

spx csr model status --api-version v3.1 --model https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/b0bbc1e0-78d5-468b-9b7c-a5a43b2bb83f

Notieren Sie sich das Datum in der Eigenschaft adaptationDateTime der Antwort. Diese Eigenschaft ist das letzte Datum, an dem Sie das Basismodell für das Training verwenden können. Notieren Sie sich außerdem das Datum in der transcriptionDateTime-Eigenschaft. Dies ist das letzte Datum, an dem Sie das Basismodell für Transkriptionen verwenden können.

Sie sollten einen Antworttext im folgenden Format erhalten:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
  "datasets": [],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-01-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-06T10:52:02Z",
  "status": "Succeeded",
  "createdDateTime": "2021-10-13T00:00:00Z",
  "locale": "en-US",
  "displayName": "20210831 + Audio file adaptation",
  "description": "en-US base model"
}

Führen Sie für die Speech-Befehlszeilenschnittstelle mit Modellen den folgenden Befehl aus:

spx help csr model

Verwenden Sie den Models_GetBaseModel-Vorgang der Spracherkennungs-REST-API, um die Ablauftermine für Training und Transkription für ein Basismodell abzurufen. Sie können eine Models_ListBaseModels-Anforderung erstellen, um verfügbare Basismodelle für alle Gebietsschemas abzurufen.

Erstellen Sie eine HTTP GET-Anforderung mithilfe des Modell-URI, wie im folgenden Beispiel gezeigt. Ersetzen Sie BaseModelId durch die ID Ihres Modells, YourSubscriptionKey durch den Schlüssel Ihrer Speech-Ressource und YourServiceRegion durch die Region Ihrer Speech-Ressource.

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/BaseModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

Notieren Sie sich das Datum in der Eigenschaft adaptationDateTime der Antwort. Dies ist das letzte Datum, an dem Sie das Basismodell für das Training verwenden können. Notieren Sie sich außerdem das Datum in der transcriptionDateTime-Eigenschaft. Dies ist das letzte Datum, an dem Sie das Basismodell für Transkriptionen verwenden können.

Sie sollten einen Antworttext im folgenden Format erhalten:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
  "datasets": [],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-01-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-06T10:52:02Z",
  "status": "Succeeded",
  "createdDateTime": "2021-10-13T00:00:00Z",
  "locale": "en-US",
  "displayName": "20210831 + Audio file adaptation",
  "description": "en-US base model"
}

Abrufen der Ablaufdaten des benutzerdefinierten Modells

Folgen Sie diesen Anweisungen, um das Transkriptionsablaufdatum für ein benutzerdefiniertes Modell abzurufen:

Melden Sie sich in Speech Studio an.
Wählen Sie Custom Speech> Ihr Projektname >Benutzerdefinierte Modelle trainieren aus.
Das Ablaufdatum für das benutzerdefinierte Modell wird in der Spalte Ablauf angezeigt. Dies ist das letzte Datum, an dem Sie das benutzerdefinierte Modell für Transkriptionen verwenden können. Basismodelle werden auf der Seite Benutzerdefinierte Modelle trainieren nicht angezeigt.

Sie können außerdem diesen Anweisungen folgen, um das Transkriptionsablaufdatum für ein benutzerdefiniertes Modell abzurufen:

Melden Sie sich in Speech Studio an.
Wählen Sie Custom Speech> Ihr Projektname >Modelle bereitstellen aus.
Das Ablaufdatum für das Modell wird in der Spalte Ablauf angezeigt. Dies ist das letzte Datum, an dem Sie das Modell für Transkriptionen verwenden können.

Zum Abrufen des Transkriptionsablaufdatums für Ihr benutzerdefiniertes Modell verwenden Sie den spx csr model status-Befehl. Erstellen Sie die Anforderungsparameter gemäß den folgenden Anweisungen:

Legen Sie den url-Parameter auf den URI des Modells fest, das Sie abrufen möchten. Ersetzen Sie YourModelId durch Ihre Modell-ID und YourServiceRegion durch die Region Ihrer Speech-Ressource.

Hier sehen Sie einen Speech CLI-Beispielbefehl zum Abrufen des Transkriptionsablaufdatums für Ihr benutzerdefiniertes Modell:

spx csr model status --api-version v3.1 --model https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/YourModelId

Notieren Sie sich das Datum in der Eigenschaft transcriptionDateTime der Antwort. Dies ist das letzte Datum, an dem Sie das benutzerdefinierte Modell für Transkriptionen verwenden können. Die adaptationDateTime-Eigenschaft ist nicht anwendbar, da benutzerdefinierte Modelle nicht verwendet werden, um andere benutzerdefinierte Modelle zu trainieren.

Sie sollten einen Antworttext im folgenden Format erhalten:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
  "baseModel": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
  },
  "datasets": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
    }
  ],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
    "copyTo": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-07-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-21T13:21:01Z",
  "status": "Succeeded",
  "createdDateTime": "2022-05-22T16:37:01Z",
  "locale": "en-US",
  "displayName": "My Model",
  "description": "My Model Description"
}

Führen Sie für die Speech-Befehlszeilenschnittstelle mit Modellen den folgenden Befehl aus:

spx help csr model

Zum Abrufen des Ablaufdatums für die Transkription für Ihr benutzerdefiniertes Modell verwenden Sie den Vorgang Models_GetCustomModel der Spracherkennungs-REST-API.

Erstellen Sie eine HTTP GET-Anforderung mithilfe des Modell-URI, wie im folgenden Beispiel gezeigt. Ersetzen Sie YourModelId durch die ID Ihres Modells, YourSubscriptionKey durch den Schlüssel Ihrer Speech-Ressource und YourServiceRegion durch die Region Ihrer Speech-Ressource.

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/YourModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

Sie sollten einen Antworttext im folgenden Format erhalten:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
  "baseModel": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
  },
  "datasets": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
    }
  ],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
    "copyTo": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-07-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-21T13:21:01Z",
  "status": "Succeeded",
  "createdDateTime": "2022-05-22T16:37:01Z",
  "locale": "en-US",
  "displayName": "My Model",
  "description": "My Model Description"
}

Lebenszyklus eines benutzerdefinierten Sprachmodells

Zeitskala für den Ablauf

Was beim Ablaufen eines Modells zu tun ist

Abrufen von Basismodell-Ablaufterminen

Abrufen der Ablaufdaten des benutzerdefinierten Modells

Nächste Schritte

Zusätzliche Ressourcen