Cykl życia niestandardowego modelu mowy

Możesz użyć niestandardowego modelu mowy przez jakiś czas po wdrożeniu go w niestandardowym punkcie końcowym. Jednak po udostępnieniu nowych modeli podstawowych starsze modele wygasły. Aby korzystać z ulepszonej dokładności i jakości, należy okresowo ponownie utworzyć i wytrenować model niestandardowy z najnowszego modelu podstawowego.

Poniżej przedstawiono niektóre kluczowe terminy związane z cyklem życia modelu:

  • Trenowanie: pobieranie modelu podstawowego i dostosowywanie go do domeny/scenariusza przy użyciu danych tekstowych i/lub danych audio. W niektórych kontekstach, takich jak właściwości interfejsu API REST, trenowanie jest również określane jako adaptacja.
  • Transkrypcja: używanie modelu i rozpoznawanie mowy (dekodowanie dźwięku do tekstu).
  • Punkt końcowy: konkretne wdrożenie modelu podstawowego lub modelu niestandardowego, do którego można uzyskać dostęp tylko.

Uwaga

Punkty końcowe używane przez F0 zasoby usługi Mowa są usuwane po siedmiu dniach.

Oś czasu wygaśnięcia

Poniżej przedstawiono osie czasu dostosowywania modelu i wygaśnięcia transkrypcji:

  • Szkolenie jest dostępne przez rok po kwartale podczas tworzenia modelu podstawowego przez firmę Microsoft.
  • Transkrypcja z modelem podstawowym jest dostępna przez dwa lata po kwartale utworzenia modelu podstawowego przez firmę Microsoft.
  • Transkrypcja z modelem niestandardowym jest dostępna przez dwa lata po kwartale podczas tworzenia modelu niestandardowego.

W tym kontekście kwartały kończą się 15 stycznia, 15 kwietnia, 15 lipca i 15 października.

Co zrobić, gdy model wygaśnie

Gdy model niestandardowy lub model podstawowy wygaśnie, nie jest już dostępny do transkrypcji. Możesz zmienić model używany przez niestandardowy punkt końcowy mowy bez przestoju.

Trasa transkrypcji Wynik wygasłego modelu Zalecenie
Niestandardowy punkt końcowy Żądania rozpoznawania mowy wracają do najnowszego modelu podstawowego dla tych samych ustawień regionalnych. Uzyskujesz wyniki, ale rozpoznawanie może nie być dokładnie transkrypcji danych domeny. Zaktualizuj model punktu końcowego zgodnie z opisem w przewodniku Wdrażanie niestandardowego modelu mowy.
Transkrypcja wsadowa Żądania transkrypcji wsadowej dla wygasłych modeli kończą się niepowodzeniem z powodu błędu 4xx. W każdej Transcriptions_Create treści żądania interfejsu API REST ustaw model właściwość na model podstawowy lub model niestandardowy, który nie wygasł. W przeciwnym razie nie uwzględniaj model właściwości, aby zawsze używać najnowszego modelu podstawowego.

Pobieranie dat wygaśnięcia modelu podstawowego

Ostatnia data użycia modelu podstawowego do trenowania została wyświetlona podczas tworzenia modelu niestandardowego. Aby uzyskać więcej informacji, zobacz Trenowanie niestandardowego modelu mowy.

Postępuj zgodnie z tymi instrukcjami, aby uzyskać datę wygaśnięcia transkrypcji dla modelu podstawowego:

  1. Zaloguj się do programu Speech Studio.

  2. Wybierz pozycję Mowa> niestandardowa Nazwa >projektu Wdróż modele.

  3. Data wygaśnięcia modelu jest wyświetlana w kolumnie Wygaśnięcie . Ta data to ostatnia data, w której można użyć modelu do transkrypcji.

    Zrzut ekranu przedstawiający stronę wdrażania modeli z datą wygaśnięcia transkrypcji.

Aby uzyskać daty wygaśnięcia trenowania i transkrypcji dla modelu podstawowego, użyj spx csr model status polecenia . Skonstruuj parametry żądania zgodnie z następującymi instrukcjami:

  • url Ustaw parametr na identyfikator URI modelu podstawowego, który chcesz uzyskać. Możesz uruchomić polecenie , spx csr list --base aby uzyskać dostępne modele podstawowe dla wszystkich ustawień regionalnych.

Oto przykładowe polecenie interfejsu wiersza polecenia usługi Mowa umożliwiające uzyskanie dat wygaśnięcia trenowania i transkrypcji dla modelu podstawowego:

spx csr model status --api-version v3.1 --model https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/b0bbc1e0-78d5-468b-9b7c-a5a43b2bb83f

W odpowiedzi zanotuj datę we adaptationDateTime właściwości . Ta właściwość to ostatnia data użycia modelu podstawowego do trenowania. Zanotuj transcriptionDateTime również datę we właściwości . Ta data to ostatnia data, w której można użyć modelu podstawowego do transkrypcji.

Treść odpowiedzi powinna zostać wyświetlona w następującym formacie:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
  "datasets": [],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-01-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-06T10:52:02Z",
  "status": "Succeeded",
  "createdDateTime": "2021-10-13T00:00:00Z",
  "locale": "en-US",
  "displayName": "20210831 + Audio file adaptation",
  "description": "en-US base model"
}

Aby uzyskać pomoc dotyczącą interfejsu wiersza polecenia usługi Mowa w modelach, uruchom następujące polecenie:

spx help csr model

Aby uzyskać daty wygaśnięcia trenowania i transkrypcji dla modelu podstawowego, użyj operacji Models_GetBaseModel interfejsu API REST zamiany mowy na tekst. Możesz wysłać żądanie Models_ListBaseModels , aby uzyskać dostępne modele podstawowe dla wszystkich ustawień regionalnych.

Utwórz żądanie HTTP GET przy użyciu identyfikatora URI modelu, jak pokazano w poniższym przykładzie. Zastąp BaseModelId ciąg swoim identyfikatorem modelu, zastąp ciąg kluczem zasobu usługi Mowa i zastąp YourSubscriptionKeyYourServiceRegion element regionem zasobu usługi Mowa.

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/BaseModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

W odpowiedzi zanotuj datę we adaptationDateTime właściwości . Ta data to ostatnia data, w której można użyć modelu podstawowego do trenowania. Zanotuj transcriptionDateTime również datę we właściwości . Ta data to ostatnia data, w której można użyć modelu podstawowego do transkrypcji.

Treść odpowiedzi powinna zostać wyświetlona w następującym formacie:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
  "datasets": [],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-01-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-06T10:52:02Z",
  "status": "Succeeded",
  "createdDateTime": "2021-10-13T00:00:00Z",
  "locale": "en-US",
  "displayName": "20210831 + Audio file adaptation",
  "description": "en-US base model"
}

Pobieranie dat wygaśnięcia modelu niestandardowego

Postępuj zgodnie z tymi instrukcjami, aby uzyskać datę wygaśnięcia transkrypcji dla modelu niestandardowego:

  1. Zaloguj się do programu Speech Studio.

  2. Wybierz pozycję Niestandardowa mowa> Nazwa >projektu Train custom models (Trenowanie modeli niestandardowych).

  3. Data wygaśnięcia modelu niestandardowego jest wyświetlana w kolumnie Wygaśnięcie . Ta data to ostatnia data, w której można użyć modelu niestandardowego do transkrypcji. Modele podstawowe nie są wyświetlane na stronie Trenowanie modeli niestandardowych.

    Zrzut ekranu przedstawiający stronę trenowania modeli niestandardowych z datą wygaśnięcia transkrypcji.

Możesz również postępować zgodnie z tymi instrukcjami, aby uzyskać datę wygaśnięcia transkrypcji dla modelu niestandardowego:

  1. Zaloguj się do programu Speech Studio.

  2. Wybierz pozycję Mowa> niestandardowa Nazwa >projektu Wdróż modele.

  3. Data wygaśnięcia modelu jest wyświetlana w kolumnie Wygaśnięcie . Ta data to ostatnia data, w której można użyć modelu do transkrypcji.

    Zrzut ekranu przedstawiający stronę wdrażania modeli z datą wygaśnięcia transkrypcji.

Aby uzyskać datę wygaśnięcia transkrypcji dla modelu niestandardowego spx csr model status , użyj polecenia . Skonstruuj parametry żądania zgodnie z następującymi instrukcjami:

  • url Ustaw parametr na identyfikator URI modelu, który chcesz uzyskać. Zastąp YourModelId ciąg identyfikatorem modelu i zastąp element YourServiceRegion regionem zasobu usługi Mowa.

Oto przykładowe polecenie interfejsu wiersza polecenia usługi Mowa umożliwiające uzyskanie daty wygaśnięcia transkrypcji dla modelu niestandardowego:

spx csr model status --api-version v3.1 --model https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/YourModelId

W odpowiedzi zanotuj datę we transcriptionDateTime właściwości . Ta data to ostatnia data, w której można użyć niestandardowego modelu do transkrypcji. Właściwość adaptationDateTime nie ma zastosowania, ponieważ modele niestandardowe nie są używane do trenowania innych modeli niestandardowych.

Treść odpowiedzi powinna zostać wyświetlona w następującym formacie:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
  "baseModel": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
  },
  "datasets": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
    }
  ],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
    "copyTo": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-07-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-21T13:21:01Z",
  "status": "Succeeded",
  "createdDateTime": "2022-05-22T16:37:01Z",
  "locale": "en-US",
  "displayName": "My Model",
  "description": "My Model Description"
}

Aby uzyskać pomoc dotyczącą interfejsu wiersza polecenia usługi Mowa w modelach, uruchom następujące polecenie:

spx help csr model

Aby uzyskać datę wygaśnięcia transkrypcji dla modelu niestandardowego, użyj operacji Models_GetCustomModel interfejsu API REST zamiany mowy na tekst.

Utwórz żądanie HTTP GET przy użyciu identyfikatora URI modelu, jak pokazano w poniższym przykładzie. Zastąp YourModelId ciąg swoim identyfikatorem modelu, zastąp ciąg kluczem zasobu usługi Mowa i zastąp YourSubscriptionKeyYourServiceRegion element regionem zasobu usługi Mowa.

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/YourModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

W odpowiedzi zanotuj datę we transcriptionDateTime właściwości . Ta data to ostatnia data, w której można użyć niestandardowego modelu do transkrypcji. Właściwość adaptationDateTime nie ma zastosowania, ponieważ modele niestandardowe nie są używane do trenowania innych modeli niestandardowych.

Treść odpowiedzi powinna zostać wyświetlona w następującym formacie:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
  "baseModel": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
  },
  "datasets": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
    }
  ],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
    "copyTo": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-07-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-21T13:21:01Z",
  "status": "Succeeded",
  "createdDateTime": "2022-05-22T16:37:01Z",
  "locale": "en-US",
  "displayName": "My Model",
  "description": "My Model Description"
}

Następne kroki