Životní cyklus vlastního modelu řeči

Po nasazení do vlastního koncového bodu můžete po nějakou dobu použít vlastní hlasový model. Pokud jsou ale k dispozici nové základní modely, platnost starších modelů vyprší. Abyste mohli využívat lepší přesnost a kvalitu, musíte pravidelně znovu vytvářet a trénovat vlastní model z nejnovějšího základního modelu.

Tady jsou některé klíčové termíny související s životním cyklem modelu:

  • Školení: Vytvoření základního modelu a jeho přizpůsobení pro vaši doménu nebo scénář pomocí textových dat nebo zvukových dat V některých kontextech, jako jsou vlastnosti rozhraní REST API, se trénování označuje také jako adaptace.
  • Přepis: Použití modelu a rozpoznávání řeči (dekódování zvuku do textu)
  • Koncový bod: Konkrétní nasazení základního modelu nebo vlastního modelu, ke kterému máte přístup pouze vy.

Poznámka:

Koncové body používané F0 prostředky služby Speech se odstraní po sedmi dnech.

Časová osa vypršení platnosti

Tady jsou časové osy pro přizpůsobení modelu a vypršení platnosti přepisu:

  • Trénování je k dispozici po dobu jednoho roku po čtvrtletí, kdy Microsoft vytvořil základní model.
  • Přepis základního modelu je k dispozici po dvou letech po čtvrtletí, kdy Microsoft vytvořil základní model.
  • Přepis s vlastním modelem je k dispozici po dvou letech po čtvrtletí při vytváření vlastního modelu.

V tomto kontextu končí čtvrtletí 15. ledna, 15. dubna, 15. července a 15. října.

Co dělat, když vyprší platnost modelu

Když vyprší platnost vlastního modelu nebo základního modelu, už není k dispozici pro přepis. Model, který používá váš koncový bod služby Speech, můžete změnit bez výpadků.

Trasa přepisu Výsledek modelu s vypršenou platností Doporučení
Vlastní koncový bod Žádosti o rozpoznávání řeči se vrátí do nejnovějšího základního modelu pro stejné národní prostředí. Získáte výsledky, ale rozpoznávání nemusí přesně přepisovat data domény. Aktualizujte model koncového bodu podle popisu v průvodci nasazením vlastního modelu řeči.
Dávkový přepis Dávkové žádosti o přepis pro modely s vypršenou platností selžou s chybou 4xx. V každém textu požadavku rozhraní REST API Transcriptions_Create nastavte model vlastnost na základní model nebo vlastní model, jehož platnost nevypršela. Jinak nezahrnujte model vlastnost tak, aby vždy používala nejnovější základní model.

Získání dat vypršení platnosti základního modelu

Poslední datum, kdy byste mohli použít základní model pro trénování, se zobrazilo při vytváření vlastního modelu. Další informace najdete v tématu Trénování vlastního modelu řeči.

Pokud chcete získat datum vypršení platnosti přepisu základního modelu, postupujte podle těchto pokynů:

  1. Přihlaste se k sadě Speech Studio.

  2. Vyberte Custom speech> Your project name >Deploy models.

  3. Datum vypršení platnosti modelu se zobrazí ve sloupci Konec platnosti . Toto datum je poslední datum, ke kterému můžete použít model pro přepis.

    Snímek obrazovky se stránkou nasazení modelů, která zobrazuje datum vypršení platnosti přepisu

Pokud chcete získat data vypršení platnosti trénování a přepisu základního modelu, použijte spx csr model status tento příkaz. Parametry požadavku se sestaví podle následujících pokynů:

  • url Nastavte parametr na identifikátor URI základního modelu, který chcete získat. Spuštěním spx csr list --base příkazu můžete získat dostupné základní modely pro všechna národní prostředí.

Tady je ukázkový příkaz rozhraní příkazového řádku služby Speech, který získá data vypršení platnosti trénování a přepisu základního modelu:

spx csr model status --api-version v3.1 --model https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/b0bbc1e0-78d5-468b-9b7c-a5a43b2bb83f

V odpovědi si poznamenejte datum ve adaptationDateTime vlastnosti. Tato vlastnost je poslední datum, kdy můžete pro trénování použít základní model. Poznamenejte si také datum ve transcriptionDateTime vlastnosti. Toto datum je poslední datum, ke kterému můžete použít základní model pro přepis.

Měl by se zobrazit text odpovědi v následujícím formátu:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
  "datasets": [],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-01-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-06T10:52:02Z",
  "status": "Succeeded",
  "createdDateTime": "2021-10-13T00:00:00Z",
  "locale": "en-US",
  "displayName": "20210831 + Audio file adaptation",
  "description": "en-US base model"
}

V případě nápovědy k rozhraní příkazového řádku služby Speech s modely spusťte následující příkaz:

spx help csr model

Pokud chcete získat data vypršení platnosti trénování a přepisu základního modelu, použijte Models_GetBaseModel operaci rozhraní REST API pro převod řeči na text. Můžete vytvořit Models_ListBaseModels žádost o získání dostupných základních modelů pro všechna národní prostředí.

Vytvořte požadavek HTTP GET pomocí identifikátoru URI modelu, jak je znázorněno v následujícím příkladu. Nahraďte BaseModelId ID modelu, nahraďte YourSubscriptionKey klíčem prostředku služby Speech a nahraďte YourServiceRegion oblastí prostředků služby Speech.

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/BaseModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

V odpovědi si poznamenejte datum ve adaptationDateTime vlastnosti. Toto datum je poslední datum, ke kterému můžete použít základní model pro trénování. Poznamenejte si také datum ve transcriptionDateTime vlastnosti. Toto datum je poslední datum, ke kterému můžete použít základní model pro přepis.

Měl by se zobrazit text odpovědi v následujícím formátu:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
  "datasets": [],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-01-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-06T10:52:02Z",
  "status": "Succeeded",
  "createdDateTime": "2021-10-13T00:00:00Z",
  "locale": "en-US",
  "displayName": "20210831 + Audio file adaptation",
  "description": "en-US base model"
}

Získání dat vypršení platnosti vlastního modelu

Pokud chcete získat datum vypršení platnosti přepisu pro vlastní model, postupujte podle těchto pokynů:

  1. Přihlaste se k sadě Speech Studio.

  2. Vyberte Custom speech> Your project name >Train custom models.

  3. Datum vypršení platnosti vlastního modelu se zobrazuje ve sloupci Vypršení platnosti . Toto datum je poslední datum, ke kterému můžete použít vlastní model pro přepis. Základní modely se nezobrazují na stránce Trénovat vlastní modely .

    Snímek obrazovky se stránkou trénování vlastních modelů, která zobrazuje datum vypršení platnosti přepisu

Pokud chcete získat datum vypršení platnosti přepisu pro vlastní model, můžete postupovat také podle těchto pokynů:

  1. Přihlaste se k sadě Speech Studio.

  2. Vyberte Custom speech> Your project name >Deploy models.

  3. Datum vypršení platnosti modelu se zobrazí ve sloupci Konec platnosti . Toto datum je poslední datum, ke kterému můžete použít model pro přepis.

    Snímek obrazovky se stránkou nasazení modelů, která zobrazuje datum vypršení platnosti přepisu

Pokud chcete získat datum vypršení platnosti přepisu pro váš vlastní model, použijte spx csr model status tento příkaz. Parametry požadavku se sestaví podle následujících pokynů:

  • url Nastavte parametr na identifikátor URI modelu, který chcete získat. Nahraďte YourModelId ID modelu a nahraďte YourServiceRegion oblastí prostředků služby Speech.

Tady je příklad příkazu Rozhraní příkazového řádku služby Speech k získání data vypršení platnosti přepisu pro váš vlastní model:

spx csr model status --api-version v3.1 --model https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/YourModelId

V odpovědi si poznamenejte datum ve transcriptionDateTime vlastnosti. Toto datum je poslední datum, ke kterému můžete použít vlastní model pro přepis. Tato adaptationDateTime vlastnost se nedá použít, protože vlastní modely se nepoužívají k trénování jiných vlastních modelů.

Měl by se zobrazit text odpovědi v následujícím formátu:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
  "baseModel": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
  },
  "datasets": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
    }
  ],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
    "copyTo": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-07-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-21T13:21:01Z",
  "status": "Succeeded",
  "createdDateTime": "2022-05-22T16:37:01Z",
  "locale": "en-US",
  "displayName": "My Model",
  "description": "My Model Description"
}

V případě nápovědy k rozhraní příkazového řádku služby Speech s modely spusťte následující příkaz:

spx help csr model

Pokud chcete získat datum vypršení platnosti přepisu pro váš vlastní model, použijte Models_GetCustomModel operaci Rozhraní REST API pro převod řeči na text.

Vytvořte požadavek HTTP GET pomocí identifikátoru URI modelu, jak je znázorněno v následujícím příkladu. Nahraďte YourModelId ID modelu, nahraďte YourSubscriptionKey klíčem prostředku služby Speech a nahraďte YourServiceRegion oblastí prostředků služby Speech.

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/YourModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

V odpovědi si poznamenejte datum ve transcriptionDateTime vlastnosti. Toto datum je poslední datum, ke kterému můžete použít vlastní model pro přepis. Tato adaptationDateTime vlastnost se nedá použít, protože vlastní modely se nepoužívají k trénování jiných vlastních modelů.

Měl by se zobrazit text odpovědi v následujícím formátu:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
  "baseModel": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
  },
  "datasets": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
    }
  ],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
    "copyTo": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-07-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-21T13:21:01Z",
  "status": "Succeeded",
  "createdDateTime": "2022-05-22T16:37:01Z",
  "locale": "en-US",
  "displayName": "My Model",
  "description": "My Model Description"
}

Další kroky