Share via


De BYOS-spraakresource (Bring Your Own Storage) gebruiken voor spraak-naar-tekst

ByOS (Bring Your Own Storage) kan worden gebruikt in de volgende spraak-naar-tekstscenario's:

  • Batchtranscriptie
  • Realtime transcriptie waarbij logboekregistratie van audio- en transcriptieresultaten is ingeschakeld
  • Aangepaste spraak

Eén paar spraakresources en opslagaccounts kunnen tegelijkertijd worden gebruikt voor alle scenario's.

In dit artikel wordt uitgebreid uitgelegd hoe u een spraakresource met BYOS gebruikt in alle spraak-naar-tekstscenario's. Het artikel impliceert dat u een volledig geconfigureerde spraakresource met BYOS en een gekoppeld opslagaccount hebt.

Gegevensopslag

Wanneer u BYOS gebruikt, bewaart de Speech-service geen klantartefacten nadat de gegevensverwerking (transcriptie, modeltraining, modeltests) is voltooid. Sommige metagegevens die niet zijn afgeleid van de inhoud van de gebruiker, worden echter opgeslagen in de spraakservice-premises. In het scenario voor aangepaste spraak bewaart de service bijvoorbeeld bepaalde informatie over de aangepaste eindpunten, zoals welke modellen ze gebruiken.

Met het BYOS-gekoppelde opslagaccount worden de volgende gegevens opgeslagen:

Notitie

Optioneel in deze sectie betekent dat het mogelijk is, maar niet vereist is om de specifieke artefacten op te slaan in het BYOS-gekoppelde opslagaccount. Indien nodig kunnen ze elders worden opgeslagen.

Batchtranscriptie

  • Bronaudio (optioneel)
  • Batchtranscriptieresultaten

Realtimetranscriptie waarbij logboekregistratie van audio- en transcriptieresultaten is ingeschakeld

  • Audio- en transcriptieresultatenlogboeken

Aangepaste spraak

  • Bronbestanden van gegevenssets voor modeltraining en -testen (optioneel)
  • Alle gegevens en metagegevens met betrekking tot aangepaste modellen die worden gehost door de spraakresource met BYOS (inclusief kopieën van gegevenssets voor modeltraining en -tests)

Batchtranscriptie

Batchtranscriptie wordt gebruikt om een grote hoeveelheid audiogegevens in opslag te transcriberen. Als u niet bekend bent met Batch-transcriptie, raadpleegt u eerst dit artikel .

Voer deze stappen uit om Batch-transcriptie uit te voeren met spraakresource met BYOS:

  1. Batchtranscriptie starten zoals beschreven in deze handleiding.

    Belangrijk

    Gebruik geen destinationContainerUrl parameter in uw transcriptieaanvraag. Als u BYOS gebruikt, worden de transcriptieresultaten automatisch opgeslagen in het byOS-gekoppelde opslagaccount.

    Als u parameter gebruikt destinationContainerUrl , werkt deze, maar biedt deze aanzienlijk minder beveiliging voor uw gegevens, vanwege ad-hoc SAS-gebruik. Hier vindt u meer informatie.

  2. Wanneer transcriptie is voltooid, haalt u transcriptieresultaten op volgens deze handleiding. Overweeg het gebruik van sasValidityInSeconds de parameter (zie de volgende sectie).

Speech Service maakt gebruik van customspeech-artifacts blobcontainer in het BYOS-gekoppelde opslagaccount voor het opslaan van tussenliggende en uiteindelijke transcriptieresultaten.

Let op

Speech Service is afhankelijk van vooraf gedefinieerde Blob-containerpaden en bestandsnamen voor batchtranscriptiemodule om correct te functioneren. Verplaats, wijzig de inhoud van de container niet of wijzig de naam ervan customspeech-artifacts niet.

Als u dit niet doet, is het lastig om fouten met 4xx- en 5xx-service op te sporen.

Bouw ook geen oplossingen die rechtstreeks gebruikmaken van bestanden en mappen van customspeech-artifacts containers. Gebruik standaardhulpprogramma's om te communiceren met Batch-transcriptie. Zie de details in de sectie Batchtranscriptie.

Batchtranscriptieresultaten ophalen via REST API

Spraak-naar-tekst-REST API biedt volledige ondersteuning voor spraakresources met BYOS-functionaliteit. Omdat de gegevens nu worden opgeslagen in het byOS-opslagaccount, communiceren aanvragen zoals Get Transcription Files echter met de blobopslag van het BYOS-gekoppelde opslagaccount in plaats van interne resources van de Speech-service. Hiermee kunt u dezelfde OP REST API gebaseerde code gebruiken voor zowel 'reguliere' als spraakresources met BYOS-functionaliteit.

Voor maximale beveiliging gebruikt u de sasValidityInSeconds parameter met de waarde die is ingesteld 0 op in de aanvragen, die URL's voor gegevensbestanden retourneren, zoals get transcription Files-aanvraag . Hier volgt een voorbeeld van een aanvraag-URL:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/3b24ca19-2eb1-4a2a-b964-35d89eca486b/files?sasValidityInSeconds=0

Een dergelijke aanvraag retourneert directe URL's van het opslagaccount naar gegevensbestanden (zonder SAS of andere toevoegingen). Voorbeeld:

"links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-artifacts/TranscriptionData/3b24ca19-2eb1-4a2a-b964-35d89eca486b_0_0.json"
      }

Url van deze indeling zorgt ervoor dat alleen Microsoft Entra-identiteiten (gebruikers, service-principals, beheerde identiteiten) met voldoende toegangsrechten (zoals de rol opslagblobgegevenslezer ) toegang hebben tot de gegevens uit de URL.

Waarschuwing

Als sasValidityInSeconds de parameter wordt weggelaten in de aanvraag Transcriptiebestanden ophalen of vergelijkbare, wordt een SAS voor gebruikersdelegatie met de geldigheid van 5 dagen gegenereerd voor elke geretourneerde URL van het gegevensbestand. Deze SAS is ondertekend door de door het systeem toegewezen beheerde identiteit van uw BYOS-spraakresource. Hierdoor heeft de SAS toegang tot de gegevens, zelfs als toegang tot de sleutel van het opslagaccount is uitgeschakeld. Hier vindt u meer informatie.

Realtimetranscriptie waarbij logboekregistratie van audio- en transcriptieresultaten is ingeschakeld

U kunt logboekregistratie inschakelen voor zowel audio-invoer als herkende spraak wanneer u spraak naar tekst of spraakomzetting gebruikt. Zie de volledige beschrijving in dit artikel.

Als u BYOS gebruikt, vindt u de logboeken in customspeech-audiologs de Blob-container in het byOS-gekoppelde opslagaccount.

Waarschuwing

Logboekregistratiegegevens worden vijf dagen bewaard. Na deze periode worden de logboeken automatisch verwijderd. Dit is ook geldig voor spraakresources met BYOS-functionaliteit. Als u de logboeken langer wilt bewaren, kopieert u de correspondentbestanden en -mappen rechtstreeks vanuit customspeech-audiologs de Blob-container of gebruikt u DE REST API.

Realtime transcriptielogboeken ophalen via REST API

Spraak-naar-tekst-REST API biedt volledige ondersteuning voor spraakresources met BYOS-functionaliteit. Omdat de gegevens nu worden opgeslagen in het BYOS-opslagaccount, werken aanvragen zoals Basismodellogboeken ophalen echter met de blobopslag van het BYOS-gekoppelde opslagaccount in plaats van interne resources van de Speech-service. Hiermee kunt u dezelfde OP REST API gebaseerde code gebruiken voor zowel 'reguliere' als spraakresources met BYOS-functionaliteit.

Voor maximale beveiliging gebruikt u de sasValidityInSeconds parameter met de waarde die is ingesteld 0 op in de aanvragen, die URL's voor gegevensbestanden retourneren, zoals de aanvraag basismodellogboeken ophalen. Hier volgt een voorbeeld van een aanvraag-URL:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/endpoints/base/en-US/files/logs?sasValidityInSeconds=0

Een dergelijke aanvraag retourneert directe URL's van het opslagaccount naar gegevensbestanden (zonder SAS of andere toevoegingen). Voorbeeld:

"links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-audiologs/be172190e1334399852185c0addee9d6/en-US/2023-07-06/152339_fcf52189-0d3f-4415-becd-5f639fd7fd6b.v2.json"
      }

Url van deze indeling zorgt ervoor dat alleen Microsoft Entra-identiteiten (gebruikers, service-principals, beheerde identiteiten) met voldoende toegangsrechten (zoals de rol opslagblobgegevenslezer ) toegang hebben tot de gegevens uit de URL.

Waarschuwing

Als sasValidityInSeconds de parameter wordt weggelaten in aanvraag voor basismodellogboeken ophalen of soortgelijke aanvragen, wordt een SAS voor gebruikersdelegatie met de geldigheid van 5 dagen gegenereerd voor elke geretourneerde URL van het gegevensbestand. Deze SAS is ondertekend door de door het systeem toegewezen beheerde identiteit van uw BYOS-spraakresource. Hierdoor heeft de SAS toegang tot de gegevens, zelfs als toegang tot de sleutel van het opslagaccount is uitgeschakeld. Hier vindt u meer informatie.

Aangepaste spraak

Met aangepaste spraak kunt u de nauwkeurigheid van spraakherkenning voor uw toepassingen en producten evalueren en verbeteren. Een aangepast spraakmodel kan worden gebruikt voor realtime spraak naar tekst, spraakomzetting en batchtranscriptie. Zie het overzicht van aangepaste spraak voor meer informatie.

Er is niets specifieks over hoe u aangepaste spraak gebruikt met spraakresource met BYOS-functionaliteit. Het enige verschil is waar alle aangepaste modelgerelateerde gegevens, die door de Speech-service voor u worden verzameld en geproduceerd, worden opgeslagen. De gegevens worden opgeslagen in de volgende blobcontainers van het BYOS-gekoppelde opslagaccount:

  • customspeech-models - Locatie van aangepaste spraakmodellen
  • customspeech-artifacts - Locatie van alle andere aangepaste spraakgerelateerde gegevens

De blobcontainerstructuur wordt alleen verstrekt voor uw informatie en kan zonder kennisgeving worden gewijzigd.

Let op

Speech Service is afhankelijk van vooraf gedefinieerde Blob-containerpaden en bestandsnamen voor aangepaste spraakmodules om correct te functioneren. Verplaats, wijzig of wijzig de inhoud van customspeech-models container- en aangepaste spraakgerelateerde mappen van customspeech-artifacts de container niet.

Als u dit niet doet, leidt dit zeer waarschijnlijk tot het opsporen van fouten en kan dit leiden tot de noodzaak van het opnieuw trainen van aangepaste modellen.

Bouw ook geen oplossingen die rechtstreeks gebruikmaken van bestanden en mappen van customspeech-artifacts containers. Gebruik standaardhulpprogramma's, zoals REST API en Speech Studio, om te communiceren met de aangepaste spraakgerelateerde gegevens. Zie de details in de sectie Aangepaste spraak.

Gebruik van REST API met aangepaste spraak

Spraak-naar-tekst-REST API biedt volledige ondersteuning voor spraakresources met BYOS-functionaliteit. Omdat de gegevens nu echter zijn opgeslagen in het opslagaccount met BYOS, kunnen aanvragen zoals Datasets_ListFiles communiceren met de blobopslag van het BYOS-opslagaccount in plaats van interne resources van de Speech-service. Hiermee kunt u dezelfde OP REST API gebaseerde code gebruiken voor zowel 'reguliere' als spraakresources met BYOS-functionaliteit.

Voor maximale beveiliging gebruikt u de sasValidityInSeconds parameter met de waarde die is ingesteld 0 op in de aanvragen, die URL's voor gegevensbestanden retourneren, zoals de aanvraag Gegevenssetbestanden ophalen. Hier volgt een voorbeeld van een aanvraag-URL:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/8427b92a-cb50-4cda-bf04-964ea1b1781b/files?sasValidityInSeconds=0

Een dergelijke aanvraag retourneert directe URL's van het opslagaccount naar gegevensbestanden (zonder SAS of andere toevoegingen). Voorbeeld:

 "links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-artifacts/AcousticData/8427b92a-cb50-4cda-bf04-964ea1b1781b/4a61ddac-5b1c-4c21-b87d-22001b0f18ab.zip"
      }

Url van deze indeling zorgt ervoor dat alleen Microsoft Entra-identiteiten (gebruikers, service-principals, beheerde identiteiten) met voldoende toegangsrechten (zoals de rol opslagblobgegevenslezer ) toegang hebben tot de gegevens uit de URL.

Waarschuwing

Als sasValidityInSeconds de parameter wordt weggelaten in de aanvraag Gegevenssetbestanden ophalen of vergelijkbare, wordt een SAS voor gebruikersdelegatie met de geldigheid van 5 dagen gegenereerd voor elke geretourneerde URL van het gegevensbestand. Deze SAS is ondertekend door de door het systeem toegewezen beheerde identiteit van uw BYOS-spraakresource. Hierdoor heeft de SAS toegang tot de gegevens, zelfs als toegang tot de sleutel van het opslagaccount is uitgeschakeld. Hier vindt u meer informatie.

Volgende stappen