Trainings- en testgegevenssets uploaden voor aangepaste spraak

U hebt audio- of tekstgegevens nodig om de nauwkeurigheid van spraakherkenning te testen of uw aangepaste modellen te trainen. Zie Gegevenssets trainen en testen voor informatie over de gegevenstypen die worden ondersteund voor het testen of trainen van uw model.

Tip

U kunt ook de online transcriptie-editor gebruiken om gelabelde audiogegevenssets te maken en verfijnen.

Gegevenssets uploaden

Als u uw eigen gegevenssets wilt uploaden in Speech Studio, voert u de volgende stappen uit:

  1. Meld u aan bij Speech Studio.

  2. Selecteer Aangepaste spraak> uw projectnaam> Speech-gegevenssets>Uploadgegevens.

  3. Selecteer het tabblad Trainingsgegevens of Testgegevens .

  4. Selecteer een gegevenssettype en selecteer vervolgens Volgende.

  5. Geef de locatie van de gegevensset op en selecteer vervolgens Volgende. U kunt een lokaal bestand kiezen of een externe locatie opgeven, zoals azure Blob-URL. Als u externe locatie selecteert en u geen vertrouwd beveiligingsmechanisme voor Azure-services gebruikt, moet de externe locatie een URL zijn die kan worden opgehaald met een eenvoudige anonieme GET-aanvraag. Bijvoorbeeld een SAS-URL of een openbaar toegankelijke URL. URL's waarvoor extra autorisatie is vereist of verwacht dat gebruikersinteractie niet wordt ondersteund.

    Notitie

    Als u azure Blob-URL gebruikt, kunt u de maximale beveiliging van uw gegevenssetbestanden garanderen met behulp van een vertrouwd Azure Services-beveiligingsmechanisme. U gebruikt dezelfde technieken als voor Batch-transcriptie en URL's van opslagaccount zonder opmaak voor uw gegevenssetbestanden. Hier vindt u meer informatie.

  6. Voer de naam en beschrijving van de gegevensset in en selecteer vervolgens Volgende.

  7. Controleer uw instellingen en selecteer Opslaan en sluiten.

Nadat uw gegevensset is geĆ¼pload, gaat u naar de pagina Aangepaste modellen trainen om een aangepast model te trainen.

Met de Speech CLI en Speech to text REST API, in tegenstelling tot de Speech Studio, kiest u niet of een gegevensset moet worden getest of getraind op het moment van uploaden. U geeft op hoe een gegevensset wordt gebruikt wanneer u een model traint of een test uitvoert.

Hoewel u niet aangeeft of de gegevensset bedoeld is voor testen of trainen, moet u het type gegevensset opgeven. Het type gegevensset wordt gebruikt om te bepalen welk type gegevensset wordt gemaakt. In sommige gevallen wordt een gegevenssettype alleen gebruikt voor testen of trainen, maar u moet daar geen afhankelijkheid van nemen. De waarden van de Speech CLI en REST API kind komen overeen met de opties in Speech Studio, zoals beschreven in de volgende tabel:

CLI- en API-soort Opties voor Speech Studio
Akoestische Trainingsgegevens: Audio + human-labeled transcript
Testgegevens: Transcript (automatische audiosynthese)
Testgegevens: Audio + door mensen gelabelde transcriptie
AudioFiles Testgegevens: Audio
Taal Trainingsgegevens: Tekst zonder opmaak
LanguageMarkdown Trainingsgegevens: Gestructureerde tekst in Markdown-indeling
Uitspraak Trainingsgegevens: Uitspraak
OutputFormatting Trainingsgegevens: Uitvoerindeling

Notitie

Gestructureerde tekst in markdown-indeling trainingsgegevenssets worden niet ondersteund door versie 3.0 van de REST API voor spraak-naar-tekst. U moet de Spraak-naar-tekst-REST API v3.1 gebruiken. Zie Code migreren van v3.0 naar v3.1 van de REST API voor meer informatie.

Gebruik de spx csr dataset create opdracht om een gegevensset te maken en deze te verbinden met een bestaand project. Bouw de aanvraagparameters volgens de volgende instructies:

  • Stel de project parameter in op de id van een bestaand project. Deze parameter wordt aanbevolen, zodat u de gegevensset ook kunt bekijken en beheren in Speech Studio. U kunt de spx csr project list opdracht uitvoeren om beschikbare projecten op te halen.

  • Stel de vereiste kind parameter in. De mogelijke set waarden voor gegevenssettype zijn: Taal, Akoestisch, Uitspraak en AudioFiles.

  • Stel de vereiste contentUrl parameter in. Deze parameter is de locatie van de gegevensset. Als u geen vertrouwd Azure Services-beveiligingsmechanisme gebruikt (zie volgende opmerking), moet de contentUrl parameter een URL zijn die kan worden opgehaald met een eenvoudige anonieme GET-aanvraag. Bijvoorbeeld een SAS-URL of een openbaar toegankelijke URL. URL's waarvoor extra autorisatie is vereist of verwacht dat gebruikersinteractie niet wordt ondersteund.

    Notitie

    Als u azure Blob-URL gebruikt, kunt u de maximale beveiliging van uw gegevenssetbestanden garanderen met behulp van een vertrouwd Azure Services-beveiligingsmechanisme. U gebruikt dezelfde technieken als voor Batch-transcriptie en URL's van opslagaccount zonder opmaak voor uw gegevenssetbestanden. Hier vindt u meer informatie.

  • Stel de vereiste language parameter in. De landinstelling van de gegevensset moet overeenkomen met de landinstelling van het project. De landinstelling kan later niet meer worden gewijzigd. De speech CLI-parameter language komt overeen met de locale eigenschap in de JSON-aanvraag en het antwoord.

  • Stel de vereiste name parameter in. Deze parameter is de naam die wordt weergegeven in Speech Studio. De speech CLI-parameter name komt overeen met de displayName eigenschap in de JSON-aanvraag en het antwoord.

Hier volgt een voorbeeld van een Speech CLI-opdracht die een gegevensset maakt en deze verbindt met een bestaand project:

spx csr dataset create --api-version v3.1 --kind "Acoustic" --name "My Acoustic Dataset" --description "My Acoustic Dataset Description" --project YourProjectId --content YourContentUrl --language "en-US"

U ontvangt een antwoordtekst in de volgende indeling:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/e0ea620b-e8c3-4a26-acb2-95fd0cbc625c",
  "kind": "Acoustic",
  "contentUrl": "https://contoso.com/mydatasetlocation",
  "links": {
    "files": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/e0ea620b-e8c3-4a26-acb2-95fd0cbc625c/files"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/70ccbffc-cafb-4301-aa9f-ef658559d96e"
  },
  "properties": {
    "acceptedLineCount": 0,
    "rejectedLineCount": 0
  },
  "lastActionDateTime": "2022-05-20T14:07:11Z",
  "status": "NotStarted",
  "createdDateTime": "2022-05-20T14:07:11Z",
  "locale": "en-US",
  "displayName": "My Acoustic Dataset",
  "description": "My Acoustic Dataset Description"
}

De eigenschap op het hoogste niveau self in de hoofdtekst van het antwoord is de URI van de gegevensset. Gebruik deze URI voor meer informatie over het project en de bestanden van de gegevensset. U gebruikt deze URI ook om een gegevensset bij te werken of te verwijderen.

Voer de volgende opdracht uit voor Speech CLI-hulp bij gegevenssets:

spx help csr dataset

Met de Speech CLI en Speech to text REST API, in tegenstelling tot de Speech Studio, kiest u niet of een gegevensset moet worden getest of getraind op het moment van uploaden. U geeft op hoe een gegevensset wordt gebruikt wanneer u een model traint of een test uitvoert.

Hoewel u niet aangeeft of de gegevensset bedoeld is voor testen of trainen, moet u het type gegevensset opgeven. Het type gegevensset wordt gebruikt om te bepalen welk type gegevensset wordt gemaakt. In sommige gevallen wordt een gegevenssettype alleen gebruikt voor testen of trainen, maar u moet daar geen afhankelijkheid van nemen. De waarden van de Speech CLI en REST API kind komen overeen met de opties in Speech Studio, zoals beschreven in de volgende tabel:

CLI- en API-soort Opties voor Speech Studio
Akoestische Trainingsgegevens: Audio + human-labeled transcript
Testgegevens: Transcript (automatische audiosynthese)
Testgegevens: Audio + door mensen gelabelde transcriptie
AudioFiles Testgegevens: Audio
Taal Trainingsgegevens: Tekst zonder opmaak
LanguageMarkdown Trainingsgegevens: Gestructureerde tekst in Markdown-indeling
Uitspraak Trainingsgegevens: Uitspraak
OutputFormatting Trainingsgegevens: Uitvoerindeling

Notitie

Gestructureerde tekst in markdown-indeling trainingsgegevenssets worden niet ondersteund door versie 3.0 van de REST API voor spraak-naar-tekst. U moet de Spraak-naar-tekst-REST API v3.1 gebruiken. Zie Code migreren van v3.0 naar v3.1 van de REST API voor meer informatie.

Als u een gegevensset wilt maken en deze wilt verbinden met een bestaand project, gebruikt u de Datasets_Create bewerking van de Rest API voor spraak naar tekst. Bouw de aanvraagbody volgens de volgende instructies:

  • Stel de project eigenschap in op de URI van een bestaand project. Deze eigenschap wordt aanbevolen, zodat u de gegevensset ook kunt bekijken en beheren in Speech Studio. U kunt een Projects_List aanvraag indienen om beschikbare projecten op te halen.

  • Stel de vereiste kind eigenschap in. De mogelijke set waarden voor gegevenssettype zijn: Taal, Akoestisch, Uitspraak en AudioFiles.

  • Stel de vereiste contentUrl eigenschap in. Deze eigenschap is de locatie van de gegevensset. Als u geen vertrouwd Azure Services-beveiligingsmechanisme gebruikt (zie volgende opmerking), moet de contentUrl parameter een URL zijn die kan worden opgehaald met een eenvoudige anonieme GET-aanvraag. Bijvoorbeeld een SAS-URL of een openbaar toegankelijke URL. URL's waarvoor extra autorisatie is vereist of verwacht dat gebruikersinteractie niet wordt ondersteund.

    Notitie

    Als u azure Blob-URL gebruikt, kunt u de maximale beveiliging van uw gegevenssetbestanden garanderen met behulp van een vertrouwd Azure Services-beveiligingsmechanisme. U gebruikt dezelfde technieken als voor Batch-transcriptie en URL's van opslagaccount zonder opmaak voor uw gegevenssetbestanden. Hier vindt u meer informatie.

  • Stel de vereiste locale eigenschap in. De landinstelling van de gegevensset moet overeenkomen met de landinstelling van het project. De landinstelling kan later niet meer worden gewijzigd.

  • Stel de vereiste displayName eigenschap in. Deze eigenschap is de naam die wordt weergegeven in Speech Studio.

Maak een HTTP POST-aanvraag met behulp van de URI, zoals wordt weergegeven in het volgende voorbeeld. Vervang door YourSubscriptionKey de spraakresourcesleutel, vervang deze door YourServiceRegion uw spraakresourceregio en stel de eigenschappen van de aanvraagbody in zoals eerder beschreven.

curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey" -H "Content-Type: application/json" -d '{
  "kind": "Acoustic",
  "displayName": "My Acoustic Dataset",
  "description": "My Acoustic Dataset Description",
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/70ccbffc-cafb-4301-aa9f-ef658559d96e"
  },
  "contentUrl": "https://contoso.com/mydatasetlocation",
  "locale": "en-US",
}'  "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/datasets"

U ontvangt een antwoordtekst in de volgende indeling:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/e0ea620b-e8c3-4a26-acb2-95fd0cbc625c",
  "kind": "Acoustic",
  "contentUrl": "https://contoso.com/mydatasetlocation",
  "links": {
    "files": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/e0ea620b-e8c3-4a26-acb2-95fd0cbc625c/files"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/70ccbffc-cafb-4301-aa9f-ef658559d96e"
  },
  "properties": {
    "acceptedLineCount": 0,
    "rejectedLineCount": 0
  },
  "lastActionDateTime": "2022-05-20T14:07:11Z",
  "status": "NotStarted",
  "createdDateTime": "2022-05-20T14:07:11Z",
  "locale": "en-US",
  "displayName": "My Acoustic Dataset",
  "description": "My Acoustic Dataset Description"
}

De eigenschap op het hoogste niveau self in de hoofdtekst van het antwoord is de URI van de gegevensset. Gebruik deze URI voor meer informatie over het project en de bestanden van de gegevensset. U gebruikt deze URI ook om de gegevensset bij te werken of te verwijderen .

Belangrijk

Verbinding maken een gegevensset naar een aangepast spraakproject is niet vereist om een aangepast model te trainen en te testen met behulp van de REST API of Speech CLI. Maar als de gegevensset niet is verbonden met een project, kunt u deze niet selecteren voor training of testen in Speech Studio.

Volgende stappen