Delen via


REST API voor spraak-naar-tekst

Rest API voor spraak-naar-tekst wordt gebruikt voor batchtranscriptie en aangepaste spraak.

Belangrijk

Rest API-versie 2024-11-15 voor spraak-naar-tekst is de nieuwste versie die algemeen beschikbaar is.

  • De REST API-versie2024-05-15-preview voor spraak-naar-tekst wordt buiten gebruik gesteld op een datum die moet worden aangekondigd.
  • Spraak-naar-tekst-REST APIv3.0, v3.1, , v3.23.2-preview.1en 3.2-preview.2 wordt buiten gebruik gesteld op 31 maart 2026.

Zie de migratiehandleidingen Speech to text rest API v3.0 naar v3.1, v3.1 naar v3.2 en v3.2 naar 2024-11-15 voor meer informatie over het upgraden.

Speech to text REST API gebruiken om:

  • Snelle transcriptie: Transcribeer audiobestanden met synchrone en veel snellere resultaten dan realtime audio. Gebruik de snelle transcriptie-API (/speechtotext/transcripties:transcribe) in de scenario's waarin u het transcript van een audio-opname zo snel mogelijk nodig hebt met voorspelbare latentie, zoals snelle audio- of videotranscriptie of videoomzetting.
  • Batchtranscriptie: audiobestanden transcriberen als een batch van meerdere URL's of een Azure-container. Gebruik de batchtranscriptie-API (/speechtotext/transcripties:submit) in de scenario's die u nodig hebt om een grote hoeveelheid audio in opslag te transcriberen, zoals een groot aantal bestanden of een lang audiobestand.
  • Aangepaste spraak: Upload uw eigen gegevens, test en train een aangepast model, vergelijk de nauwkeurigheid tussen modellen en implementeer een model naar een aangepast eindpunt. Kopieer modellen naar andere abonnementen als u wilt dat collega's toegang hebben tot een model dat u hebt gemaakt of als u een model wilt implementeren in meer dan één regio.

De REST API voor spraak-naar-tekst bevat functies zoals:

  • Aanvraaglogboeken voor elk eindpunt.
  • Vraag het manifest aan van de modellen die u maakt om on-premises containers in te stellen.
  • Gegevens uploaden vanuit Azure-opslagaccounts met behulp van een SAS-URI (Shared Access Signature).
  • Breng je eigen opslag mee. Gebruik uw eigen opslagaccounts voor logboeken, transcriptiebestanden en andere gegevens.
  • Sommige bewerkingen ondersteunen webhookmeldingen. U kunt uw webhooks registreren waar meldingen worden verzonden.

Snelle transcriptie

De volgende bewerkingsgroepen zijn van toepassing op snelle transcriptie.

Bewerkingsgroep Beschrijving
Transcripties Gebruik Transcripties - Transcribe om audiobestanden te transcriberen.

Wanneer u snelle transcriptie gebruikt, verzendt u één bestand per aanvraag. Zie Een transcriptie maken voor voorbeelden van het maken van een transcriptie van één audiobestand.

Batchtranscriptie

De volgende bewerkingsgroepen zijn van toepassing op batchtranscriptie.

Bewerkingsgroep Beschrijving
Modellen Gebruik basismodellen of aangepaste modellen om audiobestanden te transcriberen.

U kunt modellen gebruiken met aangepaste spraak - en batchtranscriptie. U kunt bijvoorbeeld een model gebruiken dat is getraind met een specifieke gegevensset om audiobestanden te transcriberen. Zie De levenscyclus van een model en een aangepast spraakmodel trainen voor voorbeelden van het trainen en beheren van aangepaste spraakmodellen.
Transcripties Gebruik Transcripties - Verzenden om een grote hoeveelheid opgeslagen audio te transcriberen.

Wanneer u batchtranscriptie gebruikt, verzendt u meerdere bestanden per aanvraag of wijst u naar een Azure Blob Storage-container met de audiobestanden om te transcriberen. Zie Een transcriptie maken voor voorbeelden van het maken van een transcriptie van meerdere audiobestanden.
Webhook Gebruik webhook om meldingen te ontvangen over gebeurtenissen voor het maken, verwerken, voltooien en verwijderen.

U kunt webhook gebruiken met aangepaste spraak - en batchtranscriptie. Webhook is van toepassing op gegevenssets, eindpunten, evaluaties, modellen en transcripties.

Aangepaste spraak

De volgende bewerkingsgroepen zijn van toepassing op aangepaste spraak.

Bewerkingsgroep Beschrijving
Gegevenssets Gebruik gegevenssets om aangepaste spraakmodellen te trainen en te testen.

U kunt bijvoorbeeld de prestaties van een aangepaste spraak die is getraind met een specifieke gegevensset vergelijken met de prestaties van een basismodel of aangepast spraakmodel dat is getraind met een andere gegevensset. Zie Trainings- en testgegevenssets uploaden voor voorbeelden van het uploaden van gegevenssets.
Eindpunten Aangepaste spraakmodellen implementeren op eindpunten.

U moet een aangepast eindpunt implementeren om een aangepast spraakmodel te gebruiken. Zie Een model implementeren voor voorbeelden van het beheren van implementatie-eindpunten.
Evaluaties Gebruik evaluaties om de prestaties van verschillende modellen te vergelijken.

U kunt bijvoorbeeld de prestaties van een aangepast spraakmodel dat is getraind met een specifieke gegevensset vergelijken met de prestaties van een basismodel of een aangepast model dat is getraind met een andere gegevensset. Zie kwaliteit van testherkenning en testnauwkeurigheid voor voorbeelden van het testen en evalueren van aangepaste spraakmodellen.
Modellen Gebruik basismodellen of aangepaste modellen om audiobestanden te transcriberen.

U kunt modellen gebruiken met aangepaste spraak - en batchtranscriptie. U kunt bijvoorbeeld een model gebruiken dat is getraind met een specifieke gegevensset om audiobestanden te transcriberen. Zie De levenscyclus van een model en een aangepast spraakmodel trainen voor voorbeelden van het trainen en beheren van aangepaste spraakmodellen.
Webhook Gebruik webhook om meldingen te ontvangen over gebeurtenissen voor het maken, verwerken, voltooien en verwijderen.

U kunt webhook gebruiken met aangepaste spraak - en batchtranscriptie. Webhook is van toepassing op gegevenssets, eindpunten, evaluaties, modellen en transcripties.