Delen via


REST API voor spraak-naar-tekst

Rest API voor spraak-naar-tekst wordt gebruikt voor batchtranscriptie en aangepaste spraak.

Belangrijk

Spraak-naar-tekst REST API v3.2 is de nieuwste versie die algemeen beschikbaar is. Preview-versies 3.2-preview.1 en 3.2-preview.2* worden verwijderd in september 2024. Spraak-naar-tekst REST API v3.1 wordt buiten gebruik gesteld op een datum die moet worden aangekondigd. Zie de migratiehandleiding voor spraak-naar-tekst-REST API v3.1 naar v3.2 voor meer informatie over het upgraden. Spraak-naar-tekst-REST API v3.0 wordt op 1 april 2026 buiten gebruik gesteld. Zie de migratiehandleidingen voor spraak-naar-tekst-REST API v3.0 naar v3.1 en v3.1 naar v3.2 voor meer informatie over het upgraden.

Speech to text REST API gebruiken om:

  • Snelle transcriptie: Transcribeer audiobestanden met synchrone en veel snellere resultaten dan realtime audio. Gebruik de snelle transcriptie-API (/speechtotext/transcripties:transcribe) in de scenario's waarin u het transcript van een audio-opname zo snel mogelijk nodig hebt met voorspelbare latentie, zoals snelle audio- of videotranscriptie of videoomzetting.
  • Aangepaste spraak: Upload uw eigen gegevens, test en train een aangepast model, vergelijk de nauwkeurigheid tussen modellen en implementeer een model naar een aangepast eindpunt. Kopieer modellen naar andere abonnementen als u wilt dat collega's toegang hebben tot een model dat u hebt gemaakt of als u een model wilt implementeren in meer dan één regio.
  • Batchtranscriptie: audiobestanden transcriberen als een batch van meerdere URL's of een Azure-container.

De REST API voor spraak-naar-tekst bevat functies zoals:

  • Haal logboeken op voor elk eindpunt als er logboeken voor dat eindpunt worden aangevraagd.
  • Vraag het manifest aan van de modellen die u maakt om on-premises containers in te stellen.
  • Gegevens uploaden vanuit Azure-opslagaccounts met behulp van een SAS-URI (Shared Access Signature).
  • Bring your own storage. Gebruik uw eigen opslagaccounts voor logboeken, transcriptiebestanden en andere gegevens.
  • Sommige bewerkingen ondersteunen webhookmeldingen. U kunt uw webhooks registreren waar meldingen worden verzonden.

Batchtranscriptie

De volgende bewerkingsgroepen zijn van toepassing op batchtranscriptie.

Bewerkingsgroep Beschrijving
Modellen Gebruik basismodellen of aangepaste modellen om audiobestanden te transcriberen.

U kunt modellen gebruiken met aangepaste spraak - en batchtranscriptie. U kunt bijvoorbeeld een model gebruiken dat is getraind met een specifieke gegevensset om audiobestanden te transcriberen. Zie De levenscyclus van een model en een aangepast spraakmodel trainen voor voorbeelden van het trainen en beheren van aangepaste spraakmodellen.
Transcripties Gebruik transcripties om een grote hoeveelheid audio in opslag te transcriberen.

Wanneer u batchtranscriptie gebruikt, verzendt u meerdere bestanden per aanvraag of wijst u naar een Azure Blob Storage-container met de audiobestanden om te transcriberen. Zie Een transcriptie maken voor voorbeelden van het maken van een transcriptie van meerdere audiobestanden.
Webhook Gebruik webhook om meldingen te ontvangen over gebeurtenissen voor het maken, verwerken, voltooien en verwijderen.

U kunt webhook gebruiken met aangepaste spraak - en batchtranscriptie. Webhook is van toepassing op gegevenssets, eindpunten, evaluaties, modellen en transcripties.

Aangepaste spraak

De volgende bewerkingsgroepen zijn van toepassing op aangepaste spraak.

Bewerkingsgroep Beschrijving
Gegevenssets Gebruik gegevenssets om aangepaste spraakmodellen te trainen en te testen.

U kunt bijvoorbeeld de prestaties van een aangepaste spraak die is getraind met een specifieke gegevensset vergelijken met de prestaties van een basismodel of aangepast spraakmodel dat is getraind met een andere gegevensset. Zie Trainings- en testgegevenssets uploaden voor voorbeelden van het uploaden van gegevenssets.
Eindpunten Aangepaste spraakmodellen implementeren op eindpunten.

U moet een aangepast eindpunt implementeren om een aangepast spraakmodel te gebruiken. Zie Een model implementeren voor voorbeelden van het beheren van implementatie-eindpunten.
Evaluaties Gebruik evaluaties om de prestaties van verschillende modellen te vergelijken.

U kunt bijvoorbeeld de prestaties van een aangepast spraakmodel dat is getraind met een specifieke gegevensset vergelijken met de prestaties van een basismodel of een aangepast model dat is getraind met een andere gegevensset. Zie kwaliteit van testherkenning en testnauwkeurigheid voor voorbeelden van het testen en evalueren van aangepaste spraakmodellen.
Modellen Gebruik basismodellen of aangepaste modellen om audiobestanden te transcriberen.

U kunt modellen gebruiken met aangepaste spraak - en batchtranscriptie. U kunt bijvoorbeeld een model gebruiken dat is getraind met een specifieke gegevensset om audiobestanden te transcriberen. Zie De levenscyclus van een model en een aangepast spraakmodel trainen voor voorbeelden van het trainen en beheren van aangepaste spraakmodellen.
Projecten Gebruik projecten voor het beheren van aangepaste spraakmodellen, het trainen en testen van gegevenssets en implementatie-eindpunten.

Aangepaste spraakprojecten bevatten modellen, trainings- en testgegevenssets en implementatie-eindpunten. Elk project is specifiek voor een landinstelling. U kunt bijvoorbeeld een project voor Engels maken in de Verenigde Staten. Zie Een project maken voor voorbeelden van het maken van projecten.
Webhook Gebruik webhook om meldingen te ontvangen over gebeurtenissen voor het maken, verwerken, voltooien en verwijderen.

U kunt webhook gebruiken met aangepaste spraak - en batchtranscriptie. Webhook is van toepassing op gegevenssets, eindpunten, evaluaties, modellen en transcripties.

Status van service

Servicestatus geeft inzicht in de algehele status van de service en subonderdelen. Zie Service Health voor meer informatie.

Volgende stappen