REST API voor spraak-naar-tekst

2025-05-25

Rest API voor spraak-naar-tekst wordt gebruikt voor batchtranscriptie en aangepaste spraak.

Belangrijk

Rest API-versie 2024-11-15 voor spraak-naar-tekst is de nieuwste versie die algemeen beschikbaar is.

De REST API-versie2024-05-15-preview voor spraak-naar-tekst wordt buiten gebruik gesteld op een datum die moet worden aangekondigd.
Spraak-naar-tekst-REST APIv3.0, v3.1, , v3.23.2-preview.1en 3.2-preview.2 wordt buiten gebruik gesteld op 31 maart 2026.

Zie de migratiehandleidingen Speech to text rest API v3.0 naar v3.1, v3.1 naar v3.2 en v3.2 naar 2024-11-15 voor meer informatie over het upgraden.

Raadpleeg de naslagdocumentatie voor spraak-naar-tekst-REST API 2024-11-15

Speech to text REST API gebruiken om:

Snelle transcriptie: Transcribeer audiobestanden met synchrone en veel snellere resultaten dan realtime audio. Gebruik de snelle transcriptie-API (/speechtotext/transcripties:transcribe) in de scenario's waarin u het transcript van een audio-opname zo snel mogelijk nodig hebt met voorspelbare latentie, zoals snelle audio- of videotranscriptie of videoomzetting.
Batchtranscriptie: audiobestanden transcriberen als een batch van meerdere URL's of een Azure-container. Gebruik de batchtranscriptie-API (/speechtotext/transcripties:submit) in de scenario's die u nodig hebt om een grote hoeveelheid audio in opslag te transcriberen, zoals een groot aantal bestanden of een lang audiobestand.
Aangepaste spraak: Upload uw eigen gegevens, test en train een aangepast model, vergelijk de nauwkeurigheid tussen modellen en implementeer een model naar een aangepast eindpunt. Kopieer modellen naar andere abonnementen als u wilt dat collega's toegang hebben tot een model dat u hebt gemaakt of als u een model wilt implementeren in meer dan één regio.

De REST API voor spraak-naar-tekst bevat functies zoals:

Aanvraaglogboeken voor elk eindpunt.
Vraag het manifest aan van de modellen die u maakt om on-premises containers in te stellen.
Gegevens uploaden vanuit Azure-opslagaccounts met behulp van een SAS-URI (Shared Access Signature).
Breng je eigen opslag mee. Gebruik uw eigen opslagaccounts voor logboeken, transcriptiebestanden en andere gegevens.
Sommige bewerkingen ondersteunen webhookmeldingen. U kunt uw webhooks registreren waar meldingen worden verzonden.

Snelle transcriptie

De volgende bewerkingsgroepen zijn van toepassing op snelle transcriptie.

Bewerkingsgroep	Beschrijving
Transcripties	Gebruik Transcripties - Transcribe om audiobestanden te transcriberen. Wanneer u snelle transcriptie gebruikt, verzendt u één bestand per aanvraag. Zie Een transcriptie maken voor voorbeelden van het maken van een transcriptie van één audiobestand.

Batchtranscriptie

De volgende bewerkingsgroepen zijn van toepassing op batchtranscriptie.

Bewerkingsgroep	Beschrijving
Modellen	Gebruik basismodellen of aangepaste modellen om audiobestanden te transcriberen. U kunt modellen gebruiken met aangepaste spraak - en batchtranscriptie. U kunt bijvoorbeeld een model gebruiken dat is getraind met een specifieke gegevensset om audiobestanden te transcriberen. Zie De levenscyclus van een model en een aangepast spraakmodel trainen voor voorbeelden van het trainen en beheren van aangepaste spraakmodellen.
Transcripties	Gebruik Transcripties - Verzenden om een grote hoeveelheid opgeslagen audio te transcriberen. Wanneer u batchtranscriptie gebruikt, verzendt u meerdere bestanden per aanvraag of wijst u naar een Azure Blob Storage-container met de audiobestanden om te transcriberen. Zie Een transcriptie maken voor voorbeelden van het maken van een transcriptie van meerdere audiobestanden.
Webhook	Gebruik webhook om meldingen te ontvangen over gebeurtenissen voor het maken, verwerken, voltooien en verwijderen. U kunt webhook gebruiken met aangepaste spraak - en batchtranscriptie. Webhook is van toepassing op gegevenssets, eindpunten , evaluaties, modellen en transcripties.

Aangepaste spraak

De volgende bewerkingsgroepen zijn van toepassing op aangepaste spraak.

Bewerkingsgroep	Beschrijving
Gegevenssets	Gebruik gegevenssets om aangepaste spraakmodellen te trainen en te testen. U kunt bijvoorbeeld de prestaties van een aangepaste spraak die is getraind met een specifieke gegevensset vergelijken met de prestaties van een basismodel of aangepast spraakmodel dat is getraind met een andere gegevensset. Zie Trainings- en testgegevenssets uploaden voor voorbeelden van het uploaden van gegevenssets.
Eindpunten	Aangepaste spraakmodellen implementeren op eindpunten. U moet een aangepast eindpunt implementeren om een aangepast spraakmodel te gebruiken. Zie Een model implementeren voor voorbeelden van het beheren van implementatie-eindpunten.
Evaluaties	Gebruik evaluaties om de prestaties van verschillende modellen te vergelijken. U kunt bijvoorbeeld de prestaties van een aangepast spraakmodel dat is getraind met een specifieke gegevensset vergelijken met de prestaties van een basismodel of een aangepast model dat is getraind met een andere gegevensset. Zie kwaliteit van testherkenning en testnauwkeurigheid voor voorbeelden van het testen en evalueren van aangepaste spraakmodellen.
Modellen	Gebruik basismodellen of aangepaste modellen om audiobestanden te transcriberen. U kunt modellen gebruiken met aangepaste spraak - en batchtranscriptie. U kunt bijvoorbeeld een model gebruiken dat is getraind met een specifieke gegevensset om audiobestanden te transcriberen. Zie De levenscyclus van een model en een aangepast spraakmodel trainen voor voorbeelden van het trainen en beheren van aangepaste spraakmodellen.
Webhook	Gebruik webhook om meldingen te ontvangen over gebeurtenissen voor het maken, verwerken, voltooien en verwijderen. U kunt webhook gebruiken met aangepaste spraak - en batchtranscriptie. Webhook is van toepassing op gegevenssets, eindpunten , evaluaties, modellen en transcripties.

Delen via

REST API voor spraak-naar-tekst

Snelle transcriptie

Batchtranscriptie

Aangepaste spraak

Verwante inhoud

Feedback

Aanvullende resources