REST API voor spraak-naar-tekst

Rest API voor spraak-naar-tekst wordt gebruikt voor batchtranscriptie en aangepaste spraak.

Belangrijk

Rest API v3.2 voor spraak-naar-tekst is beschikbaar in de preview-versie. Spraak-naar-tekst REST API v3.1 is algemeen beschikbaar. Spraak-naar-tekst-REST API v3.0 wordt op 1 april 2026 buiten gebruik gesteld. Zie de migratiehandleidingen spraak-naar-tekst-REST API v3.0 naar v3.1 en v3.1 naar v3.2 voor meer informatie.

Speech to text REST API gebruiken om:

  • Aangepaste spraak: Met aangepaste spraak kunt u uw eigen gegevens uploaden, een aangepast model testen en trainen, de nauwkeurigheid tussen modellen vergelijken en een model implementeren op een aangepast eindpunt. Kopieer modellen naar andere abonnementen als u wilt dat collega's toegang hebben tot een model dat u hebt gemaakt of als u een model wilt implementeren in meer dan één regio.
  • Batchtranscriptie: audiobestanden transcriberen als een batch van meerdere URL's of een Azure-container.

De REST API voor spraak-naar-tekst bevat functies zoals:

  • Haal logboeken op voor elk eindpunt als er logboeken voor dat eindpunt worden aangevraagd.
  • Vraag het manifest aan van de modellen die u maakt om on-premises containers in te stellen.
  • Gegevens uploaden vanuit Azure-opslagaccounts met behulp van een SAS-URI (Shared Access Signature).
  • Bring your own storage. Gebruik uw eigen opslagaccounts voor logboeken, transcriptiebestanden en andere gegevens.
  • Sommige bewerkingen ondersteunen webhookmeldingen. U kunt uw webhooks registreren waar meldingen worden verzonden.

Batchtranscriptie

De volgende bewerkingsgroepen zijn van toepassing op batchtranscriptie.

Bewerkingsgroep Beschrijving
Modellen Gebruik basismodellen of aangepaste modellen om audiobestanden te transcriberen.

U kunt modellen gebruiken met aangepaste spraak - en batchtranscriptie. U kunt bijvoorbeeld een model gebruiken dat is getraind met een specifieke gegevensset om audiobestanden te transcriberen. Zie De levenscyclus van een model en een aangepast spraakmodel trainen voor voorbeelden van het trainen en beheren van aangepaste spraakmodellen.
Transcripties Gebruik transcripties om een grote hoeveelheid audio in opslag te transcriberen.

Wanneer u batchtranscriptie gebruikt, verzendt u meerdere bestanden per aanvraag of wijst u naar een Azure Blob Storage-container met de audiobestanden om te transcriberen. Zie Een transcriptie maken voor voorbeelden van het maken van een transcriptie van meerdere audiobestanden.
Webhook Gebruik webhook om meldingen te ontvangen over gebeurtenissen voor het maken, verwerken, voltooien en verwijderen.

U kunt webhook gebruiken met aangepaste spraak - en batchtranscriptie. Webhook is van toepassing op gegevenssets, eindpunten, evaluaties, modellen en transcripties.

Aangepaste spraak

De volgende bewerkingsgroepen zijn van toepassing op aangepaste spraak.

Bewerkingsgroep Beschrijving
Gegevenssets Gebruik gegevenssets om aangepaste spraakmodellen te trainen en te testen.

U kunt bijvoorbeeld de prestaties van een aangepaste spraak die is getraind met een specifieke gegevensset vergelijken met de prestaties van een basismodel of aangepast spraakmodel dat is getraind met een andere gegevensset. Zie Trainings- en testgegevenssets uploaden voor voorbeelden van het uploaden van gegevenssets.
Eindpunten Aangepaste spraakmodellen implementeren op eindpunten.

U moet een aangepast eindpunt implementeren om een aangepast spraakmodel te gebruiken. Zie Een model implementeren voor voorbeelden van het beheren van implementatie-eindpunten.
Evaluaties Gebruik evaluaties om de prestaties van verschillende modellen te vergelijken.

U kunt bijvoorbeeld de prestaties van een aangepast spraakmodel dat is getraind met een specifieke gegevensset vergelijken met de prestaties van een basismodel of een aangepast model dat is getraind met een andere gegevensset. Zie kwaliteit van testherkenning en testnauwkeurigheid voor voorbeelden van het testen en evalueren van aangepaste spraakmodellen.
Modellen Gebruik basismodellen of aangepaste modellen om audiobestanden te transcriberen.

U kunt modellen gebruiken met aangepaste spraak - en batchtranscriptie. U kunt bijvoorbeeld een model gebruiken dat is getraind met een specifieke gegevensset om audiobestanden te transcriberen. Zie De levenscyclus van een model en een aangepast spraakmodel trainen voor voorbeelden van het trainen en beheren van aangepaste spraakmodellen.
Projecten Gebruik projecten voor het beheren van aangepaste spraakmodellen, het trainen en testen van gegevenssets en implementatie-eindpunten.

Aangepaste spraakprojecten bevatten modellen, trainings- en testgegevenssets en implementatie-eindpunten. Elk project is specifiek voor een landinstelling. U kunt bijvoorbeeld een project voor Engels maken in de Verenigde Staten. Zie Een project maken voor voorbeelden van het maken van projecten.
Webhook Gebruik webhook om meldingen te ontvangen over gebeurtenissen voor het maken, verwerken, voltooien en verwijderen.

U kunt webhook gebruiken met aangepaste spraak - en batchtranscriptie. Webhook is van toepassing op gegevenssets, eindpunten, evaluaties, modellen en transcripties.

Status van service

Servicestatus geeft inzicht in de algehele status van de service en subonderdelen. Zie Service Health voor meer informatie.

Volgende stappen