Wat is spraakomzetting?

In dit artikel krijgt u informatie over de voordelen en mogelijkheden van de spraakomzettingsservice, waarmee spraak in realtime spraak naar spraak en spraak naar tekstomzetting van audiostreams mogelijk is.

Met behulp van de Speech SDK of Speech CLI kunt u uw toepassingen, hulpprogramma's en apparaten toegang geven tot brontranscripties en vertaaluitvoer voor de geleverde audio. Tussentijdse transcriptie- en vertaalresultaten worden geretourneerd als spraak wordt gedetecteerd en de uiteindelijke resultaten kunnen worden geconverteerd naar gesynthetiseerde spraak.

Zie Taal- en spraakondersteuning voor een lijst met talen die worden ondersteund voor spraakomzetting.

Kernfuncties

  • Spraak-naar-tekstomzetting met herkenningsresultaten.
  • Spraak-naar-spraakomzetting.
  • Ondersteuning voor vertaling naar meerdere doeltalen.
  • Tussentijdse herkenning en vertaalresultaten.

Aan de slag

Probeer als eerste stap de snelstartgids voor spraakomzetting. De spraakomzettingsservice is beschikbaar via de Speech SDK en de Speech CLI.

U vindt speech-SDK-spraak-naar-tekst- en vertaalvoorbeelden op GitHub. Deze voorbeelden hebben betrekking op veelvoorkomende scenario's, zoals het lezen van audio uit een bestand of stream, continue en eenmalige herkenning en vertaling, en het werken met aangepaste modellen.

Volgende stappen