Wat is Speech Studio?

2025-03-10

Speech Studio is een set hulpprogramma's op basis van de gebruikersinterface voor het bouwen en integreren van functies van de Azure AI Speech-service in uw toepassingen. U maakt projecten in Speech Studio met behulp van een no-code-benadering en verwijst vervolgens naar deze assets in uw toepassingen met behulp van de Speech SDK, de Speech CLI of de REST API's.

Aanbeveling

U kunt ook spraak naar tekst en tekst naar spraak proberen in de Azure AI Foundry-portal zonder dat u code hoeft te registreren of te schrijven.

Speech Studio-scenario's

Verken, probeer en bekijk voorbeeldcode voor enkele veelvoorkomende gebruiksvoorbeelden.

Bijschriften: kies een voorbeeldvideoclip om realtime of offline verwerkte bijschriftresultaten te bekijken. Meer informatie over het synchroniseren van bijschriften met uw invoeraudio, het toepassen van scheldfilters, het verkrijgen van gedeeltelijke resultaten, het toepassen van aanpassingen en het identificeren van gesproken talen voor meertalige scenario's. Zie de quickstart voor bijschriften voor meer informatie.
Callcenter: Bekijk een demonstratie over het gebruik van de taal- en spraakservices om gesprekken in het gesprekscentrum te analyseren. U kunt aanroepen in realtime transcriberen of een batch aan aanroepen verwerken, persoonlijke identificatiegegevens redacteren en inzichten extraheren, zoals sentiment om u te helpen met de use-case van uw callcenter. Zie de quickstart voor het callcenter voor meer informatie.

Bekijk deze inleidende video voor een demonstratie van deze scenario's in Speech Studio.

Speech Studio-functies

In Speech Studio zijn de volgende functies van de Speech-service beschikbaar als projecttypen:

Realtime spraak naar tekst: Snel spraak naar tekst testen door audiobestanden hier te slepen zonder code te hoeven gebruiken. Speech Studio heeft een demoprogramma om te zien hoe spraak-naar-tekst werkt in uw audiovoorbeelden. Als u de volledige functionaliteit wilt verkennen, raadpleegt u Wat is spraak-naar-tekst.
Batch-spraak naar tekst: Test snel de mogelijkheden voor batchtranscriptie om een grote hoeveelheid audio in de opslag te transcriberen en asynchroon resultaten te ontvangen. Zie Het overzicht van Batch-spraak naar tekst voor meer informatie over Batch-spraak-naar-tekst.
Aangepaste spraak: Maak spraakherkenningsmodellen die zijn afgestemd op specifieke vocabulairesets en -stijlen voor spreken. In tegenstelling tot het basismodel voor spraakherkenning worden aangepaste spraakmodellen onderdeel van uw unieke concurrentievoordeel omdat ze niet openbaar toegankelijk zijn. Zie Trainings- en testgegevenssets uploaden om voorbeeldaudio te uploaden om een aangepast spraakmodel te maken.
Uitspraakbeoordeling: Evalueer de uitspraak van de spraak en geef sprekers feedback over de nauwkeurigheid en de vloeiendheid van gesproken audio. Speech Studio biedt een sandbox voor het snel testen van deze functie, zonder code. Als u de functie wilt gebruiken met de Speech SDK in uw toepassingen, raadpleegt u het artikel Uitspraakbeoordeling .
Spraakomzetting: test en vertaal spraak snel in andere talen van uw keuze met lage latentie. Als u de volledige functionaliteit wilt verkennen, raadpleegt u Wat is spraakomzetting.
Spraakgalerie: apps en services bouwen die op natuurlijke wijze spreken. Kies uit een breed portfolio met talen, stemmen en varianten. Breng uw scenario's tot leven met zeer expressieve en menselijke neurale stemmen.
Aangepaste stem: maak aangepaste, een-op-een-soort stemmen voor tekst naar spraak. U levert audiobestanden en maakt overeenkomende transcripties in Speech Studio en gebruikt vervolgens de aangepaste stemmen in uw toepassingen. Als u aangepaste stemmen wilt maken en gebruiken via eindpunten, raadpleegt u Uw spraakmodel maken en gebruiken.
Audio-inhoud maken: een aanpak zonder code voor tekst-naar-spraaksynthese. U kunt de uitvoeraudio als zodanig gebruiken of als uitgangspunt voor verdere aanpassing. U kunt zeer natuurlijke audio-inhoud bouwen voor verschillende scenario's, zoals audioboeken, nieuwsuitzendingen, video-gesproken tekst en chatbots. Zie de documentatie voor het maken van audio-inhoud voor meer informatie.
Aangepast trefwoord: een aangepast trefwoord is een woord of korte woordgroep die u kunt gebruiken om een product te activeren. U maakt een aangepast trefwoord in Speech Studio en genereert vervolgens een binair bestand voor gebruik met de Speech SDK in uw toepassingen.

Volgende stappen

Speech Studio verkennen

Delen via

Wat is Speech Studio?

Speech Studio-scenario's

Speech Studio-functies

Volgende stappen

Feedback

Aanvullende resources