Typer av tal-API-tjänster
Du kan använda Azure Cognitive Services Speech-tjänsten för att utföra omvandlingar av talat språk, inklusive tal till text, text till tal, talöversättning och talarigenkänning.
Anteckning
Använd Azure Cognitive Service for Language om du vill samla in insikter om termer eller fraser eller få detaljerad kontextuell analys av talat eller skriftligt språk.
Tjänster
- Tal till text kan konvertera ljudströmmar till text i realtid eller i batch.
- Text till tal gör det möjligt för program att konvertera text till mänskligt tal.
- Talöversättning ger tal till tal till tal och tal till text-översättning av ljudströmmar på flera språk.
Så här väljer du en taltjänst
Det här flödesdiagrammet kan hjälpa dig att välja den taltjänst som passar dina behov:
Till vänster i diagrammet visas ljud-till-ljud- eller ljud-till-text-processer.
- Tal till text används för att konvertera tal från en ljudkälla till ett textformat.
- Tal till tal används för att översätta tal på ett språk till tal på ett annat språk.
Till höger i diagrammet visas text-till-ljud-processer.
- Text till tal används för att generera talat ljud från en textkälla.
Vanliga användarsituationer
I följande tabell rekommenderas tjänster för vissa vanliga användningsfall.
Användningsfall | Tjänst att använda |
---|---|
Ange undertexter för inspelade eller livevideor | Tal till text |
Skapa en avskrift av ett telefonsamtal eller möte | Tal till text |
Implementera automatiserad anteckningsdiktering | Tal till text |
Fastställa avsedda användarindata för vidare bearbetning | Tal till text |
Generera talade svar på användarindata | Text till tal |
Skapa röstmenyer för telefonsystem | Text till tal |
Läsa e-post eller sms högt i handsfree-scenarier | Text till tal |
Sända meddelanden på offentliga platser, till exempel järnvägsstationer eller flygplatser | Text till tal |
Skapa textning i realtid för ett tal eller samtidig dubbelriktad översättning av en talad konversation | Tal till text |
Deltagare
Den här artikeln underhålls av Microsoft. Den skrevs ursprungligen av följande deltagare.
Huvudförfattare:
- Kruti Mehta | Azure Senior Fast-Track Engineer
- Oscar Shimabukuro | Senior Cloud Solution Architect
Andra deltagare:
- Mick Alberts | Teknisk författare
- Ashish Chahuan | Senior Cloud Solution Architect
- Brandon Cowen | Senior Cloud Solution Architect
- Manjit Singh | Programvarutekniker
- Christina Skarpathiotaki | Senior Cloud Solution Architect
- Nathan Widdup | Azure Senior Fast-Track Engineer
Om du vill se linkedin-profiler som inte är offentliga loggar du in på LinkedIn.
Nästa steg
- Vad är Speech Service?
- Blogginlägg om Api:er för tal
- Utbildningsväg: Etablera och hantera Azure Cognitive Services
- Utbildningsväg: Bearbeta och översätta tal med Azure Cognitive Speech Services
Relaterade resurser
Feedback
https://aka.ms/ContentUserFeedback.
Kommer snart: Under hela 2024 kommer vi att fasa ut GitHub-problem som feedbackmekanism för innehåll och ersätta det med ett nytt feedbacksystem. Mer information finns i:Skicka och visa feedback för