REST API för tal till text
REST API för tal till text används för batch-transkription och anpassat tal.
Viktigt!
Tal till text REST API v3.2 är den senaste versionen som är allmänt tillgänglig. Förhandsversionerna 3.2-preview.1 och 3.2-preview.2* tas bort i september 2024. Tal till text REST API v3.1 dras tillbaka vid ett datum som ska tillkännages. Mer information om uppgradering finns i migreringsguiden för REST API v3.1 till v3.2 för tal till text. Tal till text REST API v3.0 dras tillbaka den 1 april 2026. Mer information om uppgradering finns i migreringsguiderna Speech to text REST API v3.0 till v3.1 och v3.1 till v3.2 .
Använd REST API för tal till text för att:
- Snabb transkription: Transkribera ljudfiler med återkommande resultat synkront och mycket snabbare än realtidsljud. Använd API:et för snabb transkription (/speechtotext/transkriptioner:transkribera) i de scenarier där du behöver avskriften av en ljudinspelning så snabbt som möjligt med förutsägbar svarstid, till exempel snabb transkription av ljud eller video eller videoöversättning.
- Anpassat tal: Ladda upp dina egna data, testa och träna en anpassad modell, jämför noggrannheten mellan modeller och distribuera en modell till en anpassad slutpunkt. Kopiera modeller till andra prenumerationer om du vill att kollegor ska ha åtkomst till en modell som du har skapat, eller om du vill distribuera en modell till mer än en region.
- Batch-transkription: Transkribera ljudfiler som en batch från flera URL:er eller en Azure-container.
REST API för tal till text innehåller sådana funktioner som:
- Hämta loggar för varje slutpunkt om loggar begärs för slutpunkten.
- Begär manifestet för de modeller som du skapar för att konfigurera lokala containrar.
- Ladda upp data från Azure Storage-konton med hjälp av en SAS-URI (signatur för delad åtkomst).
- Ta med ditt eget lagringsutrymme. Använd dina egna lagringskonton för loggar, transkriptionsfiler och andra data.
- Vissa åtgärder stöder webhook-meddelanden. Du kan registrera dina webhooks där meddelanden skickas.
Batch-transkription
Följande åtgärdsgrupper gäller för batch-transkription.
Åtgärdsgrupp | beskrivning |
---|---|
Modeller | Använd basmodeller eller anpassade modeller för att transkribera ljudfiler. Du kan använda modeller med anpassad tal - och batch-transkription. Du kan till exempel använda en modell som tränats med en specifik datauppsättning för att transkribera ljudfiler. Se Träna en modell och en anpassad talmodells livscykel för exempel på hur du tränar och hanterar anpassade talmodeller. |
Transkriptioner | Använd transkriptioner för att transkribera en stor mängd ljud i lagringen. När du använder batch-transkription skickar du flera filer per begäran eller pekar på en Azure Blob Storage-container med ljudfilerna som ska transkriberas. Se Skapa en transkription för exempel på hur du skapar en transkription från flera ljudfiler. |
Webbkrokar | Använd webbkrokar för att ta emot meddelanden om händelser för skapande, bearbetning, slutförande och borttagning. Du kan använda webbkrokar med anpassad tal - och batch-transkription. Webbkrokar gäller för datauppsättningar, slutpunkter, utvärderingar, modeller och transkriptioner. |
Anpassat tal
Följande åtgärdsgrupper gäller för anpassat tal.
Åtgärdsgrupp | beskrivning |
---|---|
Datauppsättningar | Använd datauppsättningar för att träna och testa anpassade talmodeller. Du kan till exempel jämföra prestandan för ett anpassat tal som tränats med en specifik datauppsättning med prestanda för en basmodell eller en anpassad talmodell som tränats med en annan datauppsättning. Se Ladda upp tränings- och testdatauppsättningar för exempel på hur du laddar upp datauppsättningar. |
Slutpunkter | Distribuera anpassade talmodeller till slutpunkter. Du måste distribuera en anpassad slutpunkt för att använda en anpassad talmodell . Se Distribuera en modell för exempel på hur du hanterar distributionsslutpunkter. |
Recensioner | Använd utvärderingar för att jämföra prestanda för olika modeller. Du kan till exempel jämföra prestandan för en anpassad talmodell som tränats med en specifik datauppsättning med prestanda för en basmodell eller en anpassad modell som tränats med en annan datauppsättning. Se testigenkänningens kvalitet och testnoggrannhet för exempel på hur du testar och utvärderar anpassade talmodeller. |
Modeller | Använd basmodeller eller anpassade modeller för att transkribera ljudfiler. Du kan använda modeller med anpassad tal - och batch-transkription. Du kan till exempel använda en modell som tränats med en specifik datauppsättning för att transkribera ljudfiler. Se Träna en modell och en anpassad talmodells livscykel för exempel på hur du tränar och hanterar anpassade talmodeller. |
Projekt | Använd projekt för att hantera anpassade talmodeller, träna och testa datauppsättningar och distributionsslutpunkter. Anpassade talprojekt innehåller modeller, träning och testning av datauppsättningar och distributionsslutpunkter. Varje projekt är specifikt för ett språk. Du kan till exempel skapa ett projekt för engelska i USA. Se Skapa ett projekt för exempel på hur du skapar projekt. |
Webbkrokar | Använd webbkrokar för att ta emot meddelanden om händelser för skapande, bearbetning, slutförande och borttagning. Du kan använda webbkrokar med anpassad tal - och batch-transkription. Webbkrokar gäller för datauppsättningar, slutpunkter, utvärderingar, modeller och transkriptioner. |
Service Health:
Ispravnost usluge ger insikter om tjänstens övergripande hälsa och underkomponenter. Mer information finns i Service Health .