Använda en pipeline för tal-till-text-transkription för att analysera inspelade konversationer

Azure AI Speech
Azure AI Language
Azure AI services
Azure Synapse Analytics
Azure Logic Apps

Taligenkänning och analys av inspelade kundsamtal kan ge ditt företag värdefull information om aktuella trender, produktbrister och framgångar.

Exempellösningen som beskrivs i den här artikeln beskriver en upprepningsbar pipeline för att transkribera och analysera konversationsdata.

Arkitektur

Arkitekturen består av två pipelines: En transkriptionspipeline för att konvertera ljud till text och en pipeline för berikning och visualisering.

Transkriptionspipeline

Diagram som illustrerar hur du matar in tal och konverterar det till text med hjälp av Azure AI-tjänster.

Ladda ned en Visio-fil med den här arkitekturen.

Dataflöde

  1. Ljudfiler laddas upp till ett Azure Storage-konto via valfri metod som stöds. Du kan använda ett gränssnittsbaserat verktyg som Azure Storage Explorer eller använda ett lagrings-SDK eller API.
  2. Uppladdningen till Azure Storage utlöser en Azure-logikapp. Logikappen får åtkomst till alla nödvändiga autentiseringsuppgifter i Azure Key Vault och skickar en begäran till Speech-tjänstens BATCH-transkriptions-API.
  3. Logikappen skickar ljudfilernas anrop till Speech-tjänsten, inklusive valfria inställningar för talardiarisering.
  4. Speech-tjänsten slutför batch-transkriptionen och läser in transkriptionsresultatet till lagringskontot.

Pipeline för berikande och visualisering

Diagram som illustrerar pipelinen för berikning och visualisering.

Ladda ned en Visio-fil med den här arkitekturen.

Dataflöde

  1. En Azure Synapse Analytics-pipeline körs för att hämta och bearbeta den transkriberade ljudtexten.
  2. Pipelinen skickar bearbetad text via ett API-anrop till språktjänsten. Tjänsten utför olika NLP-berikningar (natural language processing), till exempel sentiment- och åsiktsutvinning, sammanfattning och anpassad och fördefinierad namngiven entitetsigenkänning.
  3. Bearbetade data lagras i en Azure Synapse Analytics SQL-pool, där de kan hanteras till visualiseringsverktyg som Power BI.

Komponenter

  • Azure Blob Storage. Massivt skalbar och säker objektlagring för molnbaserade arbetsbelastningar, arkiv, datasjöar, databehandling med höga prestanda och maskininlärning. I den här lösningen lagrar den ljudfiler och transkriptionsresultat och fungerar som en datasjö för nedströmsanalys.
  • Azure Logic Apps. En integrationsplattform som en tjänst (iPaaS) som bygger på en containerbaserad körning. I den här lösningen integrerar den lagrings- och tal-AI-tjänster.
  • AI Speech-tjänsten. Ett AI-baserat API som tillhandahåller talfunktioner som tal till text, text till tal, talöversättning och talarigenkänning. Dess funktioner för batch-transkription används i den här lösningen.
  • AI-språk. En AI-baserad hanterad tjänst som tillhandahåller funktioner för naturligt språk som attitydanalys, entitetsextrahering och automatiserad frågesvar.
  • Azure Synapse Analytics. En uppsättning tjänster som tillhandahåller dataintegrering, informationslager för företag och stordataanalys. I den här lösningen transformerar och berikar den transkriptionsdata och hanterar data till nedströmsverktyg för visualisering.
  • Power BI. Ett verktyg för datamodellering och visuell analys. I den här lösningen presenteras transkriberade ljudinsikter för användare och beslutsfattare.

Alternativ

Här följer några alternativa metoder för den här lösningsarkitekturen:

  • Överväg att konfigurera Blob Storage-kontot så att det använder ett hierarkiskt namnområde. Den här konfigurationen ger åtkomstkontrollistor (ACL)-baserade säkerhetskontroller och kan förbättra prestanda för vissa stordataarbetsbelastningar.
  • Du kanske kan använda Azure Functions som ett kodindelad integreringsverktyg i stället för Logic Apps- eller Azure Synapse-pipelines, beroende på arbetsbelastningens storlek och skala.

Information om scenario

Kundtjänstcenter är en viktig del av framgångarna för många företag i många branscher. Den här lösningen använder Speech API från Azure AI-tjänster för ljudranskription och diarisering av inspelade kundsamtal. Azure Synapse Analytics används för att bearbeta och utföra NLP-uppgifter som attitydanalys och anpassad namngiven entitetsigenkänning via API-anrop till AI Language.

Du kan använda tjänsterna och pipelinen som beskrivs här för att bearbeta transkriberad text för att identifiera och ta bort känslig information, utföra attitydanalys med mera. Du kan skala tjänsterna och pipelinen för att hantera alla volymer av inspelade data.

Potentiella användningsfall

Den här lösningen kan ge mervärde till organisationer i många branscher, inklusive telekommunikation, finansiella tjänster och myndigheter. Det gäller alla organisationer som registrerar konversationer. I synnerhet kan kundriktade eller interna kundtjänster eller supportavdelning dra nytta av de insikter som härleds från den här lösningen.

Att tänka på

Dessa överväganden implementerar grundpelarna i Azure Well-Architected Framework, som är en uppsättning vägledande grundsatser som du kan använda för att förbättra kvaliteten på en arbetsbelastning. Mer information finns i Microsoft Azure Well-Architected Framework.

Säkerhet

Säkerhet ger garantier mot avsiktliga attacker och missbruk av dina värdefulla data och system. Mer information finns i Översikt över säkerhetspelare.

  • Begäran till Speech API kan innehålla en SAS-URI (Signatur för delad åtkomst) för en målcontainer i Azure Storage. En SAS-URI gör det möjligt för Speech-tjänsten att direkt mata ut transkriptionsfilerna till containerplatsen. Om din organisation inte tillåter användning av SAS-URI:er för lagring måste du implementera en funktion för att regelbundet avsöka Speech API för slutförda tillgångar.
  • Autentiseringsuppgifter som konto- eller API-nycklar ska lagras i Azure Key Vault som hemligheter. Konfigurera dina logikappar och Azure Synapse-pipelines för åtkomst till nyckelvalvet med hjälp av hanterade identiteter för att undvika att lagra hemligheter i programinställningar eller kod.
  • Ljudfilerna som lagras i bloben kan innehålla känsliga kunddata. Om flera klienter använder lösningen måste du begränsa åtkomsten till dessa filer. Använd hierarkiskt namnområde på lagringskontot och framtvinga behörigheter på mapp- och filnivå för att begränsa åtkomsten till den nödvändiga Microsoft Entra-instansen.

Kostnadsoptimering

Kostnadsoptimering handlar om att titta på sätt att minska onödiga utgifter och förbättra drifteffektiviteten. Mer information finns i Översikt över kostnadsoptimeringspelare.

Alla Azure-tjänster som beskrivs i den här arkitekturen är ett alternativ för fakturering med användningsbaserad betalning, så lösningskostnaderna skalas linjärt.

Azure Synapse tillhandahåller ett alternativ för serverlösa SQL-pooler, så att beräkningen för datalagerarbetsbelastningen kan ökas på begäran. Om du inte använder Azure Synapse för att hantera andra underordnade användningsfall kan du överväga att använda serverlös för att minska kostnaderna.

Mer strategier för kostnadsoptimering finns i Översikt över kostnadsoptimeringspelare .

Priser för de tjänster som föreslås här finns i den här uppskattningen i Priskalkylatorn för Azure.

Prestandaeffektivitet

Prestandaeffektivitet handlar om att effektivt skala arbetsbelastningen baserat på användarnas behov. Mer information finns i Översikt över grundpelare för prestandaeffektivitet.

Batch speech-API:et är utformat för stora volymer, men andra API:er för Azure AI-tjänster kan ha begärandegränser för varje prenumerationsnivå. Överväg att containerbearbeta dessa API:er för att undvika begränsning av bearbetning av stora volymer. Containrar ger dig flexibilitet i distributionen, i molnet eller lokalt. Du kan också minimera biverkningar av nya versionsdistributioner med hjälp av containrar. Mer information finns i Containersupport i Azure AI-tjänster.

Deltagare

Den här artikeln underhålls av Microsoft. Det har ursprungligen skrivits av följande medarbetare.

Huvudsakliga författare:

Annan deltagare:

Om du vill se icke-offentliga LinkedIn-profiler loggar du in på LinkedIn.

Nästa steg