Cliente de ingestão com serviços de IA do Azure
O Ingestion Client é uma ferramenta lançada pela Microsoft no GitHub que ajuda você a implantar rapidamente uma solução de transcrição de call center no Azure com uma abordagem sem código.
Gorjeta
Você pode usar a ferramenta e a solução resultante na produção para processar um alto volume de áudio.
O Ingestion Client usa o Azure AI Language, o Azure AI Speech, o armazenamento do Azure e o Azure Functions.
Comece a usar o Ingestion Client
Uma conta do Azure e um recurso de serviços de IA do Azure multisserviço são necessários para executar o Cliente de Ingestão.
- Subscrição do Azure - Criar uma gratuitamente
- Crie um recurso de serviços de IA do Azure no portal do Azure.
- Obtenha a chave de recurso e a região. Depois que o recurso for implantado, selecione Ir para o recurso para exibir e gerenciar chaves. Para obter mais informações sobre os recursos dos serviços de IA do Azure, consulte este início rápido.
Recursos do cliente de ingestão
O Ingestion Client funciona conectando uma conta de armazenamento dedicada do Azure ao Azure Functions personalizado de forma sem servidor para passar solicitações de transcrição para o serviço. Os arquivos de áudio transcritos aterrissam no contêiner dedicado do Armazenamento do Azure.
Importante
O preço varia dependendo do modo de operação (lote vs tempo real), bem como da SKU da Função do Azure selecionada. Por padrão, a ferramenta criará uma SKU de Função Premium do Azure para lidar com grandes volumes. Visite a página Preços para obter mais informações.
Internamente, a ferramenta usa serviços de fala e linguagem e segue as práticas recomendadas para lidar com scale-up, novas tentativas e failover. O esquema a seguir descreve os recursos e conexões.
O seguinte recurso de serviço de fala é usado pelo cliente de ingestão:
- Fala em lote para texto: transcreva grandes quantidades de arquivos de áudio de forma assíncrona, incluindo diarização de alto-falantes, e normalmente é usado em cenários de análise pós-chamada. Diarização é o processo de reconhecer e separar alto-falantes em dados de áudio monocanal.
Aqui estão alguns recursos de serviço de idioma que são usados pelo cliente de ingestão:
- Extração e redação de Informações de Identificação Pessoal (PII): Identifique, categorize e retire informações confidenciais na transcrição da conversa.
- Análise de sentimento e mineração de opinião: Analise transcrições e associe sentimentos positivos, neutros ou negativos no nível de enunciado e conversa.
Além dos serviços de IA do Azure, estes produtos do Azure são usados para concluir a solução:
- Armazenamento do Azure: usado para armazenar dados de telefonia e as transcrições que a API de transcrição em lote retorna. Essa conta de armazenamento deve usar notificações, especificamente para quando novos arquivos são adicionados. Essas notificações são usadas para desencadear o processo de transcrição.
- Azure Functions: usado para criar o URI de assinatura de acesso compartilhado (SAS) para cada gravação e acionar a solicitação HTTP POST para iniciar uma transcrição. Além disso, você usa o Azure Functions para criar solicitações para recuperar e excluir transcrições usando a API de transcrição em lote.
Personalização da ferramenta
A ferramenta é construída para mostrar resultados aos clientes rapidamente. Você pode personalizar a ferramenta para seus SKUs preferidos e configuração. As SKUs podem ser editadas no portal do Azure e o código em si está disponível no GitHub.
Nota
Sugerimos criar os recursos no mesmo grupo de recursos dedicado para entender e acompanhar os custos mais facilmente.