Partilhar via


Cliente de ingestão com serviços de IA do Azure

O Ingestion Client é uma ferramenta lançada pela Microsoft no GitHub que ajuda você a implantar rapidamente uma solução de transcrição de call center no Azure com uma abordagem sem código.

Gorjeta

Você pode usar a ferramenta e a solução resultante na produção para processar um alto volume de áudio.

O Ingestion Client usa o Azure AI Language, o Azure AI Speech, o armazenamento do Azure e o Azure Functions.

Comece a usar o Ingestion Client

Uma conta do Azure e um recurso de serviços de IA do Azure multisserviço são necessários para executar o Cliente de Ingestão.

  • Subscrição do Azure - Criar uma gratuitamente
  • Crie um recurso de serviços de IA do Azure no portal do Azure.
  • Obtenha a chave de recurso e a região. Depois que o recurso for implantado, selecione Ir para o recurso para exibir e gerenciar chaves. Para obter mais informações sobre os recursos dos serviços de IA do Azure, consulte este início rápido.

Recursos do cliente de ingestão

O Ingestion Client funciona conectando uma conta de armazenamento dedicada do Azure ao Azure Functions personalizado de forma sem servidor para passar solicitações de transcrição para o serviço. Os arquivos de áudio transcritos aterrissam no contêiner dedicado do Armazenamento do Azure.

Importante

O preço varia dependendo do modo de operação (lote vs tempo real), bem como da SKU da Função do Azure selecionada. Por padrão, a ferramenta criará uma SKU de Função Premium do Azure para lidar com grandes volumes. Visite a página Preços para obter mais informações.

Internamente, a ferramenta usa serviços de fala e linguagem e segue as práticas recomendadas para lidar com scale-up, novas tentativas e failover. O esquema a seguir descreve os recursos e conexões.

Diagrama que mostra a arquitetura do cliente de ingestão.

O seguinte recurso de serviço de fala é usado pelo cliente de ingestão:

  • Fala em lote para texto: transcreva grandes quantidades de arquivos de áudio de forma assíncrona, incluindo diarização de alto-falantes, e normalmente é usado em cenários de análise pós-chamada. Diarização é o processo de reconhecer e separar alto-falantes em dados de áudio monocanal.

Aqui estão alguns recursos de serviço de idioma que são usados pelo cliente de ingestão:

  • Extração e redação de Informações de Identificação Pessoal (PII): Identifique, categorize e retire informações confidenciais na transcrição da conversa.
  • Análise de sentimento e mineração de opinião: Analise transcrições e associe sentimentos positivos, neutros ou negativos no nível de enunciado e conversa.

Além dos serviços de IA do Azure, estes produtos do Azure são usados para concluir a solução:

  • Armazenamento do Azure: usado para armazenar dados de telefonia e as transcrições que a API de transcrição em lote retorna. Essa conta de armazenamento deve usar notificações, especificamente para quando novos arquivos são adicionados. Essas notificações são usadas para desencadear o processo de transcrição.
  • Azure Functions: usado para criar o URI de assinatura de acesso compartilhado (SAS) para cada gravação e acionar a solicitação HTTP POST para iniciar uma transcrição. Além disso, você usa o Azure Functions para criar solicitações para recuperar e excluir transcrições usando a API de transcrição em lote.

Personalização da ferramenta

A ferramenta é construída para mostrar resultados aos clientes rapidamente. Você pode personalizar a ferramenta para seus SKUs preferidos e configuração. As SKUs podem ser editadas no portal do Azure e o código em si está disponível no GitHub.

Nota

Sugerimos criar os recursos no mesmo grupo de recursos dedicado para entender e acompanhar os custos mais facilmente.

Próximos passos