Azure Percept Audio descrição geral do dispositivo

Importante

Descontinuação do Azure Percept DK:

Atualização 22 de fevereiro de 2023: está agora disponível uma atualização de firmware para os componentes do acessório Percept DK Vision and Audio (também conhecido como SOM de Visão e Áudio) e permitirá que os componentes do acessório continuem a funcionar para além da data de descontinuação.

A pré-visualização pública do Azure Percept irá evoluir para suportar novas plataformas de dispositivos edge e experiências de programadores. Como parte desta evolução, o Azure Percept DK e o Acessório de Áudio e os serviços de suporte associados do Azure para o DK Percept serão descontinuados a 30 de março de 2023.

A partir de 30 de março de 2023, o DK do Azure Percept e o Acessório de Áudio deixarão de ser suportados por quaisquer serviços do Azure, incluindo Azure Percept Studio, atualizações do SO, atualizações de contentores, visualização do fluxo Web e integração de Visão Personalizada. A Microsoft deixará de fornecer suporte de sucesso ao cliente e quaisquer serviços de suporte associados. Para obter mais informações, visite a Mensagem de Blogue de Aviso de Extinção.

Azure Percept Audio é um dispositivo acessório que adiciona capacidades de IA de voz ao Azure Percept DK. Contém um processador de áudio pré-configurado e uma matriz linear de quatro microfones, permitindo-lhe utilizar comandos de voz, deteção de palavras-chave e voz de campo distante com a ajuda dos Serviços Cognitivos do Azure. Está integrado fora da caixa com o Azure Percept DK, Azure Percept Studio e outros serviços de gestão do Azure Edge.

Azure Percept Audio componentes

Azure Percept Audio contém os seguintes componentes principais:

  • Dispositivo Azure Percept Audio preparado para produção (SoM) com uma matriz linear de quatro microfones e processamento de áudio através do XMOS Codec
  • Quadro de programador (interposto): botões 2x, LEDs 3x, Micro USB e tomada de áudio de 3,5 mm
  • Cabos necessários: cabo FPC, Usb Micro Type-B para USB-A
  • Cartão de boas-vindas
  • Placa de montagem mecânica com montagem integrada da série 80/20 1010

Capacidades de computação

Azure Percept Audio transmite a entrada de áudio através da pilha de voz que é executada na CPU do quadro da operadora do Azure Percept DK de forma híbrida edge-cloud. Por conseguinte, Azure Percept Audio requer um quadro de transportadora com um SO que suporte a pilha de voz para poder realizar. ​

O processamento de áudio é feito da seguinte forma:

  • Azure Percept Audio: captura e converte o áudio e envia-o para o DK e tomada de áudio.

  • DK do Azure Percept: a pilha de voz executa a formação de feixes e o cancelamento de eco e processa o áudio recebido para otimizar a voz. Após o processamento, executa a deteção de palavras-chave.

  • Cloud: processa comandos e expressões de linguagem natural, verificação de palavras-chave e nova preparação. ​

  • Offline: se o dispositivo estiver offline, detetará a palavra-chave e capturará a telemetria do estado da ligação à Internet. Uma taxa de aceitação falsa aumentada para a deteção de palavras-chave pode ser observada, uma vez que não é possível efetuar a verificação de palavras-chave na cloud. ​

Introdução

Criar um protótipo sem código

Crie uma solução de voz sem código no Azure Percept Studio utilizar modelos de assistente de voz do Azure Percept para cenários de hospitalidade, cuidados de saúde, inventário e automóveis.

Gerir a sua solução de voz sem código

Informações técnicas adicionais