Testes em lote com um conjunto de exemplos de enunciados

Artigo
09/03/2024

Importante

O LUIS será desativado em 1º de outubro de 2025 e, a partir de 1º de abril de 2023, você não poderá criar novos recursos do LUIS. É recomendável migrar seus aplicativos LUIS para a compreensão da linguagem coloquial a fim de usufruir do suporte contínuo ao produto e dos recursos multilíngues.

O teste em lote valida a versão do modelo ativo treinado para medir a precisão da previsão. Um teste em lote ajuda a exibir a precisão de cada intenção e entidade na versão ativa. Examine os resultados do teste em lote para tomar a devida ação para melhorar a precisão, como adicionar mais enunciados de exemplo a uma intenção, caso seu aplicativo falhe com frequência ao identificar a intenção correta ou ao rotular entidades no enunciado.

Agrupar dados para o teste em lote

É importante que as declarações usadas para o teste em lote sejam novas no LUIS. Caso tenha um conjunto de dados de enunciados, divida-os em três conjuntos: enunciados exemplo adicionados para uma intenção, enunciados recebidos do ponto de extremidade publicado e enunciados usados para testar em lote o LUIS depois dele ser treinado.

O arquivo em lotes JSON usados deve incluir enunciados com as entidades de machine learning de nível superior rotuladas, incluindo as posições inicial e final. Os enunciados não devem fazer parte dos exemplos já existentes no aplicativo. Eles devem ser enunciados dos quais você deseja prever positivamente a intenção e as entidades.

Você pode separar os testes por intenção e/ou entidade ou ter todos os testes (até 1.000 enunciados) no mesmo arquivo.

Erros comuns ao importar um lote

Caso encontre erros ao carregar o arquivo em lotes para o LUIS, verifique os seguintes problemas comuns:

Mais de 1.000 enunciados em um arquivo em lotes
Um objeto JSON de declaração que não tem uma propriedade de entidades. A propriedade pode ser uma matriz vazia.
Palavra(s) rotulada(s) em várias entidades
Rótulo de entidade com espaço inicial ou final.

Corrigindo erros em lote

Se houver erros no teste em lote, você poderá adicionar mais declarações a uma intenção e/ou rotular mais declarações com a entidade para ajudar o LUIS a diferenciar as intenções. Se você adicionou declarações, rotulou e ainda recebe erros de previsão no teste em lote, considere adicionar um recurso de lista de frases com um vocabulário específico do domínio para ajudar o LUIS a aprender mais rápido.

Portal do LUIS
REST API

Testes em lotes usando o portal do LUIS

Importar e treinar um aplicativo de exemplo

Importe um aplicativo que recebe um pedido de pizza, como 1 pepperoni pizza on thin crust.

Baixe e salve o arquivo JSON do aplicativo.
Entre no portal do LUIS selecione sua Assinatura e Recurso de criação para ver os aplicativos atribuídos a esse recurso.
Selecione a seta ao lado de Novo aplicativo e clique em Importar como JSON para importar o JSON em um novo aplicativo. Dê um nome ao aplicativo Pizza app.
Selecione Treinar no canto superior direito da navegação para treinar o aplicativo.

Funções em testes em lote

Cuidado

As funções de entidade não são suportadas em testes em lote.

Arquivo de teste em lote

O JSON de exemplo inclui um enunciado com uma entidade rotulada para ilustrar a aparência de um arquivo de teste. Em seus testes, você deverá ter muitos enunciados com a intenção correta e a entidade de aprendizado de máquina rotulada.

Crie pizza-with-machine-learned-entity-test.json em um editor de texto ou baixe-o.

No arquivo em lotes formatado em JSON, adicione um enunciado com a Intenção que deseja prever no teste.

[
    {
        "text": "I want to pick up 1 cheese pizza",
        "intent": "ModifyOrder",
        "entities": [
            {
                "entity": "Order",
                "startPos": 18,
                "endPos": 31
            },
            {
                "entity": "ToppingList",
                "startPos": 20,
                "endPos": 25
            }
        ]
    }
]

Executar o lote

Selecione Testar na barra de navegação superior.
Selecione Painel de teste do lote no painel direito.
Selecione Importar. Na caixa de diálogo exibida, selecione Escolher Arquivo e localize um arquivo JSON com o formato JSON correto, que contenha no máximo 1.000 enunciados para testar.

Erros de importação são relatados em uma barra de notificação vermelha na parte superior do navegador. Quando uma importação tem erros, nenhum conjunto de dados é criado. Para obter mais informações, confira Erros comuns.
Escolha o local do arquivo do pizza-with-machine-learned-entity-test.json.
Nomeie o conjunto de dados pizza test e selecione Concluído.
Selecione o botão Executar.

Depois que o teste em lotes for concluído, você poderá ver as seguintes colunas:

Coluna	Descrição
Estado	Status do teste. Ver resultados fica visíveis somente após a conclusão do teste.
Name	O nome que você atribuiu ao teste.
Tamanho	Número de testes neste arquivo de teste do lote.
Última Execução	Data da última execução deste arquivo de teste do lote.
Último resultado	Número de previsões bem-sucedidas no teste.

Para exibir os resultados detalhados do teste, escolha Ver resultados.
Dica
- A seleção de Download baixará o mesmo arquivo que foi carregado.
- Caso o teste em lote falhe, pelo menos uma intenção de enunciado não correspondeu à previsão.

Examinar as intenções dos resultados do lote

Para examinar os resultados de teste de lote, selecione Ver resultados. Os resultados de teste mostram graficamente como os enunciados de teste foram previstos em relação à versão ativa.

O gráfico do lote exibe quatro quadrantes dos resultados. À direita do gráfico, há um filtro. O filtro contém intenções e entidades. Ao selecionar uma seção do gráfico ou um ponto dentro do gráfico, os enunciados associados são exibidos abaixo do gráfico.

Ao passar o mouse sobre o gráfico, um botão de rolagem do mouse pode ampliar ou reduzir a exibição no gráfico. Isso é útil quando há muitos pontos no gráfico agrupados em conjunto.

O gráfico está em quatro quadrantes, com duas das seções exibidas em vermelho.

Selecione a intenção ModifyOrder na lista de filtros. O enunciado é previsto como um verdadeiro positivo, o que significa que o enunciado correspondeu com êxito à previsão positiva listada no arquivo em lotes.

As marcas de seleção verdes na lista de filtros também indicam o sucesso do teste para cada intenção. Todas as outras intenções são listadas com uma pontuação positiva de 1/1, porque o enunciado foi testado em relação a cada intenção, como um teste negativo para as intenções não listadas no teste em lotes.
Selecione a intenção Confirmação. Essa intenção não está listada no teste em lotes e, portanto, esse é um teste negativo do enunciado listado no teste em lotes.

O teste negativo foi bem-sucedido, conforme observado com o texto verde no filtro e na grade.

Examinar as entidades nos resultados de teste em lotes

A entidade ModifyOrder, como uma entidade de computador com subentidades, é exibida se a entidade de nível superior corresponder e como as subentidades são previstas.

Selecione a entidade ModifyOrder na lista de filtros e, em seguida, selecione o círculo na grade.
A previsão de entidade é exibida abaixo do gráfico. A exibição inclui linhas sólidas para previsões que correspondem à expectativa e linhas pontilhadas para previsões que não correspondem à expectativa.

Filtrar resultados do gráfico

Para filtrar o gráfico por uma intenção ou entidade específica, selecione a intenção ou entidade no painel de filtragem direito. Os pontos de dados e sua distribuição são atualizados no grafo de acordo com sua seleção.

Resultado do teste de lote visualizado

Exemplos de resultados do gráfico

No gráfico no portal do LUIS, é possível as seguintes ações:

Exibir dados de declaração de ponto único

No gráfico, passe o mouse sobre um ponto de dados para ver a pontuação de certeza de sua previsão. Selecione um ponto de dados para recuperar sua declaração correspondente na lista de declarações na parte inferior da página.

Declaração selecionada

Exibir dados de seção

No gráfico de quatro seções, selecione o nome da seção, como Falso Positivo na parte superior direita do gráfico. Embaixo do gráfico, todas as declarações nessa seção são exibidas embaixo do gráfico em uma lista.

Declarações selecionadas por seção

Nesta imagem anterior, a declaração switch on é rotulada com a intenção TurnAllOn, mas recebeu a previsão de Nenhuma intenção. Essa é uma indicação de que a intenção TurnAllOn precisa de mais declarações de exemplo para criar a previsão esperada.

As duas seções do gráfico em vermelho indicam declarações que não corresponderam à previsão esperada. Elas indicam declarações de que o LUIS precisa de mais treinamento.

As duas seções do gráfico em verde corresponderam à previsão esperada.

Testes em lote usando a API REST

O LUIS permite testar em lote usando o portal do LUIS e a API REST. Os pontos de extremidade para a API REST estão listados abaixo. Para obter informações sobre testes em lotes usando o portal do LUIS, consulte Tutorial: conjuntos de dados de teste em lote. Use as URLs completas abaixo, substituindo o espaço reservado por sua própria chave de Previsão e ponto de extremidade do LUIS.

Lembre-se de adicionar a chave LUIS ao Ocp-Apim-Subscription-Key no cabeçalho e definir Content-Type como application/json.

Iniciar um teste em lote

Inicie um teste em lote usando uma ID de versão do aplicativo ou um slot de publicação. Envie uma solicitação POST para um dos seguintes formatos de ponto de extremidade. Inclua o arquivo em lotes no corpo da solicitação.

Slot de publicação

<YOUR-PREDICTION-ENDPOINT>/luis/v3.0-preview/apps/<YOUR-APP-ID>/slots/<YOUR-SLOT-NAME>/evaluations

ID de versão do aplicativo

<YOUR-PREDICTION-ENDPOINT>/luis/v3.0-preview/apps/<YOUR-APP-ID>/versions/<YOUR-APP-VERSION-ID>/evaluations

Esses pontos de extremidade retornarão uma ID de operação que será usada para verificar o status e obter os resultados.

Obter o status de um teste em lotes em andamento

Use a ID da operação do teste em lotes iniciada para obter o status dos seguintes formatos de ponto de extremidade:

Slot de publicação

<YOUR-PREDICTION-ENDPOINT>/luis/v3.0-preview/apps/<YOUR-APP-ID>/slots/<YOUR-SLOT-ID>/evaluations/<YOUR-OPERATION-ID>/status

ID de versão do aplicativo

<YOUR-PREDICTION-ENDPOINT>/luis/v3.0-preview/apps/<YOUR-APP-ID>/versions/<YOUR-APP-VERSION-ID>/evaluations/<YOUR-OPERATION-ID>/status

Obter os resultados de um teste em lotes

Use a ID da operação do teste em lotes iniciada para obter os resultados dos seguintes formatos de ponto de extremidade:

Slot de publicação

<YOUR-PREDICTION-ENDPOINT>/luis/v3.0-preview/apps/<YOUR-APP-ID>/slots/<YOUR-SLOT-ID>/evaluations/<YOUR-OPERATION-ID>/result

ID de versão do aplicativo

<YOUR-PREDICTION-ENDPOINT>/luis/v3.0-preview/apps/<YOUR-APP-ID>/versions/<YOUR-APP-VERSION-ID>/evaluations/<YOUR-OPERATION-ID>/result

Arquivo em lotes de enunciados

Envie um arquivo de enunciado em lote, conhecido como conjunto de dados, para o teste em lotes. O conjunto de dados é um arquivo no formato JSON que contém um máximo de 1.000 enunciados rotulados. É possível testar até 10 conjuntos de dados em um aplicativo. Caso seja preciso testar mais, exclua um conjunto de dados e adicione um novo. Todas as entidades personalizadas no modelo aparecem no filtro de entidades de teste de lote, mesmo se não houver nenhuma entidade correspondente nos dados do arquivo em lotes.

O arquivo em lote consiste em declarações. Cada enunciado deve ter uma previsão de intenção esperada junto com qualquer entidade de machine learning que se espera detectar.

Modelo de sintaxe em lote para intenções com entidades

Use o modelo a seguir para iniciar o arquivo em lotes:

{
    "LabeledTestSetUtterances": [
        {
            "text": "play a song",
            "intent": "play_music",
            "entities": [
                {
                    "entity": "song_parent",
                    "startPos": 0,
                    "endPos": 15,
                    "children": [
                        {
                            "entity": "pre_song",
                            "startPos": 0,
                            "endPos": 3
                        },
                        {
                            "entity": "song_info",
                            "startPos": 5,
                            "endPos": 15
                        }
                    ]
                }
            ]
        }
    ]
}

O arquivo em lotes usa as propriedades startPos e endPos para observar o início e o fim de uma entidade. Os valores são baseados em zero e não devem iniciar ou terminar em um espaço. Isso é diferente dos logs de consulta, que usam as propriedades startIndex e endIndex.

Se você não deseja testar entidades, inclua a propriedade entities e defina o valor como uma matriz vazia, [].

Resultados do teste em lotes da API REST

Há vários objetos retornados pela API:

Informações sobre os modelos de intenções e entidades, como precisão, Recall e pontuação F.
Informações sobre os modelos de entidades, como precisão, Recall e pontuação F para cada entidade
- Usando o sinalizador verbose, é possível obter mais informações sobre a entidade, como entityTextFScore e entityTypeFScore.
Enunciados fornecidos com os nomes de intenção previstos e rotulados
Uma lista de entidades positivas falsas e uma lista de entidades negativas falsas.

Próximas etapas

Se o teste indica que seu aplicativo LUIS não reconhece as intenções e entidades corretas, é possível trabalhar para melhorar o desempenho do seu aplicativo LUIS rotulando mais declarações ou adicionando recursos.

Compartilhar via

Testes em lote com um conjunto de exemplos de enunciados

Agrupar dados para o teste em lote

Erros comuns ao importar um lote

Corrigindo erros em lote

Testes em lotes usando o portal do LUIS

Importar e treinar um aplicativo de exemplo

Funções em testes em lote

Arquivo de teste em lote

Executar o lote

Examinar as intenções dos resultados do lote

Examinar as entidades nos resultados de teste em lotes

Filtrar resultados do gráfico

Exemplos de resultados do gráfico

Exibir dados de declaração de ponto único

Exibir dados de seção

Testes em lote usando a API REST

Iniciar um teste em lote

Obter o status de um teste em lotes em andamento

Obter os resultados de um teste em lotes

Arquivo em lotes de enunciados

Modelo de sintaxe em lote para intenções com entidades

Resultados do teste em lotes da API REST

Próximas etapas

Recursos adicionais