Glossário de noções básicas de linguagem de conceitos e vocabulário comuns

Importante

O LUIS será desativado em 1º de outubro de 2025 e, a partir de 1º de abril de 2023, você não poderá criar novos recursos do LUIS. É recomendável migrar seus aplicativos LUIS para a compreensão da linguagem coloquial a fim de usufruir do suporte contínuo ao produto e dos recursos multilíngues.

O glossário do LUIS (Reconhecimento de Linguagem) explica os termos que você pode encontrar à medida que trabalha com o serviço do LUIS.

Versão ativa

A versão ativa é a versão de seu aplicativo que é atualizada quando você faz alterações no modelo usando o portal do LUIS. No portal do LUIS, se desejar fazer alterações em uma versão que não é a versão ativa, você precisará definir primeiro essa versão como ativa.

Aprendizado ativo

Aprendizado ativo é uma técnica de machine learning em que o modelo aprendido por máquina é usado para identificar novos exemplos informativos para rotular. No LUIS, aprendizado ativo se refere à adição de enunciados do tráfego do ponto de extremidade cujas previsões atuais não estão claras a fim de aprimorar seu modelo. Clique em "revisar enunciados do ponto de extremidade" para exibir enunciados para serem rotulados.

Consulte também:

Aplicativo (app)

No LUIS, seu aplicativo (ou app) é uma coleção de modelos aprendidos por máquina, criados com base no mesmo conjunto de dados, que funciona para prever intenções e entidades para um cenário específico. Cada aplicativo tem um ponto de extremidade de previsão separado.

Se estiver criando um bot de RH, você poderá ter um conjunto de intenções, como "Agendar período de licença", "consultar benefícios" e "atualizar informações pessoais", bem como entidades para cada uma dessas intenções que você agrupa em um só aplicativo.

Criação

Criação é a capacidade de criar, gerenciar e implantar um aplicativo LUIS usando o portal do LUIS ou as APIs de criação.

Chave de criação

A chave de criação é usada para criar o aplicativo. Não usada para consultas de ponto de extremidade no nível de produção. Para saber mais, consulte limites do recurso.

Recurso de criação

Um recurso de criação do LUIS é um item gerenciável que está disponível por meio do Azure. O recurso é seu acesso às capacidades de criação, treinamento e publicação associadas do serviço do Azure. O recurso inclui informações de autenticação, autorização e segurança de que você precisa para acessar o serviço do Azure associado.

O recurso de criação tem um "tipo" do Azure igual a LUIS-Authoring.

Teste de lote

Testes de lote são a capacidade de validar os modelos de um aplicativo LUIS atual com um conjunto de teste consistente e conhecido de enunciados do usuário. O teste de lote é definido em um arquivo formatado em JSON.

Consulte também:

Medida F

No teste de lote, uma medida da precisão do teste.

Falso negativo (FN)

No teste de lote, os pontos de dados representam enunciados em que o aplicativo previu incorretamente a ausência de entidade/intenção de destino.

Falso positivo (FP)

No teste de lote, os pontos de dados representam enunciados em que o aplicativo previu incorretamente a existência de entidade/intenção de destino.

Precisão

No teste de lote, a precisão (também chamada de valor preditivo positivo) é a fração de enunciados relevantes entre os enunciados recuperados.

Um exemplo de teste de lote com animais é o número de ovelhas que foram previstas dividido pelo número total de animais (ovelha e não ovelha).

Recall

No teste de lote, recall (também conhecido como sensibilidade) é a capacidade de generalização do LUIS.

Um exemplo de teste de lote com animais é o número de ovelhas que foram previstas dividido pelo número total de ovelhas disponíveis.

Negativo verdadeiro (TN)

Um negativo verdadeiro ocorre quando seu aplicativo não prevê corretamente nenhuma correspondência. Nos testes de lote, um negativo verdadeiro ocorre quando seu aplicativo prevê uma intenção ou entidade para um exemplo que não foi rotulado com essa intenção ou entidade.

Positivo verdadeiro (TP)

Verdadeiro positivo (TP): um verdadeiro positivo ocorre quando seu aplicativo prevê uma correspondência corretamente. Nos testes de lote, um verdadeiro positivo ocorre quando seu aplicativo prevê uma intenção ou entidade para um exemplo que foi rotulado com essa intenção ou entidade.

Classificador

Um classificador é um modelo aprendido por máquina que prevê em qual categoria ou classe uma entrada se encaixa.

Uma intenção é um exemplo de classificador.

Colaborador

Um colaborador é, conceitualmente, a mesma coisa que um contribuinte. Um colaborador recebe acesso quando um proprietário adiciona o endereço de email do colaborador a um aplicativo que não é controlado com o RBAC do Azure (controle de acesso baseado em função do Azure). Se você ainda estiver usando colaboradores, deverá migrar sua conta do LUIS e usar os recursos de criação do LUIS para gerenciar os colaboradores com o RBAC do Azure.

Colaborador

Um colaborador não é o proprietário do aplicativo, mas tem as mesmas permissões para adicionar, editar e excluir as intenções, entidades e enunciados. Um colaborador fornece RBAC do Azure (controle de acesso baseado em função do Azure) para um aplicativo LUIS.

Consulte também:

  • Como adicionar colaboradores

Descritor

Um descritor é o termo usado anteriormente para um recurso de machine learning.

Domínio

No contexto do LUIS, um domínio é uma área de conhecimento. Seu domínio é específico de seu cenário. Domínios diferentes usam uma terminologia e uma linguagem específica que têm significado no contexto do domínio. Por exemplo, se você estiver criando um aplicativo para reproduzir música, ele teria termos e linguagem específicos da música – palavras como "canção, faixa, álbum, letras, lado b, artista". Para ver exemplos de domínios, confira domínios predefinidos.

Ponto de extremidade

Ponto de extremidade de criação

A URL do ponto de extremidade de criação do LUIS é onde você cria, treina e publica seu aplicativo. A URL de ponto de extremidade contém a região ou o subdomínio do aplicativo publicado, bem como a ID do aplicativo.

Saiba mais sobre como criar seu aplicativo programaticamente na Referência do desenvolvedor

Ponto de extremidade de previsão

A URL do ponto de extremidade de previsão do LUIS é onde você envia consultas do LUIS após o aplicativo LUIS ser criado e publicado. A URL de ponto de extremidade contém a região ou o subdomínio do aplicativo publicado, bem como a ID do aplicativo. Você pode encontrar o ponto de extremidade na página Recursos do Azure do aplicativo ou obter a URL do ponto de extremidade na API Obter Informações do Aplicativo.

Seu acesso ao ponto de extremidade de previsão é autorizado com a chave de previsão do LUIS.

Entidade

Entidades são palavras em enunciados que descrevem as informações usadas para atender ou identificar uma intenção. Se sua entidade for complexa e você quiser que o modelo identifique partes específicas, você poderá dividir o modelo em subentidades. Por exemplo, você pode desejar que o modelo preveja um endereço, mas também as subentidades de rua, cidade, estado e código postal. As entidades também podem ser usadas como recursos para modelos. Sua resposta do aplicativo LUIS incluirá as intenções previstas e todas as entidades.

Extrator de entidades

Um extrator de entidades, às vezes chamado apenas de extrator, é o tipo de modelo aprendido por máquina que o LUIS usa para prever entidades.

Esquema de entidade

O esquema de entidade é a estrutura que você define para entidades aprendidas por máquina com subentidades. O ponto de extremidade de previsão retorna todas as entidades e subentidades extraídas definidas no esquema.

Subentidade da entidade

Uma subentidade é uma entidade filho de uma entidade de aprendizado de máquina.

Entidade que não é de aprendizado de máquina

Uma entidade que usa correspondência de texto para extrair dados:

  • Entidade de lista
  • Entidade de expressão regular

Entidade de lista

Uma entidade de lista representa um conjunto fixo e fechado de palavras relacionadas, juntamente com os respectivos sinônimos. Entidades de lista são correspondências exatas, diferentemente das entidades aprendidas por máquina.

A entidade será prevista se uma palavra na entidade de lista estiver incluída na lista. Por exemplo, se você tiver uma entidade de lista chamada "tamanho" e tiver as palavras "pequeno, médio, grande" na lista, a entidade de tamanho será prevista para todos os enunciados em que as palavras "pequeno", "médio" ou "grande" foram usadas, independentemente do contexto.

Expressão regular

Uma entidade de expressão regular representa uma expressão regular. Entidades de expressão regular são correspondências exatas, diferentemente das entidades aprendidas por máquina.

Entidade predefinida

Confira a entrada do Modelo predefinido para entidade predefinida

Recursos

No machine learning, um recurso é uma característica que ajuda o modelo a reconhecer um determinado conceito. É uma dica que o LUIS pode usar, mas não uma regra rígida.

Esse termo também é conhecido como recurso de aprendizado de máquina .

Essas dicas são usadas em conjunto com os rótulos para saber como prever novos dados. O LUIS dá suporte a listas de frases e ao uso de outros modelos como recursos.

Recurso obrigatório

Um recurso obrigatório é uma forma de restringir a saída de um modelo do LUIS. Quando um recurso de uma entidade é marcado como obrigatório, ele deve estar presente no exemplo para que a entidade seja prevista, independentemente do que o modelo aprendido pelo computador prevê.

Considere um exemplo em que você tem um recurso de número predefinido que você marcou como obrigatório na entidade de quantidade para um bot de pedidos de menus. Quando o bot vir I want a bajillion large pizzas?, zilhão não será previsto como uma quantidade, independentemente do contexto no qual aparecer. Zilhão não é um número válido e não será previsto pela entidade de número predefinida.

Intencional

Uma intenção representa uma tarefa ou ação que o usuário deseja executar. É uma finalidade ou meta expressa na entrada de um usuário, como reservar um voo ou pagar uma fatura. No LUIS, um enunciado como um todo é classificado como uma intenção, mas partes do enunciado são extraídas como entidades

Exemplos de rotulagem

Rotular (ou marcar) é o processo de associar um exemplo positivo ou negativo a um modelo.

Rotulagem para intenções

No LUIS, as intenções em um aplicativo são mutuamente exclusivas. Isso significa que, quando você adiciona um enunciado a uma intenção, ele é considerado um exemplo positivo para essa intenção e um exemplo negativo para todas as outras intenções. Exemplos negativos não devem ser confundidos com a intenção "Nenhum", que representa enunciados que estão fora do escopo do aplicativo.

Rotulagem para entidades

No LUIS, você rotula uma palavra ou frase no exemplo de enunciado de uma intenção com uma entidade como um exemplo positivo. A rotulagem mostra à intenção o que ela deve prever esse enunciado. Os enunciados rotulados são usados para treinar a intenção.

Aplicativo LUIS

Confira a definição de aplicativo (app).

Modelar

Um modelo (aprendido por máquina) é uma função que faz uma previsão sobre dados de entrada. No LUIS, nos referimos aos classificadores de intenção e aos extratores de entidade genericamente como "modelos", e nos referimos a uma coleção de modelos treinados, publicados e consultados como um "aplicativo".

Valor normalizado

Você adiciona valores às suas entidades de lista. Cada um desses valores pode ter uma lista de um ou mais sinônimos. Somente o valor normalizado é retornado na resposta.

Sobreajuste

O sobreajuste acontece quando o modelo é concentrado nos exemplos específicos e não é capaz de generalizar bem.

Proprietário

Cada aplicativo tem um proprietário, que é a pessoa que criou o aplicativo. O proprietário gerencia permissões para o aplicativo no portal do Azure.

Lista de frases

Uma lista de frases é um tipo específico de recurso de machine learning que inclui um grupo de valores (palavras ou frases) que pertencem à mesma classe e devem ser tratadas de maneira semelhante (por exemplo, nomes de cidades ou produtos).

Modelo predefinido

Um modelo predefinido é uma intenção, entidade ou coleção de ambos, juntamente com exemplos rotulados. Esses modelos predefinidos comuns podem ser adicionados ao seu aplicativo para reduzir o trabalho de desenvolvimento de modelo necessário para seu aplicativo.

Domínio predefinido

Um domínio predefinido é um aplicativo LUIS configurado para um domínio específico, como automação residencial (HomeAutomation) ou reservas de restaurante (RestaurantReservation). As intenções, declarações e entidades são configuradas para esse domínio.

Entidade predefinida

Uma entidade predefinida é um LUIS de entidade que fornece tipos comuns de informações, como número, URL e email. Elas são criadas com base em dados públicos. Você pode optar por adicionar uma entidade predefinida como uma entidade autônoma ou como um recurso a uma entidade

Intenção predefinida

Uma intenção predefinida é uma intenção que o LUIS fornece para tipos comuns de informações e tem os próprios enunciados de exemplo rotulados.

Previsão

Uma previsão é uma solicitação REST para o serviço de previsão do LUIS do Azure que recebe novos dados (enunciado do usuário) e aplica o aplicativo treinado e publicado a esses dados para determinar quais intenções e entidades são encontradas.

Chave de previsão

A chave de previsão é a chave associada ao serviço LUIS que você criou no Azure e que autoriza o uso do ponto de extremidade de previsão.

Essa chave não é a chave de criação. Se você tiver uma chave de ponto de extremidade de previsão, ela deverá ser usada para qualquer solicitação de ponto de extremidade, em vez da chave de criação. Você pode ver sua chave de previsão atual dentro da URL do ponto de extremidade na parte inferior da página de recursos do Azure no site do LUIS. É o valor do par nome/valor de subscription-key.

Recurso de previsão

Um recurso de previsão do LUIS é um item gerenciável que está disponível por meio do Azure. O recurso é seu acesso à previsão associada do serviço do Azure. O recurso inclui previsões.

O recurso de previsão tem um "tipo" do Azure igual a LUIS.

Pontuação de previsão

A pontuação é um número de 0 a 1 que é uma medida do quanto o sistema confia que um determinado enunciado de entrada corresponde a uma determinada intenção. Uma pontuação mais próxima de 1 significa que o sistema está muito confiante em relação à saída, e uma pontuação mais próxima de 0 significa que o sistema acredita que a entrada não corresponde a uma saída específica. Pontuações no meio significam que o sistema não sabe ao certo como tomar a decisão.

Por exemplo, imagine um modelo que é usado para identificar se um texto do cliente inclui um pedido de alimentos. Ele pode dar uma pontuação de 1 para "Gostaria de pedir uma café" (o sistema tem certeza de que se trata de um pedido) e uma pontuação de 0 para "meu time venceu o jogo ontem à noite" (o sistema tem certeza de que não se trata de um pedido). E ele pode ter uma pontuação de 0,5 para "vamos tomar um chá" (não tem certeza se é um pedido ou não).

Chave programática

Renomeada para chave de criação.

Publicação

Publicação significa disponibilizar uma versão ativa do LUIS no ponto de extremidade de preparo ou de produção.

Quota

A cota LUIS é a limitação do nível de assinatura do Azure. A cota LUIS pode ser limitada por solicitações por segundo (HTTP Status 429) e solicitações totais em um mês (HTTP Status 403).

Esquema

Seu esquema inclui suas intenções e entidades junto com as subentidades. O esquema é planejado inicialmente e, depois, é iterado ao longo do tempo. O esquema não inclui configurações de aplicativo, recursos nem enunciados de exemplo.

Análise de Sentimento

A análise de sentimento fornece valores positivos ou negativos das declarações fornecidas pelo Serviço de linguagem.

Preparação da fala

O priming de fala aprimora o reconhecimento de palavras e frases faladas que costumam ser usadas em seus cenários com os Serviços de Fala. Para aplicativos habilitados para priming de fala, todos os exemplos rotulados do LUIS são usados para aprimorar a precisão do reconhecimento de fala criando um modelo de fala personalizado para esse aplicativo específico. Por exemplo, em um jogo de xadrez, você deseja garantir que quando o usuário disser "Mover cavalo", isso não seja interpretado como "Mover intervalo". O aplicativo LUIS deve incluir exemplos em que "cavalo" é rotulado como uma entidade.

Chave inicial

Uma chave gratuita a ser usada ao começar a usar o LUIS pela primeira vez.

Sinônimos

Ao listar entidades no LUIS, você pode criar um valor normalizado, que pode ter uma lista de sinônimos. Por exemplo, se você cria uma entidade de tamanho que tenha os valores normalizados pequeno, médio, grande e extragrande. Você pode criar sinônimos para cada valor, da seguinte maneira:

Valor normalizado Sinônimos
Pequena o pequeno, 250 ml
Médio normal, 350 ml
Grande grande, 480 ml
Extragrande o maior, 700 ml

O modelo retornará o valor normalizado para a entidade quando qualquer um dos sinônimos for visto na entrada.

Teste

Testar um aplicativo LUIS significa exibir previsões de modelo.

Diferença de fuso horário

O ponto de extremidade inclui timezoneOffset. Este é o número, em minutos, que você deseja adicionar ou remover da entidade predefinida datetimeV2. Por exemplo, se a declaração for "que horas são agora?", o datetimeV2 retornado será a hora atual da solicitação do cliente. Se a solicitação do cliente for proveniente de um bot ou de outro aplicativo que não for o mesmo que o usuário do seu bot, você deverá passar o deslocamento entre o bot e o usuário.

Confira Alterar o fuso horário da entidade datetimeV2 predefinida.

Token

Um token é a menor unidade de texto que o LUIS pode reconhecer. Isso difere ligeiramente entre idiomas.

Para o inglês, um token é um intervalo contínuo (sem espaços nem pontuação) de letras e números. Um espaço NÃO é um token.

Frase Contagem de tokens Explicação
Dog 1 Uma palavra sem pontuação nem espaços.
RMT33W 1 Um número localizador de registro. Ele pode ter números e letras, mas não tem pontuação.
425-555-5555 5 Um número de telefone. Cada sinal de pontuação é um token, portanto, 425-555-5555 teria 5 tokens:
425
-
555
-
5555
https://luis.ai 7 https
:
/
/
luis
.
ai

Treinar

Treinar é o processo de ensinar ao LUIS sobre alterações na versão ativa desde o último treinamento.

Dados de treinamento

Os dados de treinamento são o conjunto de informações necessárias para treinar um modelo. Isso inclui o esquema, os enunciados rotulados, os recursos e as configurações do aplicativo.

Erros de treinamento

Erros de treinamento são previsões em seus dados de treinamento que não correspondem aos rótulos.

Enunciado

Um enunciado é uma entrada de usuário que é um representante de texto curto de uma frase em uma conversa. É uma frase em linguagem natural como "reservar 2 passagens para Seattle na próxima terça-feira". Exemplos de enunciados são adicionados para treinar o modelo, e o modelo prevê com base em novos enunciados no runtime

Versão

Uma versão do LUIS é uma instância específica de um aplicativo LUIS associada a uma ID do aplicativo LUIS e ao ponto de extremidade publicado. Todo aplicativo LUIS tem pelo menos uma versão.