Início Rápido – Reconhecimento de Entidade Nomeada personalizada

Artigo
12/19/2023

Use este artigo para começar a criar um projeto NER, no qual você pode treinar modelos personalizados para a entidade personalizada. Um modelo é um software de inteligência artificial treinado para fazer um determinada tarefa. Para esse sistema, os modelos extraem entidades nomeadas e são treinados ao aprender com dados marcados.

Neste artigo, usamos o Language Studio para demonstrar os principais conceitos de NER (Reconhecimento de Entidade Nomeada) personalizado. Como exemplo, compilaremos um modelo de NER personalizado para extrair entidades relevantes de contratos de empréstimo, como:

Data do contrato
Nome, endereço, cidade e estado do mutuário
Nome, endereço, cidade e estado do credor
Valores de empréstimos e juros

Pré-requisitos

Assinatura do Azure – Criar uma gratuitamente

Criar um novo recurso de Linguagem da IA do Azure e uma conta de Armazenamento do Azure

Antes de usar o NER personalizado, você precisará criar um recurso de Linguagem de IA do Azure que fornecerá as credenciais necessárias para criar um projeto e começar a treinar um modelo. Você também precisará de uma conta de armazenamento do Azure, na qual poderá carregar o conjunto de dados que será usado para compilar o modelo.

Importante

Para começar a usar o recurso rapidamente, recomendamos que você crie um recurso de Linguagem da IA do Azure usando as etapas fornecidas neste artigo. Usar as etapas neste artigo permitirá que você crie o recurso de linguagem e a conta de armazenamento ao mesmo tempo, que é mais fácil do que fazer depois.

Se caso tiver um recurso pré-existente que gostaria de usar, precisará conectá-lo a uma conta de armazenamento. Consulte as diretrizes para usar um recurso preexistente para obter informações.

Criar um recurso usando o portal do Azure

Entre no portal do Azure para criar um novo recurso de Linguagem de IA do Azure.
Na janela exibida, selecione Classificação de textos personalizada e reconhecimento de entidade nomeada personalizada nos recursos personalizados. Selecione Continuar para criar seu recurso na parte inferior da tela.

Crie um recurso de Linguagem com os seguintes detalhes.

Nome	Descrição
Subscription	Sua assinatura do Azure.
Resource group	O grupo de recursos que conterá seu recurso. É possível usar um grupo existente ou criar um do zero.
Região	A região para seu recurso de linguagem. Por exemplo, “Oeste dos EUA 2”.
Nome	Um nome para seu recurso.
Tipo de preço	O tipo de preço do recurso de Linguagem. Use a camada Gratuita (F0) para experimentar o serviço.

Observação

Se você receber uma mensagem dizendo que "sua conta de logon não é uma proprietária do grupo de recursos da conta de armazenamento selecionada", sua conta precisará ter uma função de proprietário atribuída no grupo de recursos antes de criar um recurso de linguagem. Entre em contato com o proprietário da assinatura do Azure para obter ajuda.

Na seção Classificação de textos personalizada e reconhecimento de entidade nomeada personalizada, selecione uma conta de armazenamento existente ou Nova conta de armazenamento. Esses valores são para ajudar você a começar a usar o recurso, e não são necessariamente os valores de conta de armazenamento que você usará nos ambientes de produção. Para evitar latência durante a criação do projeto, conecte-se às contas de armazenamento na mesma região que o recurso de Linguagem.

Valor de conta de armazenamento Valor recomendado

Nome da conta de armazenamento Qualquer nome

Tipo de conta de armazenamento LRS Padrão
Verifique se a opção Aviso de IA Responsável está marcada. Selecione Examinar + criar na parte inferior da página e depois Criar.

Valor de conta de armazenamento	Valor recomendado
Nome da conta de armazenamento	Qualquer nome
Tipo de conta de armazenamento	LRS Padrão

Carregar dados de exemplo para o contêiner de blob

Depois de criar uma conta de armazenamento do Azure e conectá-la ao recurso de Linguagem, você precisará carregar os documentos do conjunto de dados de exemplo no diretório raiz do contêiner. Estes documentos serão usados posteriormente para treinar o seu modelo.

Baixar o conjunto de dados de exemplo do GitHub.
Abra o arquivo .zip e extraia a pasta que contém os documentos.
No portal do Azure, navegue até a conta de armazenamento que você criou e selecione-a.
Em sua conta de armazenamento, selecione Contêineres no menu esquerdo localizado abaixo de Armazenamento de dados. Na tela exibida, selecione + Contêiner. Nomeie o contêiner como example-data e deixe o Nível de acesso público padrão.
Após criar o contêiner, selecione-o. Em seguida, selecione o botão Carregar para selecionar os arquivos .txt e .json baixados anteriormente.

O conjunto de dados de amostra fornecido contém 20 contratos de empréstimo. Cada contrato inclui duas partes: um credor e um tomador de empréstimo. Você pode usar o arquivo de exemplo fornecido para extrair informações relevantes para: ambas as partes, uma data do contrato, um valor do empréstimo e uma taxa de juros.

Crie um projeto de reconhecimento de entidade nomeada personalizado

Depois de configurar o recurso e a conta de armazenamento, crie um novo projeto NER personalizado. Um projeto é uma área de trabalho para a criação de modelos de ML personalizados com base em seus dados. Seu projeto só pode ser acessado por você e por outras pessoas que têm acesso ao recurso de idioma sendo usado.

Entre no Language Studio. Uma janela será exibida para permitir que você selecione sua assinatura e o recurso idioma. Selecione o recurso de idioma que você criou na etapa acima.
Na seção Extrair informações do Language Studio, selecione Reconhecimento de entidade nomeada personalizada.
Selecione Criar projeto no menu superior na página de projetos. A criação de um projeto permitirá que você marque dados, treine, avalie, melhore e implante seus modelos.
Depois de clicar em Criar projeto, uma janela será exibida para permitir que você conecte sua conta de armazenamento. Se você já tiver conectado uma conta de armazenamento, verá o armazenamento conectado. Caso contrário, escolha a conta de armazenamento na lista suspensa que aparece e selecione Conectar conta de armazenamento. Isso definirá as funções necessárias para a sua conta de armazenamento. É possível que essa etapa retorne um erro se você não for atribuído como proprietário na conta de armazenamento.
Observação
- Para começar logo, é recomendável criar um novo recurso de Linguagem do Azure por meio das etapas fornecidas abaixo, o que permitirá que você crie o recurso e configure uma conta de armazenamento ao mesmo tempo, o que é mais fácil do que fazê-lo mais tarde.
- Esse processo é irreversível, se você conectar uma conta de armazenamento ao recurso de idioma, não poderá desconectá-la posteriormente.
- É possível conectar o recurso de idioma a apenas uma conta de armazenamento.
Insira as informações do projeto, incluindo um nome, uma descrição e o idioma dos arquivos em seu projeto. Se você estiver usando o conjunto de dados de exemplo, selecione Inglês. Você não poderá alterar o nome do projeto mais tarde. Selecione Avançar

Dica

Seu conjunto de dados não precisa estar totalmente no mesmo idioma. Você pode ter vários documentos, cada um com diferentes idiomas compatíveis. Se o conjunto de dados contiver documentos de idiomas diferentes ou se você esperar um texto de diferentes idiomas durante o runtime, selecione Habilitar conjunto de dados multilíngue ao inserir as informações básicas no projeto. Essa opção pode ser habilitada posteriormente na página Configurações do projeto.
Selecione o contêiner em que você carregou o conjunto de dados. Se você já rotulou os dados, certifique-se de que seguem o formato com suporte e selecione Sim, meus arquivos já estão rotulados e formatei o arquivo de rótulos JSON e selecione o arquivo de rótulos no menu suspenso. Selecione Avançar.
Revise os dados inseridos e selecione Criar Projeto.

Treinar seu modelo

Normalmente, depois de criar um projeto, você começa a marcar os documentos presentes no contêiner conectado ao projeto. Para este início rápido, você importou um conjunto de dados marcado de exemplo e inicializou o projeto com o arquivo de marcas JSON de exemplo.

Para começar a treinar o modelo no Language Studio:

Selecione Trabalhos de treinamento no menu à esquerda.
Selecione Iniciar um trabalho de treinamento no menu superior.
Selecione Treinar um novo modelo e digite o nome do modelo na caixa de texto. Também é possível substituir um modelo existente selecionando essa opção e escolhendo o modelo que você deseja substituir no menu suspenso. A substituição de um modelo treinado é irreversível, mas não afetará os modelos implantados até que você implante o novo modelo.
Selecione o método de divisão de dados. Você pode optar por dividir automaticamente o conjunto de teste nos dados de treinamento, em que o sistema dividirá os dados rotulados entre os conjuntos de treinamento e de teste, de acordo com os percentuais especificados. Alternativamente, você pode Usar uma divisão manual dos dados de treinamento e de teste. Essa opção será habilitada somente se você tiver adicionado documentos ao conjunto de teste durante a rotulagem de dados. Confira Como treinar um modelo para obter mais informações sobre divisão de dados.
Selecione o botão Treinar.
Se você selecionar a ID de Trabalho de Treinamento da lista, será exibido um painel lateral no qual você poderá verificar o Progresso do treinamento, o Status do trabalho e outros detalhes para esse trabalho.
Observação
- Somente os trabalhos de treinamento concluídos com êxito vão gerar modelos.
- O treinamento pode levar entre alguns minutos e várias horas de acordo com o tamanho dos dados rotulados.
- É possível ter um trabalho de treinamento em execução por vez. Não é possível iniciar outro trabalho de treinamento no mesmo projeto até que o trabalho em execução seja concluído.

Implantar o seu modelo

Geralmente, depois de treinar um modelo, você pode revisar os detalhes da avaliação e fazer aprimoramentos, se necessário. Neste início rápido, você implantará somente o modelo e o disponibilizará para ser experimentado no estúdio de Linguagem ou você poderá chamar a API de previsão.

Para implantar o modelo por meio do Language Studio:

Selecione Implantar um modelo no menu à esquerda.
Selecione Adicionar implantação para iniciar um novo trabalho de implantação.
Selecione Criar implantação para criar uma implantação e atribuir um modelo treinado na lista suspensa abaixo. Você também pode Substituir uma implantação existente selecionando essa opção e escolhendo o modelo treinado que deseja atribuir na lista suspensa abaixo.

Observação

A substituição de uma implantação existente não exige alterações na chamada à API de previsão, mas os resultados obtidos serão baseados no modelo recém-atribuído.
Selecione Implantar para iniciar a implantação.
Depois que a implantação for realizada com sucesso, uma data de validade será exibida. A expiração da implantação consiste no momento em que o modelo implantado não estará disponível para ser usado para previsão, o que normalmente acontece 12 meses após a expiração de uma configuração de treinamento.

Testar o modelo

Depois que o modelo for implantado, você poderá começar a usá-lo para extrair entidades do texto por meio da API de Previsão. Para este início rápido, você usará o Language Studio para enviar a tarefa de reconhecimento de entidade personalizada e visualizar os resultados. No conjunto de dados de exemplo que você baixou anteriormente, poderá encontrar alguns documentos de teste que podem ser usados nesta etapa.

Para testar os modelos implantados de dentro do Language Studio:

Selecione Testar implantações no menu à esquerda.
Selecione a implantação que deseja testar. Você só pode testar modelos atribuídos a implantações.
Para projetos multilíngues, na lista suspensa de idiomas, selecione o idioma do texto que você está testando.
Selecione a implantação que deseja consultar/testar na lista suspensa.
É possível inserir o texto que deseja enviar à solicitação ou carregar um arquivo .txt a ser usado.
Selecione Executar o teste no menu superior.
Na guia Resultado, você pode ver as entidades extraídas de seu texto e seus tipos. Você também pode exibir a resposta JSON na guia JSON.

Limpar os recursos

Quando não precisar mais do seu projeto, poderá excluí-lo do projeto usando o Language Studio. Selecione NER (reconhecimento de entidade nomeada personalizada) na parte superior, selecione o projeto que deseja excluir e selecione Excluir no menu superior.

Pré-requisitos

Assinatura do Azure – Criar uma gratuitamente

Criar um novo recurso de Linguagem da IA do Azure e uma conta de Armazenamento do Azure

Importante

Para começar a usar o recurso rapidamente, recomendamos que você crie um recurso de Linguagem da IA do Azure usando as etapas fornecidas neste artigo, o que permitirá que você crie o recurso de Linguagem e crie e/ou configure uma conta de armazenamento ao mesmo tempo, o que é mais fácil do que fazê-lo mais tarde.

Se caso tiver um recurso pré-existente que gostaria de usar, precisará conectá-lo a uma conta de armazenamento. Confira criar projeto para obter mais informações.

Criar um recurso usando o portal do Azure

Entre no portal do Azure para criar um novo recurso de Linguagem de IA do Azure.
Na janela exibida, selecione Classificação de textos personalizada e reconhecimento de entidade nomeada personalizada nos recursos personalizados. Selecione Continuar para criar seu recurso na parte inferior da tela.

Crie um recurso de Linguagem com os seguintes detalhes.

Nome	Descrição
Subscription	Sua assinatura do Azure.
Resource group	O grupo de recursos que conterá seu recurso. É possível usar um grupo existente ou criar um do zero.
Região	A região para seu recurso de linguagem. Por exemplo, “Oeste dos EUA 2”.
Nome	Um nome para seu recurso.
Tipo de preço	O tipo de preço do recurso de Linguagem. Use a camada Gratuita (F0) para experimentar o serviço.

Observação

Na seção Classificação de textos personalizada e reconhecimento de entidade nomeada personalizada, selecione uma conta de armazenamento existente ou Nova conta de armazenamento. Esses valores são para ajudar você a começar a usar o recurso, e não são necessariamente os valores de conta de armazenamento que você usará nos ambientes de produção. Para evitar latência durante a criação do projeto, conecte-se às contas de armazenamento na mesma região que o recurso de Linguagem.

Valor de conta de armazenamento Valor recomendado

Nome da conta de armazenamento Qualquer nome

Tipo de conta de armazenamento LRS Padrão
Verifique se a opção Aviso de IA Responsável está marcada. Selecione Examinar + criar na parte inferior da página e depois Criar.

Valor de conta de armazenamento	Valor recomendado
Nome da conta de armazenamento	Qualquer nome
Tipo de conta de armazenamento	LRS Padrão

Carregar dados de exemplo para o contêiner de blob

Baixar o conjunto de dados de exemplo do GitHub.
Abra o arquivo .zip e extraia a pasta que contém os documentos.
No portal do Azure, navegue até a conta de armazenamento que você criou e selecione-a.
Em sua conta de armazenamento, selecione Contêineres no menu esquerdo localizado abaixo de Armazenamento de dados. Na tela exibida, selecione + Contêiner. Nomeie o contêiner como example-data e deixe o Nível de acesso público padrão.
Após criar o contêiner, selecione-o. Em seguida, selecione o botão Carregar para selecionar os arquivos .txt e .json baixados anteriormente.

Obter suas chaves de recurso e ponto de extremidade

No portal do Azure, vá para a página de visão geral do recurso
No menu do lado esquerdo, selecione Chaves e Ponto de Extremidade. Você usará o ponto de extremidade e a chave para as solicitações de API

Criar um projeto NER personalizado

Use o arquivo de marcas baixado dos dados de exemplo na etapa anterior e adicione-o ao corpo da solicitação a seguir.

Disparar trabalho de projeto de importação

Envie uma solicitaçãoPOST usando o URL, os cabeçalhos e o corpo JSON a seguir para importar o arquivo de rótulos. Verifique se o arquivo de rótulos segue o formato de arquivo aceito.

Se já existir um projeto com o mesmo nome, os dados desse projeto serão substituídos.

{Endpoint}/language/authoring/analyze-text/projects/{projectName}/:import?api-version={API-VERSION}

Espaço reservado	Valor	Exemplo
`{ENDPOINT}`	O ponto de extremidade para autenticação de sua solicitação de API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas.	`myProject`
`{API-VERSION}`	A versão da API que você está chamando. O valor referenciado aqui é para a versão mais recente lançada. Consulte o Ciclo de vida do modelo para saber mais sobre outras versões de API disponíveis.	`2022-05-01`

Cabeçalhos

Use o cabeçalho a seguir para autenticar sua solicitação.

Chave	Valor
`Ocp-Apim-Subscription-Key`	A chave para o recurso. Usado para autenticação de suas solicitações de API.

Corpo

Use o JSON a seguir em sua solicitação. Substitua os valores dos espaços reservados abaixo pelos seus próprios valores.

{
    "projectFileVersion": "{API-VERSION}",
    "stringIndexType": "Utf16CodeUnit",
    "metadata": {
        "projectName": "{PROJECT-NAME}",
        "projectKind": "CustomEntityRecognition",
        "description": "Trying out custom NER",
        "language": "{LANGUAGE-CODE}",
        "multilingual": true,
        "storageInputContainerName": "{CONTAINER-NAME}",
        "settings": {}
    },
    "assets": {
    "projectKind": "CustomEntityRecognition",
        "entities": [
            {
                "category": "Entity1"
            },
            {
                "category": "Entity2"
            }
        ],
        "documents": [
            {
                "location": "{DOCUMENT-NAME}",
                "language": "{LANGUAGE-CODE}",
                "dataset": "{DATASET}",
                "entities": [
                    {
                        "regionOffset": 0,
                        "regionLength": 500,
                        "labels": [
                            {
                                "category": "Entity1",
                                "offset": 25,
                                "length": 10
                            },
                            {
                                "category": "Entity2",
                                "offset": 120,
                                "length": 8
                            }
                        ]
                    }
                ]
            },
            {
                "location": "{DOCUMENT-NAME}",
                "language": "{LANGUAGE-CODE}",
                "dataset": "{DATASET}",
                "entities": [
                    {
                        "regionOffset": 0,
                        "regionLength": 100,
                        "labels": [
                            {
                                "category": "Entity2",
                                "offset": 20,
                                "length": 5
                            }
                        ]
                    }
                ]
            }
        ]
    }
}

Chave	Espaço reservado	Valor	Exemplo
`api-version`	`{API-VERSION}`	A versão da API que você está chamando. A versão usada aqui precisa ser a mesma versão da API na URL. Saiba mais sobre as outras versões de API disponíveis	`2022-03-01-preview`
`projectName`	`{PROJECT-NAME}`	O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas.	`myProject`
`projectKind`	`CustomEntityRecognition`	O tipo de projeto.	`CustomEntityRecognition`
`language`	`{LANGUAGE-CODE}`	Uma cadeia de caracteres que especifica o código de linguagem para os documentos usados no projeto. Se for um projeto multilíngue, escolha o código de linguagem da maioria dos documentos.	`en-us`
`multilingual`	`true`	Um valor booliano que permite ter documentos em várias linguagens no conjunto de dados e, quando o modelo é implantado, é possível consultar o modelo em qualquer linguagem com suporte, não necessariamente incluída nos documentos de treinamento. Confira suporte de idioma para obter informações sobre suporte multilíngue.	`true`
`storageInputContainerName`	{CONTAINER-NAME}	O nome do contêiner de armazenamento do Azure em que você carregou os documentos.	`myContainer`
`entities`		Matriz que contém todos os tipos de entidade presentes no projeto. São os tipos de entidade que serão extraídos dos documentos.
`documents`		Matriz que contém todos os documentos no projeto e lista das entidades rotuladas em cada documento.	[]
`location`	`{DOCUMENT-NAME}`	O local dos documentos no contêiner de armazenamento. Como todos os documentos estão na raiz do contêiner, esse deve ser o nome do documento.	`doc1.txt`
`dataset`	`{DATASET}`	O conjunto de teste para o qual esse arquivo será exibido, quando dividido antes do treinamento. Confira Como treinar um modelo para obter mais informações sobre como os dados são divididos. Os valores possíveis para esse campo são `Train` e `Test`.	`Train`

Depois de enviar a solicitação à API, você receberá uma resposta 202 indicando que o trabalho foi enviado corretamente. Nos cabeçalhos de resposta, extraia o valor operation-location. A formatação ficará da seguinte maneira:

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/import/jobs/{JOB-ID}?api-version={API-VERSION}

{JOB-ID} é usado para identificar sua solicitação, pois essa operação é assíncrona. Você usará essa URL para obter o status do trabalho de importação.

Possíveis cenários de erro para esta solicitação:

O recurso selecionado não tem as permissões apropriadas para a conta de armazenamento.
O storageInputContainerName especificado não existe.
Um código de idioma inválido foi usado ou o tipo de código de idioma não é cadeia de caracteres.
O valor multilingual é uma cadeia de caracteres e não um booliano.

Obter o status do trabalho de importação

Use a solicitação GET a seguir para obter o status da importação do projeto. Substitua os valores dos espaços reservados abaixo pelos seus próprios valores.

URL da solicitação

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/import/jobs/{JOB-ID}?api-version={API-VERSION}

Espaço reservado	Valor	Exemplo
`{ENDPOINT}`	O ponto de extremidade para autenticação de sua solicitação de API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas.	`myProject`
`{JOB-ID}`	A ID para localização do status de treinamento do modelo. Esse valor está no valor de cabeçalho `location` que você obteve na etapa anterior.	`xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx`
`{API-VERSION}`	A versão da API que você está chamando. O valor referenciado aqui é para a versão mais recente lançada. Consulte o Ciclo de vida do modelo para saber mais sobre outras versões de API disponíveis.	`2022-05-01`

Cabeçalhos

Use o cabeçalho a seguir para autenticar sua solicitação.

Chave	Valor
`Ocp-Apim-Subscription-Key`	A chave para o recurso. Usado para autenticação de suas solicitações de API.

Treinar seu modelo

Iniciar o trabalho de treinamento

Depois que o projeto tiver sido importado, você poderá começar a treinar o modelo.

Envie uma solicitação POST usando a URL, os cabeçalhos e o corpo JSON a seguir para enviar um trabalho de treinamento. Substitua os valores dos espaços reservados abaixo pelos seus próprios valores.

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/:train?api-version={API-VERSION}

Espaço reservado	Valor	Exemplo
`{ENDPOINT}`	O ponto de extremidade para autenticação de sua solicitação de API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas.	`myProject`
`{API-VERSION}`	A versão da API que você está chamando. O valor referenciado aqui é para a versão mais recente lançada. Consulte o Ciclo de vida do modelo para saber mais sobre outras versões de API disponíveis.	`2022-05-01`

Cabeçalhos

Use o cabeçalho a seguir para autenticar sua solicitação.

Chave	Valor
`Ocp-Apim-Subscription-Key`	A chave para o recurso. Usado para autenticação de suas solicitações de API.

Corpo da solicitação

Use o JSON a seguir no corpo da solicitação. O modelo receberá o {MODEL-NAME} quando o treinamento for concluído. Somente os trabalhos de treinamento executados com êxito produzirão modelos.

{
	"modelLabel": "{MODEL-NAME}",
	"trainingConfigVersion": "{CONFIG-VERSION}",
	"evaluationOptions": {
		"kind": "percentage",
		"trainingSplitPercentage": 80,
		"testingSplitPercentage": 20
	}
}

Chave	Espaço reservado	Valor	Exemplo
modelLabel	`{MODEL-NAME}`	O nome que será atribuído ao modelo uma vez que ele seja treinado com êxito.	`myModel`
trainingConfigVersion	`{CONFIG-VERSION}`	Esta é a versão do modelo que será usada para treinar o modelo.	`2022-05-01`
evaluationOptions		Opção para dividir os dados entre conjuntos de treinamento e de teste.	`{}`
kind	`percentage`	Métodos de divisão. Os possíveis valores são `percentage` ou `manual`. Confira Como treinar um modelo para obter mais informações.	`percentage`
trainingSplitPercentage	`80`	Porcentual dos dados marcados a serem incluídos no conjunto de treinamentos. O valor recomendado é `80`.	`80`
testingSplitPercentage	`20`	Porcentual dos dados marcados a serem incluídos no conjunto de teste. O valor recomendado é `20`.	`20`

Observação

trainingSplitPercentage e testingSplitPercentage serão necessários somente se Kind for definido como percentage, sendo que a soma de ambos os percentuais deverá ser igual a 100.

Depois de enviar a solicitação à API, você receberá uma resposta 202 indicando que o trabalho foi enviado corretamente. Nos cabeçalhos de resposta, extraia o valor location. A formatação ficará da seguinte maneira:

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}

{JOB-ID} é usado para identificar sua solicitação, pois essa operação é assíncrona. Você pode usar essa URL para obter o status de treinamento.

Obter status do trabalho de treinamento

O treinamento pode levar entre 10 e 30 minutos para este conjunto de dados de exemplo. Você pode usar a solicitação a seguir para continuar sondando o status do trabalho de treinamento até que ele seja concluído com êxito.

Use a seguinte solicitação GET para obter o status do processo de treinamento do modelo. Substitua os valores dos espaços reservados abaixo pelos seus próprios valores.

URL da solicitação

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}

Espaço reservado	Valor	Exemplo
`{ENDPOINT}`	O ponto de extremidade para autenticação de sua solicitação de API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas.	`myProject`
`{JOB-ID}`	A ID para localização do status de treinamento do modelo. Esse valor está no valor de cabeçalho `location` que você obteve na etapa anterior.	`xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx`
`{API-VERSION}`	A versão da API que você está chamando. O valor referenciado aqui é para a versão mais recente lançada. Consulte o Ciclo de vida do modelo para saber mais sobre outras versões de API disponíveis.	`2022-05-01`

Cabeçalhos

Use o cabeçalho a seguir para autenticar sua solicitação.

Chave	Valor
`Ocp-Apim-Subscription-Key`	A chave para o recurso. Usado para autenticação de suas solicitações de API.

Corpo da resposta

Após enviar a solicitação, você receberá a seguinte resposta.

{
  "result": {
    "modelLabel": "{MODEL-NAME}",
    "trainingConfigVersion": "{CONFIG-VERSION}",
    "estimatedEndDateTime": "2022-04-18T15:47:58.8190649Z",
    "trainingStatus": {
      "percentComplete": 3,
      "startDateTime": "2022-04-18T15:45:06.8190649Z",
      "status": "running"
    },
    "evaluationStatus": {
      "percentComplete": 0,
      "status": "notStarted"
    }
  },
  "jobId": "{JOB-ID}",
  "createdDateTime": "2022-04-18T15:44:44Z",
  "lastUpdatedDateTime": "2022-04-18T15:45:48Z",
  "expirationDateTime": "2022-04-25T15:44:44Z",
  "status": "running"
}

Implantar o seu modelo

Geralmente, depois de treinar um modelo, você pode revisar os detalhes da avaliação e fazer melhorias, se necessário. Neste início rápido, você apenas implantará o modelo e o disponibilizará para ser experimentado no Language Studio ou você poderá chamar a API de previsão.

Iniciar trabalho de implantação

Envie uma solicitaçãoPUT usando a URL, os cabeçalhos e o corpo JSON a seguir para enviar o trabalho de implantação. Substitua os valores dos espaços reservados abaixo pelos seus próprios valores.

{Endpoint}/language/authoring/analyze-text/projects/{projectName}/deployments/{deploymentName}?api-version={API-VERSION}

Espaço reservado	Valor	Exemplo
`{ENDPOINT}`	O ponto de extremidade para autenticação de sua solicitação de API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas.	`myProject`
`{DEPLOYMENT-NAME}`	O nome da sua implantação. Esse valor diferencia maiúsculas de minúsculas.	`staging`
`{API-VERSION}`	A versão da API que você está chamando. O valor referenciado aqui é para a versão mais recente lançada. Consulte o Ciclo de vida do modelo para saber mais sobre outras versões de API disponíveis.	`2022-05-01`

Cabeçalhos

Use o cabeçalho a seguir para autenticar sua solicitação.

Chave	Valor
`Ocp-Apim-Subscription-Key`	A chave para o recurso. Usado para autenticação de suas solicitações de API.

Corpo da solicitação

Use o JSON a seguir no corpo da solicitação. Use o nome do modelo atribuído à implantação.

{
  "trainedModelLabel": "{MODEL-NAME}"
}

Chave	Espaço reservado	Valor	Exemplo
trainedModelLabel	`{MODEL-NAME}`	O nome do modelo que será atribuído à implantação. Você só pode atribuir modelos treinados com sucesso. Esse valor diferencia maiúsculas de minúsculas.	`myModel`

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/deployments/{DEPLOYMENT-NAME}/jobs/{JOB-ID}?api-version={API-VERSION}

{JOB-ID} é usado para identificar sua solicitação, pois essa operação é assíncrona. Você pode usar essa URL para obter o status de implantação.

Obter status do trabalho de implantação

Use a solicitação GET a seguir para consultar o status do trabalho de implantação. Você pode usar a URL que obteve na etapa anterior ou substituir os valores de espaço reservado abaixo pelos seus próprios valores.

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/deployments/{DEPLOYMENT-NAME}/jobs/{JOB-ID}?api-version={API-VERSION}

Espaço reservado	Valor	Exemplo
`{ENDPOINT}`	O ponto de extremidade para autenticação de sua solicitação de API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas.	`myProject`
`{DEPLOYMENT-NAME}`	O nome da sua implantação. Esse valor diferencia maiúsculas de minúsculas.	`staging`
`{JOB-ID}`	A ID para localização do status de treinamento do modelo. Isso está no valor de cabeçalho `location` que você obteve na etapa anterior.	`xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx`
`{API-VERSION}`	A versão da API que você está chamando. O valor referenciado aqui é para a versão mais recente lançada. Consulte o Ciclo de vida do modelo para saber mais sobre outras versões de API disponíveis.	`2022-05-01`

Cabeçalhos

Use o cabeçalho a seguir para autenticar sua solicitação.

Chave	Valor
`Ocp-Apim-Subscription-Key`	A chave para o recurso. Usado para autenticação de suas solicitações de API.

Corpo da resposta

Depois de enviar a solicitação, você receberá a seguinte resposta. Continue sondando esse ponto de extremidade até que o parâmetro de status mude para "bem-sucedido". Você deve obter um código 200 para indicar o sucesso da solicitação.

{
    "jobId":"{JOB-ID}",
    "createdDateTime":"{CREATED-TIME}",
    "lastUpdatedDateTime":"{UPDATED-TIME}",
    "expirationDateTime":"{EXPIRATION-TIME}",
    "status":"running"
}

Extrair entidades personalizadas

Depois que o modelo for implantado, você poderá começar a usá-lo para extrair entidades do texto usando a API de Previsão. No conjunto de dados de exemplo que você baixou anteriormente, poderá encontrar alguns documentos de teste que podem ser usados nesta etapa.

Enviar a tarefa do NER personalizada

Use esta solicitação POST para iniciar uma tarefa de classificação de textos.

{ENDPOINT}/language/analyze-text/jobs?api-version={API-VERSION}

Espaço reservado	Valor	Exemplo
`{ENDPOINT}`	O ponto de extremidade para autenticação de sua solicitação de API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{API-VERSION}`	A versão da API que você está chamando. O valor referenciado aqui é para a versão mais recente lançada. Consulte o Ciclo de vida do modelo para saber mais sobre outras versões de API disponíveis.	`2022-05-01`

Cabeçalhos

Chave	Valor
Ocp-Apim-Subscription-Key	Sua chave que fornece acesso a essa API.

Corpo

{
  "displayName": "Extracting entities",
  "analysisInput": {
    "documents": [
      {
        "id": "1",
        "language": "{LANGUAGE-CODE}",
        "text": "Text1"
      },
      {
        "id": "2",
        "language": "{LANGUAGE-CODE}",
        "text": "Text2"
      }
    ]
  },
  "tasks": [
     {
      "kind": "CustomEntityRecognition",
      "taskName": "Entity Recognition",
      "parameters": {
        "projectName": "{PROJECT-NAME}",
        "deploymentName": "{DEPLOYMENT-NAME}"
      }
    }
  ]
}

Chave	Espaço reservado	Valor	Exemplo
`displayName`	`{JOB-NAME}`	O nome do seu trabalho.	`MyJobName`
`documents`	[{},{}]	Lista de documentos nos quais executar tarefas.	`[{},{}]`
`id`	`{DOC-ID}`	Nome ou ID do documento.	`doc1`
`language`	`{LANGUAGE-CODE}`	Uma cadeia de caracteres que especifica o código de idioma do documento. Caso essa chave não seja especificada, o serviço assume o idioma padrão do projeto que foi selecionado durante a criação do projeto. Confira Suporte ao idioma para obter uma lista de todos os códigos de idioma com suporte.	`en-us`
`text`	`{DOC-TEXT}`	Tarefa do documento para executar as tarefas.	`Lorem ipsum dolor sit amet`
`tasks`		Lista de tarefas que queremos executar.	`[]`
`taskName`	`CustomEntityRecognition`	O nome da tarefa	CustomEntityRecognition
`parameters`		Lista de parâmetros a serem passados para a tarefa.
`project-name`	`{PROJECT-NAME}`	O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas.	`myProject`
`deployment-name`	`{DEPLOYMENT-NAME}`	O nome da sua implantação. Esse valor diferencia maiúsculas de minúsculas.	`prod`

Resposta

Você receberá uma resposta 202 indicando que sua tarefa foi enviada com êxito. Nos cabeçalhos da resposta, extraia operation-location. operation-location é formatado da seguinte maneira:

{ENDPOINT}/language/analyze-text/jobs/{JOB-ID}?api-version={API-VERSION}

Você pode usar essa URL para consultar o status de conclusão da tarefa e obter os resultados quando a tarefa for concluída.

Obter resultados da tarefa

Use a solicitação GET a seguir para consultar status/resultados da tarefa de reconhecimento de entidade personalizada.

{ENDPOINT}/language/analyze-text/jobs/{JOB-ID}?api-version={API-VERSION}

Espaço reservado	Valor	Exemplo
`{ENDPOINT}`	O ponto de extremidade para autenticação de sua solicitação de API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{API-VERSION}`	A versão da API que você está chamando. O valor referenciado aqui é para a versão mais recente lançada. Consulte o Ciclo de vida do modelo para saber mais sobre outras versões de API disponíveis.	`2022-05-01`

Cabeçalhos

Chave	Valor
Ocp-Apim-Subscription-Key	Sua chave que fornece acesso a essa API.

Corpo da resposta

A resposta será um documento JSON com os seguintes parâmetros

{
  "createdDateTime": "2021-05-19T14:32:25.578Z",
  "displayName": "MyJobName",
  "expirationDateTime": "2021-05-19T14:32:25.578Z",
  "jobId": "xxxx-xxxx-xxxxx-xxxxx",
  "lastUpdateDateTime": "2021-05-19T14:32:25.578Z",
  "status": "succeeded",
  "tasks": {
    "completed": 1,
    "failed": 0,
    "inProgress": 0,
    "total": 1,
    "items": [
      {
        "kind": "EntityRecognitionLROResults",
        "taskName": "Recognize Entities",
        "lastUpdateDateTime": "2020-10-01T15:01:03Z",
        "status": "succeeded",
        "results": {
          "documents": [
            {
              "entities": [
                {
                  "category": "Event",
                  "confidenceScore": 0.61,
                  "length": 4,
                  "offset": 18,
                  "text": "trip"
                },
                {
                  "category": "Location",
                  "confidenceScore": 0.82,
                  "length": 7,
                  "offset": 26,
                  "subcategory": "GPE",
                  "text": "Seattle"
                },
                {
                  "category": "DateTime",
                  "confidenceScore": 0.8,
                  "length": 9,
                  "offset": 34,
                  "subcategory": "DateRange",
                  "text": "last week"
                }
              ],
              "id": "1",
              "warnings": []
            }
          ],
          "errors": [],
          "modelVersion": "2020-04-01"
        }
      }
    ]
  }
}

Limpar os recursos

Quando você não precisar mais do seu projeto, poderá excluí-lo com a seguinte solicitação de DELETE. Substitua os valores do espaço reservado pelos seus.

{Endpoint}/language/authoring/analyze-text/projects/{projectName}?api-version={API-VERSION}

Espaço reservado	Valor	Exemplo
`{ENDPOINT}`	O ponto de extremidade para autenticação de sua solicitação de API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas.	`myProject`
`{API-VERSION}`	A versão da API que você está chamando. O valor referenciado aqui é para a versão mais recente lançada. Consulte o Ciclo de vida do modelo para saber mais sobre outras versões de API disponíveis.	`2022-05-01`

Cabeçalhos

Use o cabeçalho a seguir para autenticar sua solicitação.

Chave	Valor
Ocp-Apim-Subscription-Key	A chave para o recurso. Usado para autenticação de suas solicitações de API.

Depois de enviar a solicitação da API, você receberá uma resposta 202 indicando êxito, o que significa que o projeto foi excluído. Uma chamada bem-sucedida resulta em um cabeçalho Operation-Location usado para verificar o status do trabalho.

Próximas etapas

Depois de criar o modelo de extração de entidade, você pode:

Usar a API de runtime para extrair entidades

Ao começar a criar seus próprios projetos de NER personalizados, use os artigos de instruções para saber mais sobre como marcar, treinar e consumir seu modelo com mais detalhes:

Share via

Início Rápido – Reconhecimento de Entidade Nomeada personalizada

Pré-requisitos

Criar um novo recurso de Linguagem da IA do Azure e uma conta de Armazenamento do Azure

Criar um recurso usando o portal do Azure

Carregar dados de exemplo para o contêiner de blob

Crie um projeto de reconhecimento de entidade nomeada personalizado

Treinar seu modelo

Implantar o seu modelo

Testar o modelo

Limpar os recursos

Pré-requisitos

Criar um novo recurso de Linguagem da IA do Azure e uma conta de Armazenamento do Azure

Criar um recurso usando o portal do Azure

Carregar dados de exemplo para o contêiner de blob

Obter suas chaves de recurso e ponto de extremidade

Criar um projeto NER personalizado

Disparar trabalho de projeto de importação

Cabeçalhos

Corpo

Obter o status do trabalho de importação

URL da solicitação

Cabeçalhos

Treinar seu modelo

Iniciar o trabalho de treinamento

Cabeçalhos

Corpo da solicitação

Obter status do trabalho de treinamento

URL da solicitação

Cabeçalhos

Corpo da resposta

Implantar o seu modelo

Iniciar trabalho de implantação

Cabeçalhos

Corpo da solicitação

Obter status do trabalho de implantação

Cabeçalhos

Corpo da resposta

Extrair entidades personalizadas

Enviar a tarefa do NER personalizada

Cabeçalhos

Corpo

Resposta

Obter resultados da tarefa

Cabeçalhos

Corpo da resposta

Limpar os recursos

Cabeçalhos

Próximas etapas

Recursos adicionais