Rotulagem de imagens e documentos de texto
Depois que o administrador do projeto criar um projeto de rotulagem de dados de imagem ou um projeto de rotulagem de dados de texto do Azure Machine Learning, será possível usar a ferramenta de rotulagem para preparar rapidamente os dados para um projeto de Machine Learning. Este artigo descreve:
- Como acessar seus projetos de rotulagem
- As ferramentas de rotulagem
- Como usar as ferramentas para tarefas de rotulagem específicas
Pré-requisitos
- Uma conta da Microsoft ou uma conta do Microsoft Entra para a organização e o projeto.
- Acesso no nível de colaborador ao espaço de trabalho que contém o projeto de rotulagem.
Entrar no estúdio
Entre no Estúdio do Azure Machine Learning
Selecione a assinatura e o workspace que contém o projeto de rotulagem. O administrador do projeto tem essas informações
Você pode notar várias seções à esquerda, dependendo do seu nível de acesso. Se for o caso, selecione Rotulagem de dados no lado esquerdo para encontrar o projeto."
Entender a tarefa de rotulagem
Na tabela de projetos de rotulagem de dados, selecione o link Rotular dados para seu projeto.
Você tem à sua disposição instruções específicas para o seu projeto. Essas instruções explicam o tipo de dados envolvidos, como você deve tomar suas decisões e outras informações relevantes. Leia as informações e selecione Tarefas na parte superior da página. Você também pode selecionar Iniciar rotulagem na parte inferior da página.
Seleção de rótulo
Em todas as tarefas de rotulagem de dados, você pode escolher uma tag apropriada ou tags de um conjunto especificado pelo administrador de projeto. Você pode usar as teclas de número do teclado para selecionar as nove primeiras tags.
Aprendizado de máquina assistido
O processo de rotulagem pode disparar algoritmos de aprendizado de máquina. Se o seu projeto tiver esses algoritmos habilitados, você poderá ver:
Imagens
Depois que alguns dos dados forem rotulados, você poderá notar Tarefas clusterizadas na parte superior da tela, ao lado do nome do projeto. As imagens são agrupadas para apresentar as imagens semelhantes na mesma página. Nesse caso, mude para uma do modos de exibição de várias imagens para aproveitar o agrupamento.
Posteriormente, talvez você veja Tarefas pré-rotuladas ao lado do nome do projeto. Os itens aparecerão com um rótulo sugerido proveniente de um modelo de classificação de aprendizado de máquina. Nenhum modelo de machine learning tem precisão de 100%. Embora utilizemos apenas dados que o modelo considera confiáveis, esses valores de dados ainda podem ser pré-rotulados incorretamente. Quando você notar rótulos, corrija os rótulos incorretos antes de enviar a página.
Nos modelos de identificação de objetos, você poderá observar caixas delimitadoras e rótulos já presentes. Corrija todos os erros neles antes de enviar a página.
Para modelos de segmentação, você poderá observar polígonos e rótulos já presentes. Corrija todos os erros neles antes de enviar a página.
Texto
- Posteriormente, talvez você veja Tarefas pré-rotuladas ao lado do nome do projeto. Os itens aparecerão com um rótulo sugerido proveniente de um modelo de classificação de aprendizado de máquina. Nenhum modelo de machine learning tem precisão de 100%. Embora utilizemos apenas dados que o modelo considera confiáveis, esses valores de dados ainda podem ser pré-rotulados incorretamente. Quando você notar rótulos, corrija os rótulos errados antes de enviar a página.
No início de um projeto de rotulagem, o modelo de aprendizado de máquina pode ter precisão suficiente apenas para pré-rotular um pequeno subconjunto de imagens. Depois que essas imagens forem rotuladas, o projeto de rotulagem voltará à rotulagem manual para coletar mais dados para a próxima rodada de treinamento do modelo. Ao longo do tempo, o modelo se tornará mais confiante em relação a uma proporção mais alta de imagens. Posteriormente no projeto, sua confiança resultará em mais tarefas de pré-rotulagem.
Quando não houver mais tarefas de pré-rotulagem, o processo de confirmação ou correção de rótulos é interrompido e retorna à marcação manual de itens.
Tarefas de imagem
Em tarefas de classificação de imagem, opte por exibir várias imagens simultaneamente. Para selecionar o layout, use os ícones acima da área da imagem.
Para selecionar todas as imagens exibidas simultaneamente, use Selecionar tudo. Para selecionar imagens individuais, use o botão de seleção circular no canto superior direito da imagem. Você precisa selecionar pelo menos uma imagem para aplicar uma tag. Se você selecionar várias imagens, qualquer tag selecionada será aplicada a todas as imagens selecionadas.
Por exemplo, podemos escolher um layout dois por dois e aplicar a etiqueta "Mammal" às imagens do urso e da orca, conforme mostrado nesta captura de tela:
Isso mostra a seleção e os layouts de várias imagens. A imagem do tubarão já estava marcada como "Peixe cartilaginoso", e a iguana ainda não tem uma tag.
Importante
Só alterne entre os layouts quando tiver uma página nova de dados sem rótulo. Alternar entre layouts limpa o trabalho de marcação em andamento na página.
Depois de marcar todas as imagens na página, o Azure habilitará o botão Enviar. Selecione Enviar para salvar o trabalho.
Depois que você enviar marcas para os dados à disposição, o Azure atualizará a página com um novo conjunto de imagens da fila de trabalho.
Tarefas de diagnóstico por imagem
Importante
A funcionalidade de rotulagem de DICOM ou tipos de imagem similares não tem a finalidade de ser usada como dispositivo médico, suporte clínico, ferramenta de diagnóstico ou outra tecnologia pensada para diagnosticar, curar, mitigar, tratar ou prevenir doenças ou outras condições, e a Microsoft não concede nenhuma licença ou direito de uso dessa funcionalidade para esses propósitos. A funcionalidade não tem a finalidade de ser implementada ou implantada como um substituto para orientação médica profissional ou opinião de saúde, diagnóstico, tratamento ou julgamento clínico de um profissional de saúde, e não deve ser usada como tal. O cliente é o único responsável por qualquer uso da Rotulagem de Dados para DICOM ou tipos de imagem semelhantes.
Os projetos de imagem dão suporte para o formato de imagem DICOM para imagens de arquivo de raios X, conforme mostrado nesta captura de tela:
Embora as imagens médicas sejam rotuladas com as mesmas ferramentas de qualquer outra imagem, é possível usar uma ferramenta diferente para imagens DICOM, conforme mostrado nesta captura de tela:
Selecione a ferramenta de janela e nível para alterar a intensidade da imagem. Essa ferramenta está disponível apenas para imagens DICOM.
Marcar imagens para classificação multiclasse
Atribua uma única tag à imagem inteira para um tipo de projeto "Classificação de Imagem de Várias Classes". Para examinar as orientações a qualquer momento, acesse a página Instruções e selecione Exibir instruções detalhadas.
Se perceber que cometeu um erro depois de atribuir uma tag a uma imagem, você poderá corrigi-lo. Selecione o "X" no rótulo exibido abaixo da imagem para limpar a tag. Você também pode selecionar a imagem e escolher outra classe. O valor recém-selecionado substituirá a tag aplicada anteriormente.
Marcar imagens para classificação de vários rótulos
Se o seu projeto for do tipo "Classificação de Imagem de Vários Rótulos", você aplicará uma ou mais tags a uma imagem. Para ver as orientações específicas do projeto, selecione Instruções e acesse Exibir instruções detalhadas.
Selecione a imagem que deseja rotular e, em seguida, selecione a tag. A tag é aplicada a todas as imagens selecionadas e, em seguida, a seleção das imagens é anulada. Para aplicar mais marcas, você precisa selecionar as imagens novamente. Esta animação mostra a marcação com vários rótulos:
A animação mostra que
- Selecionar tudo é usado para aplicar a tag "Ocean"
- Uma única imagem é selecionada e marcada com "Closeup"
- Três imagens são selecionadas e marcadas com "Wide angle"
Para corrigir um erro, clique no "X" para limpar uma tag individual ou selecione as imagens e, em seguida, selecione a tag, para limpar a tag de todas as imagens selecionadas. Esse cenário é mostrado aqui. Selecionar "Terrestre" limpará a tag das duas imagens selecionadas. Esta captura de tela mostra o cenário:
O Azure só habilitará o botão Enviar depois que você aplicar pelo menos uma tag a cada imagem. Selecione Enviar para salvar o trabalho.
Marcar imagens e especificar caixas delimitadoras para detecção de objetos
Se o projeto for do tipo "Identificação do Objeto (Caixas Delimitadoras)", especifique uma ou mais caixas delimitadoras na imagem e aplique uma tag a cada caixa. As imagens podem ter várias caixas delimitadoras, cada uma com uma única tag. Use Exibir instruções detalhadas para determinar se seu projeto usa várias caixas delimitadoras.
Selecione uma marca para a caixa delimitadora que você planeja criar.
Selecione "R." ou selecione a ferramenta Caixa retangular, conforme mostrado nesta captura de tela:
Para criar uma caixa delimitadora aproximada, selecione e arraste na diagonal o destino. Arraste as bordas ou os cantos para ajustar a caixa delimitadora, conforme mostrado nesta captura de tela:
Para excluir uma caixa delimitadora, clique no alvo em formato de X exibido ao lado da caixa delimitadora após a criação.
Não é possível alterar a tag de uma caixa delimitadora existente. Para corrigir um erro de atribuição de tag, você precisará excluir a caixa delimitadora e criar outra com a tag correta.
Por padrão, você pode editar as caixas delimitadoras existentes. A ferramenta "L", ou Bloquear/desbloquear regiões alterna esse comportamento, conforme mostrado nesta captura de tela:
Se as regiões estiverem bloqueadas, você só poderá alterar a forma ou a localização de uma nova caixa delimitadora.
A ferramenta Manipulação de regiões consiste em quatro setas que partem do centro e apontam para fora, para cima, para baixo, para a direita e para a esquerda, conforme mostrado nesta captura de tela:
Use a ferramenta Manipulação de regiões, ou "M", para ajustar uma caixa delimitadora existente. Arraste as bordas ou os cantos para ajustar a forma. Selecione no interior se quiser arrastar toda a caixa delimitadora. Caso não seja possível editar uma região, provavelmente você acionou a ferramenta Bloquear/desbloquear regiões.
A ferramenta Caixa baseada em modelo cria várias caixas delimitadoras do mesmo tamanho, conforme mostrado nesta captura de tela:
Use a ferramenta Caixa baseada em modelo, ou "T", para criar várias caixas delimitadoras do mesmo tamanho. Se a imagem não tiver caixas delimitadoras e você ativar caixas baseadas em modelo, a ferramenta produzirá caixas de 50 x 50 pixels. Se você criar uma caixa delimitadora e, em seguida, ativar caixas baseadas em modelo, as novas caixas delimitadoras terão o tamanho da última caixa criada. Você poderá redimensionar as caixas baseadas em modelos após o posicionamento. O redimensionamento de uma caixa baseada em modelo só redimensiona essa caixa específica.
Para excluir todas as caixas delimitadoras na imagem atual, selecione a ferramenta Excluir todas as regiões conforme mostrado nesta captura de tela:
Depois de criar as caixas delimitadores para uma imagem, selecione Enviar para salvar o trabalho, caso contrário, o trabalho em andamento não será salvo.
Marcar imagens e especificar polígonos para segmentação de imagem
Se o seu projeto for do tipo "Segmentação de Instância (Polígono)", especifique um ou mais polígonos na imagem e aplique uma tag a cada polígono. As imagens podem ter vários polígonos delimitadores, cada um com uma marca individual. Use Exibir instruções detalhadas para determinar se seu projeto usa vários polígonos delimitadores.
- Selecione uma marca para o polígono que planeja criar
- Selecione "P", ou selecione a ferramenta Desenhar região de polígono, conforme mostrado nesta captura de tela:
Selecione cada ponto no polígono. Ao concluir a forma, selecione duas vezes para finalizar, conforme mostrado nesta animação:
Para excluir um polígono, clique no destino em formato de X exibido ao lado do polígono após a criação.
Para alterar a tag de um polígono, selecione a ferramenta Mover região, selecione o polígono e escolha a tag correta.
Edite os polígonos existentes. A ferramenta Bloquear/desbloquear regiões, ou "L", alterna esse comportamento, conforme mostrado nesta captura de tela:
Se as regiões estiverem bloqueadas, você só poderá alterar a forma ou a localização de um novo polígono.
Use a ferramenta Adicionar ou remover pontos do polígono, ou 'U', para ajustar um polígono existente, conforme mostrado nesta captura de tela:
Selecione o polígono para adicionar ou remover um ponto. Caso não seja possível editar uma região, provavelmente você acionou a ferramenta Bloquear/desbloquear regiões.
Para excluir todas as caixas delimitadoras na imagem atual, selecione a ferramenta Excluir todas as regiões conforme mostrado nesta captura de tela:
Depois de criar os polígonos para uma imagem, selecione Enviar para salvar o trabalho. Caso contrário, o trabalho em andamento não será salvo.
Marcar imagens e desenhar máscaras para segmentação semântica
Se o projeto for do tipo "Segmentação semântica (versão prévia)", use o pincel para pintar uma máscara sobre a área que você deseja marcar.
Selecione uma marca para a área sobre a qual deseja pintar
Selecione a ferramenta pincel, conforme mostrado nesta captura de tela:
Selecione a ferramenta tamanho para escolher o tamanho do pincel, conforme mostrado nesta captura de tela:
Pinte sobre a área que você deseja marcar. A cor correspondente à sua marca é aplicada à área sobre a qual você pinta
Para excluir partes da área, selecione a ferramenta Borracha.
Para alterar a marca de uma área, selecione a nova marca e pinte novamente a área.
Você também pode usar a ferramenta Polygon para especificar uma região.
Depois de criar as áreas para uma imagem, selecione Enviar para salvar seu trabalho ou seu trabalho em andamento não será salvo. Se você usou a ferramenta Polígono, todos os polígonos são convertidos em uma máscara quando você enviar.
Texto do rótulo
Ao adicionar uma tag a um texto, use a barra de ferramentas para:
- Aumentar ou diminuir o tamanho do texto
- Alterar fonte
- Ignorar a rotulagem deste item e ir para o próximo item
Se perceber que cometeu um erro após ter atribuído uma tag, você poderá corrigi-la. Selecione "X" no rótulo exibido abaixo do texto para limpar a marca.
Há três tipos de projeto de texto:
Tipo de projeto | Descrição |
---|---|
Classificação de várias classes | Atribua uma única tag a toda a entrada de texto. Você pode selecionar apenas uma tag para cada item de texto. Selecione uma tag e, em seguida, selecione Enviar para mover para a próxima entrada. |
Classificação de vários rótulos | Atribua uma ou mais tags para cada entrada de texto. Você pode selecionar várias tags para cada item de texto. Selecione todas as tags que se aplicam e, em seguida, selecione Enviar para mover para a próxima entrada. |
Reconhecimento de entidade nomeada | Marque palavras ou frases diferentes em cada entrada de texto. Veja as orientações na seção abaixo. |
Para ver as orientações específicas do projeto, selecione Instruções e acesse Exibir instruções detalhadas.
Marcar palavras e frases
Se o projeto estiver configurado para reconhecimento de entidade nomeada, marque palavras ou frases diferentes em cada item de texto. Para rotular texto:
- Selecione o rótulo ou digite o número correspondente ao rótulo apropriado
- Clique duas vezes em uma palavra ou use o mouse para selecionar várias palavras.
Para alterar um rótulo, você pode:
- Exclua o rótulo e inicie novamente.
- Alterar o valor de todos ou de um rótulo específico em seu item atual:
- Selecione o rótulo, o que selecionará todas as instâncias desse rótulo.
- Para desmarcar as instâncias que você deseja manter, selecione as instâncias desse rótulo novamente.
- Por fim, selecione um novo rótulo para alterar todos os rótulos que ainda estão selecionados.
Ao marcar todos os itens em uma entrada, selecione Enviar para mover para a próxima entrada.
Conclusão
Quando você envia uma página de dados marcados, o Azure atribui a você novos dados sem rótulo de uma fila de trabalho. Se não houver mais dados sem rótulo disponíveis, uma nova mensagem aparecerá juntamente com um link para a página inicial do portal.
Ao concluir a rotulagem, selecione sua imagem dentro de um círculo no canto superior direito do estúdio e, em seguida, selecione Sair. Se você não sair, o Azure fará com que você atinja o tempo limite e atribuirá seus dados a outro rotulador.