Rotulagem de imagens e documentos de texto

Artigo
08/16/2023

Depois que o administrador do projeto criar um projeto de rotulagem de dados de imagem ou um projeto de rotulagem de dados de texto do Azure Machine Learning, será possível usar a ferramenta de rotulagem para preparar rapidamente os dados para um projeto de Machine Learning. Este artigo descreve:

Como acessar seus projetos de rotulagem
As ferramentas de rotulagem
Como usar as ferramentas para tarefas de rotulagem específicas

Pré-requisitos

Uma conta da Microsoft ou uma conta do Microsoft Entra para a organização e o projeto.
Acesso no nível de colaborador ao espaço de trabalho que contém o projeto de rotulagem.

Entre no Estúdio do Azure Machine Learning.
Selecione a assinatura e o workspace que contém o projeto de rotulagem. O administrador do projeto tem essas informações.
Você poderá ver várias seções à esquerda, dependendo do seu nível de acesso. Se for o caso, selecione Rotulagem de dados no lado esquerdo para localizar o projeto.

Entender a tarefa de rotulagem

Na tabela de projetos de rotulagem de dados, selecione o link Rotular dados para seu projeto.

Você verá instruções, específicas para o seu projeto. Elas explicam o tipo de dados com o qual você está lidando, como deverá tomar decisões e outras informações relevantes. Leia as informações e selecione Tarefas na parte superior da página. Você também pode selecionar Iniciar rotulagem na parte inferior da página.

Seleção de rótulo

Em todas as tarefas de rotulagem de dados, você pode escolher uma tag apropriada ou tags de um conjunto especificado pelo administrador de projeto. Você pode usar as teclas de número do teclado para selecionar as nove primeiras tags.

Aprendizado de máquina assistido

Os algoritmos de aprendizado de máquina podem ser disparados durante a rotulagem. Se o projeto tiver esses algoritmos habilitados, você poderá ver:

Imagens
- Após uma certa quantidade de dados ter sido rotulada, talvez você veja Tarefas clusterizadas na parte superior da tela, ao lado do nome do projeto. As imagens são agrupadas para apresentar as imagens semelhantes na mesma página. Se estiver vendo isso, alterne para um dos vários modos de exibição de imagens para tirar proveito do agrupamento.
- Posteriormente, talvez você veja Tarefas pré-rotuladas ao lado do nome do projeto. Os itens aparecerão com um rótulo sugerido proveniente de um modelo de classificação de aprendizado de máquina. Nenhum modelo de machine learning tem precisão de 100%. Embora utilizemos apenas dados que o modelo considera confiáveis, esses valores de dados ainda podem ser pré-rotulados incorretamente. Se estiver vendo esses rótulos, corrija os rótulos incorretos antes de enviar a página.
- Para modelos de identificação de objetos, você poderá ver caixas delimitadoras e rótulos que já estão presentes. Corrija todos os erros neles antes de enviar a página.
- Para modelos de segmentação, você poderá ver polígonos e rótulos que já estão presentes. Corrija todos os erros neles antes de enviar a página.
Texto
- Por fim, você poderá ver as Tarefas pré-rotuladas ao lado do nome do projeto. Os itens aparecerão com um rótulo sugerido proveniente de um modelo de classificação de aprendizado de máquina. Nenhum modelo de machine learning tem precisão de 100%. Embora utilizemos apenas dados para os quais o modelo é confiável, esses valores de dados ainda podem estar pré-rotulados incorretamente. Quando você vir esses rótulos, corrija os rótulos incorretos antes de enviar a página.

No início de um projeto de rotulagem, o modelo de machine learning pode ter apenas o grau de precisão suficiente para pré-rotular um pequeno subconjunto de imagens. Depois que essas imagens forem rotuladas, o projeto de rotulagem voltará à rotulagem manual para coletar mais dados para a próxima rodada de treinamento do modelo. Ao longo do tempo, o modelo se tornará mais confiante em relação a uma proporção mais alta de imagens. Mais para a frente no projeto, a confiança do modelo resultará em mais tarefas pré-rotuladas.

Quando não houver mais tarefas pré-rotuladas, você deixará de confirmar ou corrigir rótulos e voltará a marcar os itens manualmente.

Tarefas de imagem

Em tarefas de classificação de imagem, opte por exibir várias imagens simultaneamente. Use os ícones acima da área da imagem para selecionar o layout.

Para selecionar todas as imagens exibidas simultaneamente, use Selecionar tudo. Para selecionar imagens individuais, use o botão de seleção circular no canto superior direito da imagem. Você precisa selecionar pelo menos uma imagem para aplicar uma tag. Se você selecionar várias imagens, qualquer tag selecionada será aplicada a todas as imagens selecionadas.

Aqui, escolhemos um layout de dois por dois e aplicamos a tag "Mamífero" às imagens de urso e orca. A imagem do tubarão já estava marcada como "Peixe cartilaginoso", e a iguana ainda não tem uma tag.

Multiple image layouts and selection

Importante

Só alterne entre os layouts quando tiver uma página nova de dados sem rótulo. Alternar entre layouts limpa o trabalho de marcação em andamento na página.

Depois de marcar todas as imagens na página, o Azure habilitará o botão Enviar. Selecione Enviar para salvar o trabalho.

Depois que você enviar marcas para os dados à disposição, o Azure atualizará a página com um novo conjunto de imagens da fila de trabalho.

Tarefas de diagnóstico por imagem

Importante

A funcionalidade de rotulagem de DICOM ou tipos de imagem similares não tem a finalidade de ser usada como dispositivo médico, suporte clínico, ferramenta de diagnóstico ou outra tecnologia pensada para diagnosticar, curar, mitigar, tratar ou prevenir doenças ou outras condições, e a Microsoft não concede nenhuma licença ou direito de uso dessa funcionalidade para esses propósitos. A funcionalidade não tem a finalidade de ser implementada ou implantada como um substituto para orientação médica profissional ou opinião de saúde, diagnóstico, tratamento ou julgamento clínico de um profissional de saúde, e não deve ser usada como tal. O cliente é o único responsável por qualquer uso da Rotulagem de Dados para DICOM ou tipos de imagem semelhantes.

Os projetos de imagem suportam o formato de imagem DICOM para imagens de arquivo de raio x.

X-ray DICOM image to be labeled.

Ainda que você rotule as imagens médicas com as mesmas ferramentas de qualquer outra imagem, você poderá usar uma ferramenta diferente para imagens DICOM. Selecione a ferramenta de janela e nível para alterar a intensidade da imagem. Essa ferramenta está disponível apenas para imagens DICOM.

Window and level tool for DICOM images.

Marcar imagens para classificação multiclasse

Atribua uma única tag à imagem inteira para um tipo de projeto "Classificação de Imagem de Várias Classes". Para examinar as orientações a qualquer momento, acesse a página Instruções e selecione Exibir instruções detalhadas.

Se perceber que cometeu um erro depois de atribuir uma tag a uma imagem, você poderá corrigi-lo. Selecione o "X" no rótulo exibido abaixo da imagem para limpar a tag. Você também pode selecionar a imagem e escolher outra classe. O valor recém-selecionado substituirá a tag aplicada anteriormente.

Marcar imagens para classificação de vários rótulos

Se o seu projeto for do tipo "Classificação de Imagem de Vários Rótulos", você aplicará uma ou mais tags a uma imagem. Para ver as orientações específicas do projeto, selecione Instruções e acesse Exibir instruções detalhadas.

Selecione a imagem que deseja rotular e, em seguida, selecione a tag. A tag é aplicada a todas as imagens selecionadas e, em seguida, a seleção das imagens é anulada. Para aplicar mais marcas, você precisa selecionar as imagens novamente. A seguinte animação mostra a marcação de vários rótulos:

Selecionar tudo é usado para aplicar a tag "Ocean".
Uma única imagem é selecionada e marcada como "Closeup".
Três imagens são selecionadas e marcadas como "Wide angle".

Animation shows multilabel flow

Para corrigir um erro, clique no "X" para limpar uma tag individual ou selecione as imagens e, em seguida, selecione a tag, para limpar a tag de todas as imagens selecionadas. Esse cenário é mostrado aqui. Selecionar "Terrestre" limpará a tag das duas imagens selecionadas.

A screenshot shows multiple deselections

O Azure só habilitará o botão Enviar depois que você aplicar pelo menos uma tag a cada imagem. Selecione Enviar para salvar o trabalho.

Marcar imagens e especificar caixas delimitadoras para detecção de objetos

Se o projeto for do tipo "Identificação do Objeto (Caixas Delimitadoras)", especifique uma ou mais caixas delimitadoras na imagem e aplique uma tag a cada caixa. As imagens podem ter várias caixas delimitadoras, cada uma com uma única tag. Use Exibir instruções detalhadas para determinar se seu projeto usa várias caixas delimitadoras.

Selecione uma tag para a caixa delimitadora que pretende criar.
Selecione a ferramenta Caixa retangular ou selecione "R".
Selecione e arraste diagonalmente até o alvo para criar uma caixa delimitadora aproximada. Arraste as bordas ou os cantos para ajustar a caixa delimitadora.

Bounding box creation

Para excluir uma caixa delimitadora, clique no alvo em formato de X exibido ao lado da caixa delimitadora após a criação.

Não é possível alterar a tag de uma caixa delimitadora existente. Para corrigir um erro de atribuição de tag, você precisará excluir a caixa delimitadora e criar outra com a tag correta.

Por padrão, você pode editar as caixas delimitadoras existentes. A ferramenta Bloquear/desbloquear regiões Lock/unlock regions tool ou "L" ativa e desativa esse comportamento. Se as regiões estiverem bloqueadas, você só poderá alterar a forma ou a localização de uma nova caixa delimitadora.

Use a ferramenta Manipulação de regiões This is the regions manipulation tool icon - four arrows pointing outward from the center, up, right, down, and left. ou “M”, para ajustar uma caixa delimitadora existente. Arraste as bordas ou os cantos para ajustar a forma. Selecione no interior se quiser arrastar toda a caixa delimitadora. Caso não seja possível editar uma região, provavelmente você acionou a ferramenta Bloquear/desbloquear regiões.

Use a ferramenta Caixa baseada em modelo Template-box tool , ou "T", para criar várias caixas delimitadoras do mesmo tamanho. Se a imagem não tiver caixas delimitadoras e você ativar caixas baseadas em modelo, a ferramenta produzirá caixas de 50 x 50 pixels. Se você criar uma caixa delimitadora e, em seguida, ativar caixas baseadas em modelo, as novas caixas delimitadoras terão o tamanho da última caixa criada. Você poderá redimensionar as caixas baseadas em modelos após o posicionamento. O redimensionamento de uma caixa baseada em modelo só redimensiona essa caixa específica.

Para excluir todas as caixas delimitadoras na imagem atual, selecione a ferramenta Excluir todas as regiões Delete regions tool .

Depois de criar as caixas delimitadores para uma imagem, selecione Enviar para salvar o trabalho, caso contrário, o trabalho em andamento não será salvo.

Marcar imagens e especificar polígonos para segmentação de imagem

Se o seu projeto for do tipo "Segmentação de Instância (Polígono)", especifique um ou mais polígonos na imagem e aplique uma tag a cada polígono. As imagens podem ter vários polígonos delimitadores, cada um com uma marca individual. Use Exibir instruções detalhadas para determinar se seu projeto usa vários polígonos delimitadores.

Selecione uma marca para o polígono que pretende criar.
Selecione a ferramenta Desenhar região do polígono ou selecione "P".
Selecione cada ponto no polígono. Ao concluir a forma, clique duas vezes para finalizar.

Para excluir um polígono, clique no destino em formato de X exibido ao lado do polígono após a criação.

Para alterar a tag de um polígono, selecione a ferramenta Mover região, selecione o polígono e escolha a tag correta.

Edite os polígonos existentes. A ferramenta Bloquear/desbloquear regiões Edit polygons with the lock/unlock regions tool ou a seleção de "L" ativa e desativa esse comportamento. Se as regiões estiverem bloqueadas, você só poderá alterar a forma ou a localização de um novo polígono.

Use a ferramenta Adicionar ou remover pontos de polígono This is the add or remove polygon points tool icon. ou "U" para ajustar um polígono existente. Selecione o polígono para adicionar ou remover um ponto. Caso não seja possível editar uma região, provavelmente você acionou a ferramenta Bloquear/desbloquear regiões.

Para excluir todos os polígonos da imagem atual, selecione a ferramenta Excluir todas as regiões Delete all regions tool .

Depois de criar os polígonos para uma imagem, selecione Enviar para salvar o trabalho. Caso contrário, o trabalho em andamento não será salvo.

Marcar imagens e desenhar máscaras para segmentação semântica

Se o projeto for do tipo "Segmentação semântica (versão prévia)", use o pincel para pintar uma máscara sobre a área que você deseja marcar.

Selecione uma marca para a área sobre a qual você pintará.
Selecione a ferramenta paintbrush .
Selecione a ferramentade tamanho para escolher um tamanho para o pincel.
Pinte sobre a área que você deseja marcar. A cor correspondente à marca será aplicada à área sobre a qual você pinta.

Para excluir partes da área, selecione a ferramenta Borracha.

Para alterar a marca de uma área, selecione a nova marca e pinte novamente a área.

Você também pode usar a ferramenta Polygon para especificar uma região.

Depois de criar as áreas para uma imagem, selecione Enviar para salvar seu trabalho ou seu trabalho em andamento não será salvo. Se você usou a ferramenta Polygon, todos os polígonos serão convertidos em uma máscara quando você enviar.

Texto do rótulo

Ao adicionar uma tag a um texto, use a barra de ferramentas para:

Aumentar ou diminuir o tamanho do texto
Alterar fonte
Ignorar a rotulagem deste item e ir para o próximo item

Se perceber que cometeu um erro após ter atribuído uma tag, você poderá corrigi-la. Selecione o "X" no rótulo que é exibido abaixo do texto para limpar a tag.

Há três tipos de projeto de texto:

Tipo de projeto	Descrição
Classificação de várias classes	Atribua uma única tag a toda a entrada de texto. Você pode selecionar apenas uma tag para cada item de texto. Selecione uma tag e, em seguida, selecione Enviar para mover para a próxima entrada.
Classificação de vários rótulos	Atribua uma ou mais tags para cada entrada de texto. Você pode selecionar várias tags para cada item de texto. Selecione todas as tags que se aplicam e, em seguida, selecione Enviar para mover para a próxima entrada.
Reconhecimento de entidade nomeada	Marque palavras ou frases diferentes em cada entrada de texto. Veja as orientações na seção abaixo.

Para ver as orientações específicas do projeto, selecione Instruções e acesse Exibir instruções detalhadas.

Marcar palavras e frases

Se o projeto estiver configurado para reconhecimento de entidade nomeada, marque palavras ou frases diferentes em cada item de texto. Para rotular texto:

Selecione o rótulo ou digite o número correspondente ao rótulo apropriado
Clique duas vezes em uma palavra ou use o mouse para selecionar várias palavras.

Screenshot: Named entity recognition.

Para alterar um rótulo, você pode:

Exclua o rótulo e inicie novamente.
Alterar o valor de todos ou de um rótulo específico em seu item atual:
- Selecione o rótulo, o que selecionará todas as instâncias desse rótulo.
- Selecione novamente as instâncias desse rótulo para desmarcar as instâncias que você deseja manter.
- Por fim, selecione um novo rótulo para alterar todos os rótulos que ainda estão selecionados.

Ao marcar todos os itens em uma entrada, selecione Enviar para mover para a próxima entrada.

Conclusão

Quando você envia uma página de dados marcados, o Azure atribui a você novos dados sem rótulo de uma fila de trabalho. Se não houver mais dados sem rótulo disponíveis, uma nova mensagem aparecerá juntamente com um link para a página inicial do portal.

Ao concluir a rotulagem, selecione sua imagem dentro de um círculo no canto superior direito do estúdio e, em seguida, selecione Sair. Se você não sair, o Azure fará com que você atinja o tempo limite e atribuirá seus dados a outro rotulador.

Próximas etapas

Saiba como treinar modelos de classificação de imagens no Azure

Compartilhar via

Rotulagem de imagens e documentos de texto

Pré-requisitos

Entender a tarefa de rotulagem

Seleção de rótulo

Aprendizado de máquina assistido

Tarefas de imagem

Tarefas de diagnóstico por imagem

Marcar imagens para classificação multiclasse

Marcar imagens para classificação de vários rótulos

Marcar imagens e especificar caixas delimitadoras para detecção de objetos

Marcar imagens e especificar polígonos para segmentação de imagem

Marcar imagens e desenhar máscaras para segmentação semântica

Texto do rótulo

Marcar palavras e frases

Conclusão

Próximas etapas

Recursos adicionais

Compartilhar via

Rotulagem de imagens e documentos de texto

Pré-requisitos

Entrar no estúdio

Entender a tarefa de rotulagem

Seleção de rótulo

Aprendizado de máquina assistido

Tarefas de imagem

Tarefas de diagnóstico por imagem

Marcar imagens para classificação multiclasse

Marcar imagens para classificação de vários rótulos

Marcar imagens e especificar caixas delimitadoras para detecção de objetos

Marcar imagens e especificar polígonos para segmentação de imagem

Marcar imagens e desenhar máscaras para segmentação semântica

Texto do rótulo

Marcar palavras e frases

Conclusão

Próximas etapas

Recursos adicionais