Tipos de serviços de API de visão
O Serviço Cognitivo do Azure para Visão é uma das categorias mais amplas dos Serviços Cognitivos. Você pode usar as APIs para incorporar recursos de visão como análise de imagem, deteção de rosto, análise espacial e reconhecimento ótico de caracteres (OCR) em seus aplicativos, mesmo que tenha conhecimento limitado de aprendizado de máquina.
Serviços
Aqui estão algumas categorias amplas de APIs de visão:
- O Computer Vision fornece algoritmos avançados que processam imagens e retornam informações com base nos recursos visuais em que você está interessado. Disponibiliza quatro serviços: OCR, Face service, Análise de Imagem e Análise Espacial. Form Recognizer é uma versão avançada do OCR.
- A Visão Personalizada é um serviço de reconhecimento de imagem que você pode usar para criar, implantar e melhorar seus próprios modelos de identificador de imagem.
- O serviço Face fornece algoritmos de IA que detetam, reconhecem e analisam rostos humanos em imagens.
Como escolher um serviço
O fluxograma a seguir pode ajudá-lo a escolher um serviço de visão para seu caso de uso específico:
Casos comuns de utilização
Imagem Digitalizada
- Descreva uma imagem. Analise uma imagem, avalie os objetos que são detetados e gere uma frase legível por humanos ou frase que descreva a imagem.
- Marcar recursos visuais. Aplique tags baseadas em um conjunto de milhares de objetos reconhecíveis.
- Categorizar uma imagem. Categorize imagens com base no seu conteúdo.
- Implementar OCR. Detete texto impresso e manuscrito em imagens.
- Detetar tipos de imagem. Por exemplo, identifique imagens de clip-art ou desenhos de linhas.
- Detetar esquemas de cores. Identifique o primeiro plano, o plano de fundo e as cores dominantes e de destaque em uma imagem.
- Gere miniaturas. Crie pequenas versões de imagens.
- Conteúdo moderado. Detete imagens que contenham conteúdo adulto ou que representem cenas sangrentas.
- Detetar conteúdo específico do domínio. Use dois modelos de domínio especializados:
- Celebridades. Identifique milhares de celebridades conhecidas dos domínios do desporto, entretenimento e negócios.
- Pontos de referência. Identifique marcos famosos, como o Taj Mahal e a Estátua da Liberdade.
- Detetar objetos. Identifique objetos comuns e retorne as coordenadas de uma caixa delimitadora.
- Detete marcas. Identifique logotipos de um banco de dados existente de milhares de logotipos de produtos reconhecidos mundialmente.
- Detete rostos. Detete e analise rostos humanos em uma imagem. Você pode determinar a idade do sujeito e retornar uma caixa delimitadora que especifica os locais dos rostos. As capacidades de análise facial do serviço de Visão por Computador são um subconjunto das fornecidas pelo serviço Face dedicado.
Visão Personalizada
- Classifique imagens. Preveja uma categoria, ou classe, com base em um conjunto de entradas, que são chamadas de recursos. Calcule uma pontuação de probabilidade para cada classe possível e retorne um rótulo que indique a classe à qual o objeto provavelmente pertence. Para usar esse modelo, você precisa de dados que consistem em recursos e seus rótulos.
- Detetar objetos. Obtenha as coordenadas de um objeto em uma imagem. Para usar esse modelo, você precisa de dados que consistem em recursos e seus rótulos.
Serviços faciais
- Detete rostos. Identifique as regiões de uma imagem que contêm um rosto humano, normalmente retornando as coordenadas da caixa delimitadora que formam um retângulo ao redor do rosto.
- Analise rostos. Retornar informações, como pontos de referência faciais (nariz, olhos, sobrancelhas, lábios e muito mais). Você pode usar esses pontos de referência faciais como recursos para treinar um modelo de aprendizado de máquina que pode inferir informações sobre as pessoas, como sua idade percebida ou estado emocional.
- Reconheça rostos. Treine um modelo de aprendizado de máquina para identificar indivíduos conhecidos a partir de suas características faciais.
Contribuidores
Este artigo é mantido pela Microsoft. Foi originalmente escrito pelos seguintes contribuidores.
Principais autores:
- Ashish Chahuan - Brasil | Arquiteto de Soluções Cloud Sênior
- Kruti Mehta - Brasil | Engenheiro Fast-Track Sénior do Azure
Outros contribuidores:
- Mick Alberts - Brasil | Redator Técnico
- Brandon Cowen - Brasil | Arquiteto de Soluções Cloud Sênior
- Oscar Shimabukuro - Brasil | Arquiteto de Soluções Cloud Sênior
- Manjit Singh - Brasil | Engenheiro de Software
- Christina Skarpathiotaki - Brasil | Arquiteto de Soluções Cloud Sênior
- Nathan Widdup - Brasil | Engenheiro Fast-Track Sénior do Azure
Para ver perfis não públicos do LinkedIn, inicie sessão no LinkedIn.
Próximos passos
- O que é a Visão por Computador?
- Postagem no blog das APIs de visão
- Caminho de aprendizagem: Criar uma solução de Compreensão de Idiomas com os Serviços Cognitivos do Azure
- Caminho de aprendizagem: provisionar e gerenciar os Serviços Cognitivos do Azure
- Caminho de aprendizagem: Explore a visão computacional
- Caminho de aprendizagem: Criar soluções de visão computacional com os Serviços Cognitivos do Azure
- Caminho de aprendizagem: Criar uma solução de reconhecimento de imagem com o Azure IoT Edge e os Serviços Cognitivos do Azure
Recursos relacionados
Comentários
https://aka.ms/ContentUserFeedback.
Brevemente: Ao longo de 2024, vamos descontinuar progressivamente o GitHub Issues como mecanismo de feedback para conteúdos e substituí-lo por um novo sistema de feedback. Para obter mais informações, veja:Submeter e ver comentários