O que há de novo no Azure AI Vision

Artigo
03/11/2024

Saiba o que há de novo no Azure AI Vision. Verifique esta página para se manter atualizado com novos recursos, aprimoramentos, correções e atualizações de documentação.

Fevereiro de 2024

Incorporação multimodal GA: novo modelo multilingue

A API de incorporações multimodais foi atualizada e está agora disponível para o público em geral. A nova 2024-02-01 API inclui um novo modelo que suporta pesquisa de texto em 102 idiomas. O modelo original apenas em inglês ainda está disponível, mas não pode ser combinado com o novo modelo no mesmo índice de pesquisa. Se você vetorizou texto e imagens usando o modelo somente em inglês, esses vetores não são compatíveis com vetores de texto e imagem multilíngues.

Consulte a página de suporte a idiomas para obter a lista de idiomas suportados.

Janeiro de 2024

Novo SDK de Análise de Imagem 1.0.0-beta.1 (alterações de quebra)

O SDK de Análise de Imagem foi reescrito na versão 1.0.0-beta.1 para melhor alinhamento com outros SDKs do Azure. Todas as APIs foram alteradas. Consulte os guias de início rápido, exemplos e instruções atualizados para obter informações sobre como usar o novo SDK.

Principais alterações:

O SDK agora chama a API REST de Visão do Computador disponível em geral (2023-10-01), em vez da API REST de Visão do Computador (2023-04-01-preview).
Foi adicionado suporte para JavaScript.
C++ não é mais suportado.
A Análise de Imagem com um modelo personalizado e a Segmentação de Imagem (remoção de plano de fundo) não são mais suportadas no SDK, porque a API REST do Computer Vision (2023-10-01) ainda não oferece suporte a elas. Para usar qualquer um dos recursos, chame a API REST do Computer Vision (2023-04-01-preview) diretamente (usando as Analyze operações e Segment respectivamente).

Novembro de 2023

Analisar Imagem 4.0 GA

A API REST Analyze Image 4.0 está agora em Disponibilidade Geral. Siga o início rápido do Analyze Image 4.0 para começar.

Os outros recursos da Análise de Imagem, como personalização de modelo, remoção de plano de fundo e incorporações multimodais, permanecem em visualização pública.

SDK do lado do cliente do rosto para deteção de vivacidade

O SDK do Face Liveness suporta a deteção de vivacidade nos dispositivos móveis ou de borda dos usuários. Está disponível em Java/Kotlin para Android e Swift/Objective-C para iOS.

Nosso serviço de deteção de vivacidade atende à conformidade iBeta Nível 1 e 2 ISO/IEC 30107-3.

Setembro de 2023

Descontinuação de versões desatualizadas da API de Visão Computacional

As versões 1.0, 2.0, 3.0 e 3.1 da API de Visão Computacional serão desativadas em 13 de setembro de 2026. Os desenvolvedores não poderão fazer chamadas de API para essas APIs após essa data. Recomendamos que todos os clientes afetados migrem suas cargas de trabalho para a API do Computer Vision 3.2 disponível em geral seguindo este QuickStart o mais rápido possível. Os clientes também devem considerar a migração para a API de Análise de Imagem 4.0 (visualização), que tem nossos melhores e mais recentes recursos de Análise de Imagem.

Visite as nossas P&R para qualquer questão.

Maio de 2023

Análise de Imagem 4.0 Reconhecimento do Produto (visualização pública)

As APIs de reconhecimento de produtos permitem analisar fotos de prateleiras em uma loja de varejo. Você pode detetar a presença e ausência de produtos e obter suas coordenadas de caixa delimitadora. Use-o em combinação com a personalização do modelo para treinar um modelo para identificar seus produtos específicos. Também pode comparar os resultados do Reconhecimento de Produtos com o documento de planograma da sua loja. Reconhecimento de Produtos.

Abril de 2023

Tokens de acesso limitado de rosto

Fornecedores independentes de software (ISVs) podem gerenciar o uso da API Face de seus clientes emitindo tokens de acesso que concedem acesso aos recursos do Face que normalmente são bloqueados. Isso permite que as empresas clientes usem a API Face sem ter que passar pelo processo de aprovação formal. Use tokens de acesso limitado.

Março de 2023

Visualização pública do SDK do Azure AI Vision Image Analysis 4.0

O modelo de fundação de Florença agora está integrado ao Azure AI Vision. Os serviços de Visão aprimorados permitem que os desenvolvedores criem aplicativos Azure AI Vision responsáveis e prontos para o mercado em vários setores. Os clientes agora podem digitalizar, analisar e conectar perfeitamente seus dados a interações em linguagem natural, desbloqueando insights poderosos de seu conteúdo de imagem e vídeo para oferecer suporte à acessibilidade, impulsionar a aquisição por meio de SEO, proteger os usuários de conteúdo prejudicial, aumentar a segurança e melhorar os tempos de resposta a incidentes. Para obter mais informações, consulte Anunciando o modelo de fundação de Florença da Microsoft.

SDK do Image Analysis 4.0 (visualização pública)

O Image Analysis 4.0 agora está disponível por meio de SDKs de biblioteca de cliente em C#, C++ e Python. Esta atualização também inclui a legenda de imagem alimentada por Florença e legendas densas no desempenho de paridade humana.

Análise de Imagem V4.0 Legendagem e Legendagem Densa (pré-visualização pública):

"Caption" substitui "Describe" na V4.0 como o recurso de legendagem de imagem aprimorado rico em detalhes e compreensão semântica. As legendas densas fornecem mais detalhes, gerando descrições de uma frase de até 10 regiões da imagem, além de descrever a imagem inteira. As legendas densas também retornam as coordenadas da caixa delimitadora das regiões de imagem descritas. Há também um novo parâmetro neutro de gênero para permitir que os clientes escolham se habilitam a inferência probabilística de gênero para aplicativos de texto alternativo e Vendo IA. Forneça automaticamente legendas ricas, texto alternativo acessível, otimização SEO e curadoria inteligente de fotos para suportar conteúdo digital. Legendas das imagens.

Resumo do vídeo e localizador de quadros (visualização pública):

Pesquise e interaja com conteúdo de vídeo da mesma forma intuitiva que pensa e escreve. Localize conteúdo relevante sem a necessidade de metadados extras. Disponível apenas no Vision Studio.

Personalização do modelo do Image Analysis 4.0 (visualização pública)

Agora você pode criar e treinar seus próprios modelos personalizados de classificação de imagem e deteção de objetos, usando o Vision Studio ou as APIs REST v4.0.

APIs de incorporação multimodal (visualização pública)

As APIs de incorporação multimodal, parte da API de Análise de Imagem 4.0, permitem a vetorização de imagens e consultas de texto. Eles permitem converter imagens e texto em coordenadas em um espaço vetorial multidimensional. Agora você pode pesquisar com linguagem natural e encontrar imagens relevantes usando a pesquisa de semelhança vetorial.

APIs de remoção em segundo plano (visualização pública)

Como parte da API de Análise de Imagem 4.0, a API de remoção de plano de fundo permite remover o plano de fundo de uma imagem. Esta operação pode gerar uma imagem do objeto de primeiro plano detetado com um plano de fundo transparente ou uma imagem fosca alfa em escala de cinza mostrando a opacidade do objeto de primeiro plano detetado.

Azure AI Vision 3.0 & 3.1 visualiza a descontinuação

As versões de visualização das APIs do Azure AI Vision 3.0 e 3.1 estão programadas para serem desativadas em 30 de setembro de 2023. Os clientes não poderão fazer chamadas para essas APIs após essa data. Em vez disso, os clientes são incentivados a migrar suas cargas de trabalho para a API 3.2 (geralmente disponível). Lembre-se das seguintes alterações ao migrar das versões de visualização para a API 3.2:

As chamadas da API Analyze Image and Read usam um parâmetro opcional de versão do modelo que você pode usar para especificar qual modelo de IA usar. Por padrão, eles usam o modelo mais recente.
As chamadas da API Analisar imagem e ler também retornam um model-version campo em respostas de API bem-sucedidas. Este campo informa qual o modelo utilizado.
A API do Azure AI Vision 3.2 usa um formato diferente de relatório de erros. Consulte a documentação de referência da API para saber como ajustar qualquer código de tratamento de erros.

Outubro de 2022

Azure AI Vision Image Analysis 4.0 (visualização pública)

O Image Analysis 4.0 foi lançado em pré-visualização pública. A nova API inclui legendagem de imagens, marcação de imagens, deteção de objetos, cortes inteligentes, deteção de pessoas e funcionalidade de leitura de OCR, tudo disponível por meio de uma operação Analisar imagem. O OCR é otimizado para imagens gerais não documentais em uma API síncrona com desempenho aprimorado que facilita a incorporação de experiências baseadas em OCR em seus fluxos de trabalho.

Setembro de 2022

Azure AI Vision 3.0/3.1 Ler pré-visualizações descontinuadas

As versões de visualização da API de leitura do Azure AI Vision 3.0 e 3.1 estão programadas para serem desativadas em 31 de janeiro de 2023. Os clientes são incentivados a consultar o How-To e o QuickStarts para começar a usar a versão geralmente disponível (GA) da API de leitura. As versões mais recentes do GA oferecem os seguintes benefícios:

2022 mais recente modelo de OCR disponível em geral
Expansão significativa da cobertura de linguagem OCR, incluindo suporte para texto manuscrito
Melhor qualidade de OCR

Junho de 2022

Lançamento do Vision Studio

O Vision Studio é uma ferramenta de interface do usuário que permite explorar, criar e integrar recursos do Azure AI Vision em seus aplicativos.

O Vision Studio fornece uma plataforma para experimentar vários recursos de serviço e ver o que eles retornam de maneira visual. Usando o Studio, você pode começar sem precisar escrever código e, em seguida, usar as bibliotecas de cliente disponíveis e APIs REST em seu aplicativo.

IA responsável para o rosto

Nota de transparência facial

A nota de transparência fornece orientação para ajudar nossos clientes a melhorar a precisão e a equidade de seus sistemas, incorporando uma revisão humana significativa para detetar e resolver casos de identificação incorreta ou outras falhas, fornecendo suporte a pessoas que acreditam que seus resultados estavam incorretos e identificando e abordando flutuações na precisão devido a variações nas condições operacionais.

Retirada de atributos sensíveis

Aposentamos as capacidades de análise facial que pretendem inferir estados emocionais e atributos de identidade, como sexo, idade, sorriso, pelos faciais, cabelo e maquiagem.
Os recursos de deteção facial (incluindo deteção de desfoque, exposição, óculos, cabeceira, pontos de referência, ruído, oclusão, caixa delimitadora facial) permanecerão geralmente disponíveis e não exigem um aplicativo.

Pacote Fairlearn e Painel de Equidade da Microsoft

O pacote Fairlearn de código aberto e o Painel de Equidade da Microsoft visam apoiar os clientes a medir a equidade dos algoritmos de verificação facial da Microsoft em seus próprios dados, permitindo-lhes identificar e abordar possíveis problemas de equidade que podem afetar diferentes grupos demográficos antes de implantarem sua tecnologia.

Política de acesso limitado

Como parte do alinhamento do Face ao Padrão de IA Responsável atualizado, uma nova política de Acesso Limitado foi implementada para a API do Face e o Azure AI Vision. Os clientes existentes têm um ano para solicitar e receber aprovação para acesso contínuo aos serviços de reconhecimento facial com base nos casos de uso fornecidos. Veja detalhes sobre Acesso Limitado para Face aqui e para Azure AI Vision aqui.

Descontinuação do Azure AI Vision 3.2-preview

As versões de visualização da API 3.2 estão programadas para serem desativadas em dezembro de 2022. Os clientes são incentivados a usar a versão geralmente disponível (GA) da API. Lembre-se das seguintes alterações ao migrar das versões 3.2-preview:

As chamadas da API Analyze Image and Read agora usam um parâmetro opcional de versão do modelo que você pode usar para especificar qual modelo de IA usar. Por padrão, eles usam o modelo mais recente.
As chamadas da API Analisar imagem e ler também retornam um model-version campo em respostas de API bem-sucedidas. Este campo informa qual o modelo utilizado.
As APIs de análise de imagem agora usam um formato diferente de relatório de erros. Consulte a documentação de referência da API para saber como ajustar qualquer código de tratamento de erros.

Maio de 2022

O modelo de API OCR (leitura) está geralmente disponível (GA)

O modelo mais recente da API OCR (Leitura) do Azure AI Vision com 164 idiomas suportados está agora disponível como um serviço de nuvem e contêiner.

O suporte a OCR para texto impresso expande-se para 164 idiomas, incluindo russo, árabe, hindi e outros idiomas usando scripts cirílicos, árabes e devanágaros.
O suporte a OCR para texto manuscrito expande-se para 9 idiomas com inglês, chinês simplificado, francês, alemão, italiano, japonês, coreano, português e espanhol.
Suporte aprimorado para caracteres únicos, datas manuscritas, valores, nomes, outras entidades comumente encontradas em recibos e faturas.
Processamento melhorado de documentos PDF digitais.
O limite de tamanho do arquivo de entrada aumentou 10x para 500 MB.
Melhorias de desempenho e latência.
Disponível como serviço de nuvem e contêiner Docker.

Consulte o guia de instruções de OCR para saber como usar o modelo GA.

Introdução à API de leitura

Fevereiro de 2022

OCR (leitura) API Public Preview suporta 164 idiomas

A API OCR (Leitura) do Azure AI Vision expande os idiomas suportados para 164 com a sua pré-visualização mais recente:

O suporte a OCR para texto impresso expande-se para 42 novos idiomas, incluindo árabe, hindi e outros idiomas usando scripts árabes e devanágari.
O suporte a OCR para texto manuscrito se expande para japonês e coreano, além de inglês, chinês simplificado, francês, alemão, italiano, português e espanhol.
Aprimoramentos, incluindo melhor suporte para extrair datas, quantidades, nomes e caixas de caracteres únicos manuscritos.
Melhorias gerais de desempenho e qualidade de IA

Consulte o guia de instruções de OCR para saber como usar os novos recursos de visualização.

Introdução à API de leitura

Novo Atributo de Qualidade em Detection_01 e Detection_03

Para ajudar os integradores de sistemas e seus clientes a capturar imagens de alta qualidade, que são necessárias para saídas de alta qualidade da API Face, estamos introduzindo um novo atributo de qualidade QualityForRecognition para ajudar a decidir se uma imagem tem qualidade suficiente para tentar o reconhecimento facial. O valor é uma classificação informal de baixo, médio ou alto. O novo atributo só está disponível ao usar qualquer combinação de modelos detection_01 de deteção ou detection_03, e modelos recognition_03 de reconhecimento ou recognition_04. Apenas imagens de "alta" qualidade são recomendadas para inscrição de pessoas e qualidade acima de "média" é recomendada para cenários de identificação. Para saber mais sobre o novo atributo de qualidade, consulte Deteção de rosto e atributos e veja como usá-lo com o Guia de início rápido.

Setembro de 2021

OCR (leitura) API Public Preview suporta 122 idiomas

A API OCR (Leitura) do Azure AI Vision expande os idiomas suportados para 122 com a sua pré-visualização mais recente:

Suporte OCR para imprimir texto em 49 novos idiomas, incluindo russo, búlgaro e outros idiomas cirílicos e mais latinos.
Suporte OCR para texto manuscrito em 6 novos idiomas que incluem inglês, chinês simplificado, francês, alemão, italiano, português e espanhol.
Melhorias para o processamento de PDFs digitais e texto de zona de leitura automática (MRZ) em documentos de identidade.
Melhorias gerais de desempenho e qualidade de IA

Consulte o guia de instruções de OCR para saber como usar os novos recursos de visualização.

Introdução à API de leitura

Agosto de 2021

Expansão da linguagem de marcação de imagem

A versão mais recente (v3.2) do Image tagger agora suporta tags em 50 idiomas. Consulte a página de suporte a idiomas para obter mais informações.

Julho de 2021

Novas melhorias no HeadPose e Marcos para Detection_03

O modelo Detection_03 foi atualizado para suportar marcos faciais.
A característica dos pontos de referência em Detection_03 é muito mais precisa, especialmente nos pontos de referência do globo ocular, que são cruciais para o rastreamento do olhar.

Maio de 2021

Atualização do contêiner de Análise Espacial

Uma nova versão do contêiner Análise Espacial foi lançada com um novo conjunto de recursos. Este contêiner do Docker permite analisar o streaming de vídeo em tempo real para entender as relações espaciais entre as pessoas e seu movimento através de ambientes físicos.

As operações de Análise Espacial agora podem ser configuradas para detetar a orientação que uma pessoa está enfrentando.
- Um classificador de orientação pode ser habilitado para as personcrossingline operações e personcrossingpolygon configurando o enable_orientation parâmetro. Ele está definido como desativado por padrão.
As operações de Análise Espacial agora também oferecem configuração para detetar a velocidade de uma pessoa enquanto caminha/corre
- A velocidade pode ser detetada para as personcrossingline operações e personcrossingpolygon ligando o enable_speed classificador, que está desligado por padrão. A saída é refletida speedno , avgSpeede minSpeed saídas.

Abril de 2021

Azure AI Vision v3.2 GA

A API do Azure AI Vision v3.2 agora está disponível em geral com as seguintes atualizações:

Modelo de marcação de imagem aprimorado: analisa o conteúdo visual e gera tags relevantes com base em objetos, ações e conteúdo exibidos na imagem. Este modelo está disponível através da API Tag Image. Consulte o guia de instruções e a visão geral da Análise de Imagem para saber mais.
Modelo de moderação de conteúdo atualizado: deteta a presença de conteúdo adulto e fornece sinalizadores para filtrar imagens que contenham conteúdo visual adulto, raivoso e sangrento. Este modelo está disponível através da API de análise. Consulte o guia de instruções e a visão geral da Análise de Imagem para saber mais.
OCR (Leitura) disponível para 73 idiomas , incluindo chinês simplificado e tradicional, japonês, coreano e latim.
OCR (Leitura) também disponível como um contêiner Distroless para implantação local.

Consulte Azure AI Vision v3.2 GA

Estrutura de dados do PersonDirectory (visualização)

Para executar operações de reconhecimento facial, como Identificar e Localizar Similar, os clientes da API Face precisam criar uma lista variada de objetos Pessoa . O novo PersonDirectory é uma estrutura de dados que contém IDs exclusivos, cadeias de caracteres de nome opcionais e cadeias de metadados de usuário opcionais para cada identidade Person adicionada ao diretório. Atualmente, a API Face oferece a estrutura LargePersonGroup , que tem funcionalidade semelhante, mas é limitada a 1 milhão de identidades. A estrutura do PersonDirectory pode ser dimensionada para até 75 milhões de identidades.
Outra grande diferença entre o PersonDirectory e as estruturas de dados anteriores é que você não precisará mais fazer chamadas Train depois de adicionar rostos a um objeto Person — o processo de atualização acontece automaticamente. Para obter mais detalhes, consulte Usar a estrutura PersonDirectory.

Março de 2021

Atualização do Azure AI Vision 3.2 Public Preview

A pré-visualização pública da Azure AI Vision API v3.2 foi atualizada. A versão de pré-visualização tem todas as funcionalidades do Azure AI Vision juntamente com APIs de Leitura e Análise atualizadas.

Consulte Azure AI Vision v3.2 public preview 3

Fevereiro de 2021

Leia a API v3.2 Public Preview com suporte a OCR para 73 idiomas

A visualização pública da API de leitura do Azure AI Vision v3.2, disponível como serviço de nuvem e contêiner do Docker, inclui estas atualizações:

OCR para 73 idiomas , incluindo chinês simplificado e tradicional, japonês, coreano e latim.
Ordem de leitura natural para a saída da linha de texto (somente idiomas latinos)
Classificação de estilo de manuscrito para linhas de texto, juntamente com uma pontuação de confiança (apenas idiomas latinos).
Extraia texto apenas para páginas selecionadas para um documento de várias páginas.
Disponível como um contêiner Distroless para implantação local.

Consulte o guia de instruções da API Read para saber mais.

Usar a visualização pública da API de leitura v3.2

Novo modelo de deteção de API de rosto

O novo modelo Detection 03 é o modelo de deteção mais preciso atualmente disponível. Se você é um novo cliente, recomendamos usar este modelo. A deteção 03 melhora a recuperação e a precisão em rostos menores encontrados nas imagens (64x64 pixels). Outras melhorias incluem uma redução geral de falsos positivos e uma melhor deteção nas orientações faciais rotativas. A combinação do Detection 03 com o novo modelo Recognition 04 também proporciona maior precisão de reconhecimento. Consulte Especificar um modelo de deteção de rosto para obter mais detalhes.

Novos atributos de rosto detetáveis

O faceMask atributo está disponível com o mais recente modelo Detection 03, juntamente com o atributo "noseAndMouthCovered"adicionado, que deteta se a máscara facial é usada como pretendido, cobrindo o nariz e a boca. Para usar o recurso de deteção de máscara mais recente, os usuários precisam especificar o modelo de deteção na solicitação de API: atribuir a versão do modelo com o parâmetro detectionModel a detection_03. Consulte Especificar um modelo de deteção de rosto para obter mais detalhes.

Novo modelo de reconhecimento de API facial

O novo modelo Recognition 04 é o modelo de reconhecimento mais preciso atualmente disponível. Se for um novo cliente, recomendamos a utilização deste modelo para verificação e identificação. Ele melhora a precisão do Reconhecimento 03, incluindo reconhecimento aprimorado para usuários que usam coberturas faciais (máscaras cirúrgicas, máscaras N95, máscaras de pano). Recomendamos não inscrever imagens de usuários usando capas faciais, pois isso diminuirá a qualidade do reconhecimento. Agora, os clientes podem criar experiências de usuário seguras e perfeitas que detetam se um usuário está usando uma cobertura facial com o modelo Detection 03 mais recente e reconhecem-no com o modelo Recognition 04 mais recente. Consulte Especificar um modelo de reconhecimento facial para obter mais detalhes.

Janeiro de 2021

Atualização do contêiner de Análise Espacial

As operações de Análise Espacial agora podem ser configuradas para detetar se uma pessoa está usando uma cobertura facial de proteção, como uma máscara.
- Um classificador de máscara pode ser habilitado para o personcount, personcrossingline e personcrossingpolygon operações configurando o ENABLE_FACE_MASK_CLASSIFIER parâmetro.
- Os atributos face_mask e face_noMask serão retornados como metadados com pontuação de confiança para cada pessoa detetada no fluxo de vídeo
A operação personcrossingpolygon foi estendida para permitir o cálculo do tempo de permanência que uma pessoa passa em uma zona. Você pode definir o type parâmetro na configuração de zona para a operação e zonedwelltime um novo evento do tipo personZoneDwellTimeEvent incluirá o durationMs campo preenchido com o número de milissegundos que a pessoa passou na zona.
Alteração de quebra: O evento personZoneEvent foi renomeado para personZoneEnterExitEvent. Esse evento é gerado pela operação personcrossingpolygon quando uma pessoa entra ou sai da zona e fornece informações direcionais com o lado numerado da zona que foi cruzada.
URL de vídeo pode ser fornecido como "Parâmetro privado / ofuscado" em todas as operações. A ofuscação é opcional agora e só funcionará se KEY e IV forem fornecidas como variáveis de ambiente.
A calibração é ativada por padrão para todas as operações. Defina o do_calibration: false para desativá-lo.
Adicionado suporte para recalibração automática (por padrão desativado) através do parâmetro, consulte as enable_recalibration operações de Análise Espacial para obter detalhes
Parâmetros de calibração da câmera para o DETECTOR_NODE_CONFIG. Consulte as operações de Análise Espacial para obter detalhes.

Reduza a latência

A equipe do Face publicou um novo artigo detalhando possíveis causas de latência ao usar o serviço e possíveis estratégias de mitigação. Consulte Mitigar a latência ao usar o serviço Face.

Dezembro de 2020

Configuração do cliente para armazenamento do Face ID

Embora o Face Service não armazene imagens de clientes, o(s) recurso(s) de rosto extraído(s) será(ão) armazenado(s) no servidor. O Face ID é um identificador do recurso de rosto e será usado em Face - Identify, Face - Verify, e Face - Find Similar. Os recursos de rosto armazenados expirarão e serão excluídos 24 horas após a chamada de deteção original. Os clientes agora podem determinar o período de tempo em que esses Face IDs são armazenados em cache. O valor máximo ainda é de até 24 horas, mas agora pode ser definido um valor mínimo de 60 segundos. Os novos intervalos de tempo para Face IDs que estão sendo armazenados em cache é qualquer valor entre 60 segundos e 24 horas. Mais detalhes podem ser encontrados na referência da API Face - Detect (o parâmetro faceIdTimeToLive ).

Novembro de 2020

Aplicativo de registro Face de exemplo

A equipe publicou um aplicativo de inscrição Face de amostra para demonstrar as melhores práticas para estabelecer consentimento significativo e criar sistemas de reconhecimento facial de alta precisão por meio de inscrições de alta qualidade. O exemplo de código aberto pode ser encontrado no guia Criar um aplicativo de registro e no GitHub, pronto para os desenvolvedores implantarem ou personalizarem.

Outubro de 2020

Azure AI Vision API v3.1 GA

A API do Azure AI Vision em Disponibilidade Geral foi atualizada para a v3.1.

Setembro de 2020

Pré-visualização do contentor de Análise Espacial

O contêiner Análise Espacial agora está em visualização. O recurso Análise Espacial do Azure AI Vision permite analisar streaming de vídeo em tempo real para entender as relações espaciais entre as pessoas e seus movimentos em ambientes físicos. A Análise Espacial é um contêiner do Docker que você pode usar localmente.

Leia API v3.1 Public Preview adiciona OCR para japonês

A pré-visualização pública da Azure AI Vision Read API v3.1 adiciona estas capacidades:

OCR para língua japonesa
Para cada linha de texto, indique se a aparência é Manuscrito ou Estilo de impressão, juntamente com uma pontuação de confiança (somente idiomas latinos).
Para um documento de várias páginas, extraia texto apenas para páginas selecionadas ou intervalo de páginas.
Esta versão de pré-visualização da API de leitura suporta os idiomas inglês, holandês, francês, alemão, italiano, japonês, português, chinês simplificado e espanhol.

Consulte o guia de instruções da API Read para saber mais.

Saiba mais sobre Read API v3.1 Public Preview 2

Agosto de 2020

Criptografia gerenciada pelo cliente de dados em repouso

O serviço Face encripta automaticamente os seus dados quando os mantém na nuvem. A criptografia do serviço Face protege seus dados para ajudá-lo a cumprir seus compromissos organizacionais de segurança e conformidade. Por predefinição, a subscrição utiliza chaves de encriptação geridas pela Microsoft. Há também uma nova opção para gerenciar sua assinatura com suas próprias chaves chamadas chaves gerenciadas pelo cliente (CMK). Mais detalhes podem ser encontrados em Chaves gerenciadas pelo cliente.

Julho de 2020

Leia a visualização pública da API v3.1 com OCR para chinês simplificado

A visualização pública da API de leitura do Azure AI Vision v3.1 adiciona suporte para chinês simplificado.

Esta versão de pré-visualização da API de leitura suporta os idiomas inglês, holandês, francês, alemão, italiano, português, chinês simplificado e espanhol.

Consulte o guia de instruções da API Read para saber mais.

Saiba mais sobre Read API v3.1 Public Preview 1

Maio de 2020

A API do Azure AI Vision v3.0 entrou em Disponibilidade Geral, com atualizações para a API de leitura:

Suporte para inglês, holandês, francês, alemão, italiano, português e espanhol
Precisão melhorada
Pontuação de confiança para cada palavra extraída
Novo formato de saída

Consulte a visão geral do OCR para saber mais.

Abril de 2020

Novo modelo de reconhecimento de API facial

O novo modelo de reconhecimento 03 é o modelo mais preciso atualmente disponível. Se você é um novo cliente, recomendamos usar este modelo. O reconhecimento 03 fornece maior precisão para comparações de semelhança e comparações de correspondência de pessoas. Mais detalhes podem ser encontrados em Especificar um modelo de reconhecimento facial.

Março de 2020

O TLS 1.2 agora é imposto para todas as solicitações HTTP para este serviço. Para obter mais informações, consulte Segurança dos serviços de IA do Azure.

Janeiro de 2020

Leia a visualização pública da API 3.0

Agora você pode usar a versão 3.0 da API de leitura para extrair texto impresso ou manuscrito de imagens. Em comparação com versões anteriores, 3.0 fornece:

Precisão melhorada
Novo formato de saída
Pontuação de confiança para cada palavra extraída
Suporte para os idiomas espanhol e inglês com o parâmetro language

Siga um início rápido de texto de extração para começar a usar a API 3.0.

Junho de 2019

Novo modelo de deteção de API de rosto

O novo modelo Detection 02 apresenta maior precisão em rostos pequenos, com vista lateral, ocluídos e desfocados. Use-o através de Face - Detect, FaceList - Add Face, LargeFaceList - Add Face, PersonGroup Person - Add Face e LargePersonGroup Person - Add Face especificando o novo nome detection_02 do modelo de deteção de rosto no detectionModel parâmetro. Mais detalhes em Como especificar um modelo de deteção.

Abril de 2019

Maior precisão de atributos

Maior precisão geral dos ageheadPose e atributos. O headPose atributo também é atualizado com o valor ativado pitch agora. Use esses atributos especificando-os returnFaceAttributes no parâmetro Face - DetetarreturnFaceAttributes .

Velocidades de processamento melhoradas

Velocidades melhoradas de Face - Detetar, FaceList - Adicionar Rosto, LargeFaceList - Adicionar Rosto, PersonGroup Person - Adicionar Rosto e LargePersonGroup Person - Adicionar operações Face .

Março de 2019

Novo modelo de reconhecimento da API de rosto

O modelo Recognition 02 melhorou a precisão. Use-o através de Face - Detect, FaceList - Create, LargeFaceList - Create, PersonGroup - Create e LargePersonGroup - Create especificando o nome recognition_02 do novo modelo de reconhecimento facial no recognitionModel parâmetro. Mais detalhes em Como especificar um modelo de reconhecimento.

Janeiro de 2019

Recurso Face Snapshot

Esse recurso permite que o serviço ofereça suporte à migração de dados entre assinaturas: Snapshot.

Importante

A partir de 30 de junho de 2023, a API do Face Snapshot foi desativada.

Outubro de 2018

Mensagens da API

Descrição refinada para , , , e lastSuccessfulTrainingDateTime em PersonGroup - Obter Status de Treinamento, LargePersonGroup - Obter Status de Treinamento e LargeFaceList - Obter Status de Treinamento. lastActionDateTimecreatedDateTimestatus

Maio de 2018

Maior precisão de atributos

Melhorou gender significativamente o atributo e também melhorou age, glasses, facialHair, hair, makeup atributos. Use-os através do parâmetro Face - DetectreturnFaceAttributes .

Aumento do limite de tamanho de arquivo

Aumento do limite de tamanho do arquivo de imagem de entrada de 4 MB para 6 MB em Face - Detect, FaceList - Add Face, LargeFaceList - Add Face, PersonGroup Person - Add Face e LargePersonGroup Person - Add Face.

Março de 2018

Nova estrutura de dados

LargeFaceList e LargePersonGroup. Mais detalhes em Como dimensionar para lidar com mais usuários inscritos.
Face aumentada - IdentifiquemaxNumOfCandidatesReturned o parâmetro de [1, 5] a [1, 100] e o padrão seja 10.

Maio de 2017

Novos atributos de rosto detetáveis

Adicionado , , , , , , e noise atributos no parâmetro Face - Detect.returnFaceAttributesexposureblurocclusionaccessorymakeuphair
Suportado 10K pessoas em um PersonGroup e Face - Identificar.
Paginação suportada em PersonGroup Person - Lista com parâmetros opcionais: start e top.
Simultaneidade suportada na adição/exclusão de rostos contra diferentes FaceLists e diferentes pessoas no PersonGroup.

Março de 2017

Novo atributo Face detetável

Adicionado emotion atributo em Face - DetectreturnFaceAttributes parâmetro.

Problemas corrigidos

Não foi possível detetar novamente o rosto com o retângulo retornado de Face - Detetar como targetFace em FaceList - Adicionar rosto e PersonGroup Person - Adicionar rosto.
O tamanho do rosto detetável é definido para garantir que esteja estritamente entre 36x36 a 4096x4096 pixels.

Novembro de 2016

Novo nível de subscrição

Adicionada assinatura Face Storage Standard para armazenar rostos persistentes adicionais ao usar PersonGroup Person - Add Face ou FaceList - Add Face para identificação ou correspondência de similaridade. As imagens armazenadas são cobradas a 0,5 $ por 1000 rostos e esta tarifa é calculada diariamente. As subscrições gratuitas continuam limitadas a um total de 1.000 pessoas.

Outubro de 2016

Mensagens da API

Alterada a mensagem de erro de mais de um rosto no targetFace de "Há mais de um rosto na imagem" para "Há mais de um rosto na imagem" em FaceList - Adicionar Rosto e PersonGroup Person - Adicionar Rosto.

Julho de 2016

Novas funcionalidades

Autenticação de objeto face a pessoa suportada no Face - Verificar.
Adicionado parâmetro opcional mode que permite a seleção de dois modos de trabalho: matchPerson e matchFace em Face - Find Similar e padrão é matchPerson.
Adicionado parâmetro opcional confidenceThreshold para o usuário definir o limite de se uma face pertence a um objeto Person em Face - Identify.
Adicionado opcional start e top parâmetros em PersonGroup - List para permitir que o usuário especifique o ponto inicial e o número total de PersonGroups para listar.

Alterações da V1.0 em relação à V0

Ponto de extremidade raiz do serviço atualizado de https://westus.api.cognitive.microsoft.com/face/v0/ para https://westus.api.cognitive.microsoft.com/face/v1.0/. Alterações aplicadas a: Face - Detetar, Face - Identificar, Face - Encontrar Semelhante e Face - Grupo.
Atualizado o tamanho mínimo detetável do rosto para 36x36 pixels. Rostos menores que 36x36 pixels não serão detetados.
Preteridos os dados PersonGroup e Person no Face V0. Esses dados não podem ser acessados com o serviço Face V1.0.
Preterido o ponto de extremidade V0 da API do Face em 30 de junho de 2016.

Atualizações dos serviços de IA do Azure

Anúncios de atualização do Azure para serviços de IA do Azure