Azure AI Vision의 새로운 기능

Azure AI Vision의 새로운 기능 알아보기 새로운 기능, 향상된 기능, 수정 사항 및 설명서 업데이트를 최신 상태로 유지하려면 이 페이지를 확인하세요.

2024년 2월

Multimodal embeddings GA: 새로운 다중 언어 모델

Multimodal embeddings API가 업데이트되었으며 이제 일반 공급됩니다. 새 2024-02-01 API에는 102개 언어로 된 텍스트 검색을 지원하는 새 모델이 포함되어 있습니다. 원래 영어 전용 모델은 여전히 사용할 수 있지만 동일한 검색 인덱스의 새 모델과 결합할 수는 없습니다. 영어 전용 모델을 사용하여 텍스트 및 이미지를 벡터화한 경우 이러한 벡터는 다국어 텍스트 및 이미지 벡터와 호환되지 않습니다.

지원되는 언어 목록은 언어 지원 페이지를 참조하세요.

2024년 1월

새 이미지 분석 SDK 1.0.0-beta.1(호환성이 손상되는 변경)

이미지 분석 SDK는 다른 Azure SDK와 더 잘 일치하도록 버전 1.0.0-beta.1에서 다시 작성되었습니다. 모든 API가 변경되었습니다. 새 SDK 사용 방법에 대한 자세한 내용은 업데이트된 빠른 시작, 샘플방법 가이드를 참조하세요.

주요 변경 내용:

2023년 11월

Analyze Image 4.0 GA

Analyze Image 4.0 REST API는 이제 일반 공급됩니다. Analyze Image 4.0 빠른 시작에 따라 시작합니다.

모델 사용자 지정, 배경 제거 및 멀티모달 포함과 같은 이미지 분석의 다른 기능은 공개 미리 보기에서 다시 기본.

활동성 감지를 위한 Face 클라이언트 쪽 SDK

Face Liveness SDK는 사용자의 모바일 또는 에지 디바이스에서 활동성 감지를 지원합니다. Android용 Java/Kotlin 및 iOS용 Swift/Objective-C에서 사용할 수 있습니다.

활동성 감지 서비스는 iBeta Level 1 및 2 ISO/IEC 30107-3 규정 준수를 충족합니다.

2023년 9월

오래된 Computer Vision API 버전 사용 중단

Computer Vision API 버전 1.0, 2.0, 3.0, 3.1은 2026년 9월 13일에 사용 중지됩니다. 개발자는 해당 날짜 이후에 이러한 API에 대한 API 호출을 수행할 수 없습니다. 영향을 받는 모든 고객은 이 빠른 시작을 최대한 빨리 수행하여 일반 공급 Computer Vision 3.2 API로 워크로드를 마이그레이션하는 것이 좋습니다. 또한 고객은 최신 이미지 분석 기능이 있는 이미지 분석 4.0 API(미리 보기)로 마이그레이션하는 것도 고려해야 합니다.

질문이 있으면 Q&A를 방문하세요.

2023년 5월

이미지 분석 4.0 제품 인식(공개 미리 보기)

제품 인식 API를 사용하면 소매점의 선반 사진을 분석할 수 있습니다. 제품의 유무를 검색하고 경계 상자 좌표를 가져올 수 있습니다. 모델 사용자 지정과 함께 사용하여 특정 제품을 식별하도록 모델을 학습합니다. 제품 인식 결과를 매장의 플래노그램 문서와 비교할 수도 있습니다. 제품 인식.

2023년 4월

얼굴 제한 액세스 토큰

ISV(독립 소프트웨어 공급업체)는 일반적으로 제한되는 Face 기능에 대한 액세스 권한을 부여하는 액세스 토큰을 발행하여 클라이언트의 Face API 사용을 관리할 수 있습니다. 이를 통해 클라이언트 회사는 공식적인 승인 절차를 거치지 않고도 Face API를 사용할 수 있습니다. 제한된 액세스 토큰 사용.

2023년 3월

Azure AI Vision 이미지 분석 4.0 SDK 공개 미리 보기

이제 Florence 기반 모델이 Azure AI Vision에 통합되었습니다. 개발자는 향상된 비전 서비스를 통해 다양한 산업 전반에서 시장에 즉시 대응하고 책임 있는 Azure AI 비전 애플리케이션을 만들 수 있습니다. 이제 고객은 데이터를 자연어 상호 작용으로 원활하게 디지털화, 분석 및 연결하여 이미지 및 비디오 콘텐츠에서 강력한 인사이트를 확보하여 접근성을 지원하고, SEO를 통한 취득을 촉진하고, 유해한 콘텐츠로부터 사용자를 보호하고, 보안을 강화하고, 인시던트 대응 시간을 개선할 수 있습니다. 자세한 내용은 Microsoft의 Florence 기본 모델 발표를 참조하세요.

이미지 분석 4.0 SDK(공개 미리 보기)

이미지 분석 4.0은 이제 C#, C++및 Python의 클라이언트 라이브러리 SDK를 통해 사용할 수 있습니다. 이 업데이트에는 Florence 기반의 이미지 캡션과 인간 패리티 성능에 대한 조밀 캡션도 포함되어 있습니다.

이미지 분석 V4.0 캡션 및 조밀 캡션(공개 미리 보기):

"캡션"은 V4.0의 "설명"을 향상된 이미지 캡션 세부 정보 및 의미 체계 이해가 풍부한 기능으로 대체합니다. 조밀 캡션은 전체 이미지를 설명하는 것 외에도 이미지의 최대 10개 영역에 대한 한 문장 설명을 생성하여 더 자세한 정보를 제공합니다. 조밀 캡션은 설명된 이미지 영역의 경계 상자 좌표도 반환합니다. 고객이 alt-text 및 Seeing AI 애플리케이션에 대해 확률적 성별 유추를 사용할지 여부를 선택할 수 있는 새로운 성 중립적 매개 변수도 있습니다. 풍부한 캡션, 액세스 가능한 대체 텍스트, SEO 최적화 및 지능형 사진 큐레이션을 자동으로 제공하여 디지털 콘텐츠를 지원합니다. 이미지 캡션.

비디오 요약 및 프레임 로케이터(공개 미리 보기):

생각하고 쓰는 것과 동일한 직관적인 방식으로 비디오 콘텐츠를 검색하고 상호 작용합니다. 추가 메타데이터 없이 관련 콘텐츠를 찾습니다. Vision Studio에서만 사용할 수 있습니다.

이미지 분석 4.0 모델 사용자 지정(공개 미리 보기)

이제 Vision Studio 또는 v4.0 REST API를 사용하여 사용자 지정 이미지 분류 및 개체 검색 모델을 만들고 학습할 수 있습니다.

다중 모드 포함 API(공개 미리 보기)

이미지 분석 4.0 API의 일부인 다중 모드 포함 API는 이미지 및 텍스트 쿼리의 벡터화를 사용하도록 설정합니다. 이를 통해 이미지와 텍스트를 다차원 벡터 공간의 좌표로 변환할 수 있습니다. 이제 자연어로 검색하고 벡터 유사성 검색을 사용하여 관련 이미지를 찾을 수 있습니다.

백그라운드 제거 API(공개 미리 보기)

이미지 분석 4.0 API의 일부로 백그라운드 제거 API를 사용하면 이미지의 배경을 제거할 수 있습니다. 이 작업은 투명한 백그라운드를 가진 검색된 포그라운드 개체의 이미지를 출력하거나 검색된 포그라운드 개체의 불투명도를 보여주는 회색조 알파 매트 이미지를 출력할 수 있습니다.

Azure AI 비전 3.0 및 3.1 미리 보기 사용 중단

Azure AI Vision 3.0 및 3.1 API의 미리 보기 버전은 2023년 9월 30일에 사용 중지될 예정입니다. 고객은 이 날짜가 지나면 이러한 API를 호출할 수 없습니다. 고객은 워크로드를 대신 일반 공급(GA) 3.2 API로 마이그레이션하는 것이 좋습니다. 미리 보기 버전에서 3.2 API로 마이그레이션할 때 다음 변경 내용에 유의합니다.

  • Analyze ImageRead API 호출은 사용할 AI 모델을 지정하는 데 사용할 수 있는 선택적 model-version 매개 변수를 사용합니다. 기본적으로 최신 모델을 사용합니다.
  • Analyze ImageRead API 호출은 성공적인 API 응답의 model-version 필드도 반환합니다. 이 필드는 사용된 모델을 보고합니다.
  • Azure AI Vision 3.2 API는 다른 오류 보고 형식을 사용합니다. 오류 처리 코드를 조정하는 방법을 알아보려면 API 참조 설명서를 참조하세요.

2022년 10월

Azure AI Vision 이미지 분석 4.0(공개 미리 보기)

이미지 분석 4.0이 공개 미리 보기로 릴리스되었습니다. 새 API에는 이미지 캡션, 이미지 태그 지정, 개체 감지, 스마트 자르기, 사람 감지 및 OCR 읽기 기능이 포함되어 있으며 모두 하나의 Analyze Image 작업을 통해 사용할 수 있습니다. OCR은 워크플로에 OCR 기반 환경을 보다 쉽게 포함할 수 있도록 성능이 향상된 동기 API의 일반 비 문서 이미지에 최적화되어 있습니다.

2022년 9월

Azure AI Vision 3.0/3.1 미리 보기 읽기 사용 중단

Azure AI Vision 3.0 및 3.1 Read API의 미리 보기 버전은 2023년 1월 31일에 사용 중지될 예정입니다. 고객은 대신 방법빠른 시작을 참조하여 GA(일반 공급) 버전의 Read API를 시작하는 것이 좋습니다. 최신 GA 버전은 다음과 같은 이점을 제공합니다.

  • 2022 최신 일반 공급 OCR 모델
  • 필기 텍스트 지원을 포함하여 OCR 언어 적용 범위가 크게 확장되었습니다.
  • 향상된 OCR 품질

2022년 6월

Vision Studio 런칭

Vision Studio는 Azure AI Vision의 기능을 탐색, 빌드 및 애플리케이션에 통합할 수 있는 UI 도구입니다.

Vision Studio는 여러 서비스 기능을 시도하고 시각적인 방식으로 반환되는 내용을 볼 수 있는 플랫폼을 제공합니다. Studio를 사용하면 코드를 작성할 필요 없이 시작한 다음 애플리케이션에서 사용 가능한 클라이언트 라이브러리와 REST API를 사용할 수 있습니다.

Face용 책임 있는 AI

얼굴 투명도 메모

  • 투명성 메모의미 있는 사용자 검토를 통합하여 잘못된 식별 또는 기타 오류의 사례를 감지하고 해결하며, 결과가 잘못되었다고 믿는 사람들에게 지원을 제공하고, 운영 조건의 변화로 인한 정확도 변동을 식별하고 해결함으로써 고객의 시스템의 정확성과 공정성을 개선하는 데 도움이 되는 지침을 제공합니다.

중요한 특성의 사용 중지

  • 우리는 성별, 나이, 미소, 얼굴 털, 머리카락 및 메이크업과 같은 감정 상태와 정체성 특성을 유추하는 얼굴 분석 기능을 사용 중지했습니다.
  • 얼굴 감지 기능(흐림, 노출, 안경, 헤드포지션, 랜드마크, 노이즈, 폐색, 얼굴 경계 상자 감지 포함)은 다시 사용할 수 있으며기본 일반적으로 사용할 수 있으며 애플리케이션이 필요하지 않습니다.

Fairlearn 패키지 및 Microsoft의 공정성 대시보드

  • 오픈 소스 Fairlearn 패키지 및 Microsoft의 공정성 대시보드는 고객이 자신의 데이터에 대해 Microsoft 얼굴 인증 알고리즘의 공정성을 측정할 수 있도록 지원하는 것을 목표로 하며, 이를 통해 기술을 배포하기 전에 다양한 인구통계학적 그룹에 영향을 미칠 수 있는 잠재적인 공정성 문제를 식별하고 해결할 수 있습니다.

Limited Access 정책

  • 업데이트된 책임 있는 AI 표준에 Face를 맞추기 위한 일환으로 Face API 및 Azure AI Vision에 대해 새로운 액세스 제한 정책이 구현되었습니다. 기존 고객은 제공된 사용 사례를 기반으로 얼굴 인식 서비스에 대한 지속적인 액세스에 대해 1년 동안 적용하고 승인을 받습니다. Face의 제한 액세스에 대한 자세한 내용은 여기에서, Azure AI Vision에 대한 자세한 내용은 여기를 참조하세요.

Azure AI Vision 3.2 미리 보기 사용 중단

3.2 API의 미리 보기 버전은 2022년 12월에 사용 중지될 예정입니다. 고객은 API의 일반적으로 사용 가능한(GA) 버전을 사용하는 것이 좋습니다. 3.2 미리 보기 버전에서 마이그레이션할 때 다음 변경 내용에 유의합니다.

  1. Analyze ImageRead API 호출은 이제 사용할 AI 모델을 지정하는 데 사용할 수 있는 선택적 model-version 매개 변수를 사용합니다. 기본적으로 최신 모델을 사용합니다.
  2. Analyze ImageRead API 호출은 성공적인 API 응답의 model-version 필드도 반환합니다. 이 필드는 사용된 모델을 보고합니다.
  3. Image Analysis API는 이제 다른 오류 보고 형식을 사용합니다. 오류 처리 코드를 조정하는 방법을 알아보려면 API 참조 설명서를 참조하세요.

2022년 5월

OCR(읽기) API 모델 GA(일반 출시)

164개 지원 언어가 포함된 Azure AI Vision의 OCR(읽기) API 최신 모델이 이제 클라우드 서비스 및 컨테이너로 일반 공급됩니다.

  • 인쇄 텍스트에 대한 OCR 지원은 러시아어, 아랍어, 힌디어와 키릴 자모, 아랍어 및 데바나가리어 스크립트를 사용하는 기타 언어를 포함한 164개 언어로 확장됩니다.
  • 필기 텍스트에 대한 OCR 지원은 영어, 중국어 간체, 프랑스어, 독일어, 이탈리아어, 일본어, 한국어, 포르투갈어 및 스페인어로 9개 언어로 확장됩니다.
  • 단일 문자, 손으로 쓴 날짜, 금액, 이름, 영수증 및 청구서에서 흔히 볼 수 있는 기타 항목에 대한 지원이 향상되었습니다.
  • 디지털 PDF 문서의 처리가 개선되었습니다.
  • 입력 파일 크기 제한이 500MB로 10배 증가했습니다.
  • 성능 및 대기 시간이 개선되었습니다.
  • 클라우드 서비스Docker 컨테이너로 제공됩니다.

GA 모델 사용 방법을 알아보려면 OCR 방법 가이드를 참조하세요.

2022년 2월

OCR(읽기) API 퍼블릭 미리 보기는 164개 언어를 지원합니다.

Azure AI Vision의 OCR(읽기) API는 최신 미리 보기를 통해 지원되는 언어를 164개로 확장합니다.

  • 인쇄 텍스트에 대한 OCR 지원은 아랍어, 힌디어 및 아랍어 및 Devanagari 스크립트를 사용하는 기타 언어를 포함하여 42개의 새로운 언어로 확장됩니다.
  • 필기 텍스트에 대한 OCR 지원은 영어, 중국어 간체, 프랑스어, 독일어, 이탈리아어, 포르투갈어 및 스페인어 외에도 일본어 및 한국어로 확장합니다.
  • 필기 날짜, 양, 이름 및 단일 문자 상자 추출에 대한 향상된 지원을 비롯한 향상된 기능
  • 일반 성능 및 AI 품질 향상

새로운 미리 보기 기능을 사용하는 방법을 알아보려면 OCR 방법 가이드를 참조하세요.

Detection_01 및 Detection_03의 새 품질 특성

  • 시스템 빌더와 고객이 Face API의 고품질 출력에 필요한 고품질 이미지를 캡처할 수 있도록 이미지에서 얼굴 인식을 시도할 수 있는 충분한 품질인지 여부를 결정하는 데 도움이 되는 새로운 품질 특성 QualityForRecognition 을 도입했습니다. 값은 낮음, 중간 또는 높음의 비공식 등급입니다. 새 특성은 검색 모델 detection_01 또는 detection_03 및 인식 모델 recognition_03 또는 recognition_04의 모든 조합을 사용하는 경우에만 사용할 수 있습니다. 개인 등록에는 “높은” 품질 이미지만 권장되며 식별 시나리오에는 “중간” 이상의 품질이 권장됩니다. 새 품질 특성에 대한 자세한 내용은 얼굴 감지 및 특성을 참조하고 사용하는 방법은 빠른 시작에서 확인하세요.

2021년 9월

OCR(읽기) API 공개 미리 보기는 122개 언어를 지원합니다.

Azure AI Vision의 OCR(읽기) API는 최신 미리 보기를 통해 지원되는 언어를 122개로 확장합니다.

  • 러시아어, 불가리아어, 기타 키릴 자모 및 기타 라틴어를 비롯한 49개의 새로운 언어로 된 인쇄 텍스트에 대한 OCR 지원이 제공됩니다.
  • 영어, 중국어 간체, 프랑스어, 독일어, 이탈리아어, 포르투갈어 및 스페인어를 비롯한 6개의 새로운 언어로 작성된 텍스트에 대한 OCR 지원이 제공됩니다.
  • ID 문서에서 디지털 PDF 및 MRZ(컴퓨터 판독 가능 영역) 텍스트를 처리하는 기능이 향상되었습니다.
  • 일반 성능 및 AI 품질 향상

새로운 미리 보기 기능을 사용하는 방법을 알아보려면 OCR 방법 가이드를 참조하세요.

2021년 8월

이미지 태깅 언어 확장

이미지 태거의 최신 버전(v3.2)은 이제 50개 언어로 된 태그를 지원합니다. 자세한 내용은 언어 지원 페이지를 참조하세요.

2021년 7월

Detection_03에 대한 새로운 HeadPose 및 랜드마크 개선 사항

  • 얼굴 랜드마크를 지원하도록 Detection_03 모델이 업데이트되었습니다.
  • Detection_03 랜드마크 기능은 특히 시선 추적에 중요한 안구 랜드마크에서 훨씬 더 정확합니다.

2021년 5월

공간 분석 컨테이너 업데이트

새 기능 집합과 함께 새 버전의 공간 분석 컨테이너가 릴리스되었습니다. 이 Docker 컨테이너를 사용하면 실시간 스트리밍 비디오를 분석하여 사용자와 사용자의 물리적 환경 간 이동의 공간 관계를 이해할 수 있습니다.

  • 이제 사람이 지향하는 방향을 감지하도록 공간 분석 작업을 구성할 수 있습니다.

    • enable_orientation 매개 변수를 구성하여 personcrossinglinepersoncrossingpolygon 작업에 대해 방향 분류자를 활성화할 수 있습니다. 기본적으로 꺼짐으로 설정되어 있습니다.
  • 공간 분석 작업에서는 이제 작업/실행 중 사람의 속도를 감지하는 구성도 제공합니다.

    • 기본적으로 꺼져 있는 enable_speed 분류자를 설정하여 personcrossinglinepersoncrossingpolygon 작업에 대한 속도를 감지할 수 있습니다. 출력은 speed, avgSpeedminSpeed 출력에 반영됩니다.

2021년 4월

Azure AI 비전 v3.2 GA

Azure AI Vision API v3.2는 이제 다음 업데이트를 통해 일반 공급됩니다.

  • 향상된 이미지 태깅 모델: 시각적 콘텐츠를 분석하고 이미지에 표시된 개체, 작업 및 콘텐츠에 따라 관련 태그를 생성합니다. 이 모델은 태그 이미지 API를 통해 사용할 수 있습니다. 자세히 알아보려면 이미지 분석 방법 가이드개요를 참조하세요.
  • 업데이트된 콘텐츠 조정 모델: 성인 콘텐츠 유무를 검색하고 성인, 외설 및 유혈 콘텐츠가 포함된 이미지를 필터링하는 플래그를 제공합니다. 이 모델은 분석 API를 통해 사용할 수 있습니다. 자세히 알아보려면 이미지 분석 방법 가이드개요를 참조하세요.
  • 중국어 간체 및 번체, 일본어, 한국어 및 라틴어를 포함한 73개 언어에 사용할 수 있는 OCR(Read).
  • OCR(Read)은 온-프레미스 배포를 위해 Distroless 컨테이너로도 사용할 수 있습니다.

PersonDirectory 데이터 구조(미리 보기)

  • 식별 및 유사 찾기와 같은 얼굴 인식 작업을 수행하려면 Face API 고객은 다양한 사용자 개체 목록을 만들어야 합니다. 새 PersonDirectory는 디렉터리에 추가된 각 Person ID의 고유한 ID, 선택적 이름 문자열 및 선택적 사용자 메타데이터 문자열이 포함된 데이터 구조입니다. 현재 Face API는 기능은 유사하지만 ID가 100만 개로 제한되는 LargePersonGroup 구조를 제공합니다. PersonDirectory 구조는 최대 7500만 개 ID로 확장될 수 있습니다.
  • PersonDirectory와 이전 데이터 구조 간의 또 다른 주요 차이점은 얼굴을 Person 개체에 추가하면 업데이트가 자동으로 처리되므로 더 이상 학습을 호출할 필요가 없다는 점입니다. 자세한 내용은 PersonDirectory 구조 사용을 참조하세요.

2021년 3월

Azure AI Vision 3.2 공개 미리 보기 업데이트

Azure AI Vision API v3.2 공개 미리 보기가 업데이트되었습니다. 미리 보기 릴리스에는 업데이트된 읽기 및 분석 API와 함께 모든 Azure AI Vision 기능이 포함되어 있습니다.

2021년 2월

73개 언어에 대한 OCR 지원이 포함된 Read API v3.2 공개 미리 보기

클라우드 서비스 및 Docker 컨테이너로 제공되는 Azure AI Vision Read API v3.2 공개 미리 보기에는 다음 업데이트가 포함되어 있습니다.

  • 중국어 간체 및 번체, 일본어, 한국어 및 라틴어를 포함한 73개 언어에 대한 OCR
  • 텍스트 줄 출력의 자연스러운 읽기 순서(라틴어 언어에만 해당)
  • 텍스트 줄의 필기 스타일 분류와 신뢰도 점수(라틴어 언어에만 해당).
  • 다중 페이지 문서의 경우 선택한 페이지의 텍스트만 추출합니다.
  • 온-프레미스 배포를 위한 Distroless 컨테이너로 사용할 수 있습니다.

자세한 내용은 Read API 방법 가이드를 참조하세요.

새 Face API 감지 모델

  • 새 감지 03 모델은 현재 사용할 수 있는 가장 정확한 감지 모델입니다. 신규 고객인 경우 이 모델을 사용하는 것이 좋습니다. 감지 03은 이미지(64x64 픽셀) 내에서 검색되는 작은 얼굴의 재현율과 정밀도를 모두 향상시킵니다. 다른 개선 사항으로는 가양성에서 전반적인 감소와 회전된 얼굴 방향에 대한 향상된 감지가 포함됩니다. 검색 03과 새 인식 04 모델을 결합하면 향상된 인식 정확도도 제공됩니다. 자세한 내용은 얼굴 감지 모델 지정을 참조하세요.

새 감지 가능한 Face 특성

  • 이 특성은 faceMask 얼굴 마스크가 의도한 대로 착용되어 코와 입을 모두 덮는지 여부를 감지하는 추가 특성 "noseAndMouthCovered"과 함께 최신 Detection 03 모델과 함께 사용할 수 있습니다. 최신 마스크 감지 기능을 사용하려면 사용자가 API 요청에서 감지 모델을 지정해야 합니다. 이렇게 하려면 detectionModel 매개 변수를 사용하여 모델 버전을 detection_03에 할당합니다. 자세한 내용은 얼굴 감지 모델 지정을 참조하세요.

새 Face API 인식 모델

  • 새 인식 04 모델은 현재 사용할 수 있는 가장 정확한 인식 모델입니다. 신규 고객인 경우 검증 및 식별을 위해 이 모델을 사용하는 것이 좋습니다. 또한 얼굴 가리개(수술용 마스크, N95 마스크, 천 마스크)를 착용한 사용자에 대한 향상된 인식을 포함하여 인식 03의 정확도를 향상시킵니다. 얼굴 커버를 착용한 사용자의 이미지를 등록하지 않도록 하는 것이 좋습니다. 그러면 인식 품질이 낮아집니다. 고객은 이제 최신 감지 03 모델을 사용하여 사용자가 얼굴 가리개를 착용하고 있는지 여부를 감지하고, 최신 인식 04 모델을 사용하여 사용자가 누구인지 인식하는 안전하고 원활한 사용자 환경을 빌드할 수 있습니다. 자세한 내용은 얼굴 인식 모델 지정을 참조하세요.

2021년 1월

공간 분석 컨테이너 업데이트

새 기능 집합과 함께 새 버전의 공간 분석 컨테이너가 릴리스되었습니다. 이 Docker 컨테이너를 사용하면 실시간 스트리밍 비디오를 분석하여 사용자와 사용자의 물리적 환경 간 이동의 공간 관계를 이해할 수 있습니다.

  • 이제 공간 분석 작업을 구성하여 사람이 마스크와 같은 얼굴 보호 커버를 착용하고 있는지 감지할 수 있습니다.
    • ENABLE_FACE_MASK_CLASSIFIER 매개 변수를 구성하여 personcount, personcrossinglinepersoncrossingpolygon 작업에 대해 마스크 분류자를 사용할 수 있습니다.
    • face_maskface_noMask 특성은 비디오 스트림에서 검색된 각 사람에 대한 신뢰 점수와 함께 메타데이터로 반환됩니다.
  • personcrossingpolygon 작업은 사람이 영역에서 소비하는 체류 시간을 계산할 수 있도록 확장되었습니다. 작업의 영역 구성에서 type 매개 변수를 zonedwelltime으로 설정할 수 있으며 새로운 이벤트 형식 personZoneDwellTimeEvent에는 사람이 영역에서 소비한 시간(밀리초)으로 채워진 durationMs 필드가 포함됩니다.
  • 호환성이 손상되는 변경: personZoneEvent 이벤트의 이름이 personZoneEnterExitEvent로 변경되었습니다. 이 이벤트는 사람이 영역에 들어가거나 영역에서 나갈 때 personcrossingpolygon 작업에 의해 발생하며, 사람이 건넌 영역의 번호가 매겨진 쪽을 사용하여 방향 정보를 제공합니다.
  • 비디오 URL은 모든 작업에서 "프라이빗 매개 변수/난독 처리"로 제공할 수 있습니다. 난독 처리는 현재 선택 사항이며 KEYIV가 환경 변수로 제공되는 경우에만 작동합니다.
  • 보정은 기본적으로 모든 작업에 사용하도록 설정됩니다. do_calibration: false를 설정하여 사용하지 않도록 설정합니다.
  • enable_recalibration 매개 변수를 통해 자동 재보정(기본적으로 해제됨)을 사용하기 위한 추가 지원에 대한 자세한 내용은 공간 분석 작업을 참조하세요.
  • 카메라 보정 매개 변수가 DETECTOR_NODE_CONFIG로 설정되었습니다. 자세한 내용은 공간 분석 작업을 참조하세요.

대기 시간 완화

2020년 12월

Face ID 스토리지에 대한 고객 구성

  • Face 서비스는 고객 이미지를 저장하지 않지만 추출된 얼굴 특징은 서버에 저장됩니다. Face ID는 얼굴 특징의 식별자이며, Face - 식별, Face - 검증Face - 유사 항목 찾기에서 사용됩니다. 저장된 얼굴 특징은 원래 감지 호출 후 24시간 후에 만료되어 삭제됩니다. 이제 고객은 이러한 Face ID가 캐시되는 기간을 결정할 수 있습니다. 최댓값은 여전히 최대 24시간이지만, 이제 최솟값으로 60초를 설정할 수 있습니다. 캐시되는 Face ID의 새로운 시간 범위는 60초~24시간의 값입니다. 자세한 내용은 Face - 감지 API 참조(faceIdTimeToLive 매개 변수)를 참조하세요.

2020년 11월

샘플 Face 등록 앱

  • 팀은 의미 있는 동의를 설정하고 고품질 등록을 통해 정확도가 높은 얼굴 인식 시스템을 만드는 모범 사례를 보여 주기 위해 샘플 Face 등록 앱을 게시했습니다. 오픈 소스 샘플은 등록 앱 빌드 가이드와 GitHub에서 찾을 수 있으며, 개발자가 배포하거나 사용자 지정할 수 있도록 준비되었습니다.

2020년 10월

Azure AI 비전 API v3.1 GA

일반 공급의 Azure AI Vision API가 v3.1로 업그레이드되었습니다.

2020년 9월

공간 분석 컨테이너 미리 보기

공간 분석 컨테이너는 현재 미리 보기로 제공됩니다. Azure AI Vision의 공간 분석 기능을 사용하면 실시간 스트리밍 비디오를 분석하여 사용자와 사용자의 물리적 환경 간 이동의 공간 관계를 이해할 수 있습니다. 공간 분석은 온-프레미스에서 사용할 수 있는 Docker 컨테이너입니다.

Read API v3.1 공개 미리 보기에 일본어용 OCR 추가

Azure AI Vision 읽기 API v3.1 공개 미리 보기에는 다음 기능이 추가되었습니다.

  • 일본어용 OCR

  • 각 텍스트 줄에 글꼴이 필기체인지, 활자체인지와 신뢰도 점수(라틴어만 해당)를 지정합니다.

  • 다중 페이지 문서의 경우 선택한 페이지 또는 페이지 범위에 대해서만 텍스트를 추출합니다.

  • 이 미리 보기 버전의 Read API는 영어, 네덜란드어, 프랑스어, 독일어, 이탈리아어, 일본어, 포르투갈어, 중국어 간체 및 스페인어를 지원합니다.

자세한 내용은 Read API 방법 가이드를 참조하세요.

2020년 8월

고객 관리형 미사용 데이터 암호화

  • Face 서비스는 데이터를 클라우드에 유지할 때 자동으로 암호화합니다. Face 서비스 암호화는 데이터를 보호하여 조직의 보안 및 규정 준수 약속을 충족하는 데 도움이 됩니다. 기본적으로 구독은 Microsoft에서 관리하는 암호화 키를 사용합니다. 또한 CMK(고객 관리형 키)라고 하는 사용자 고유의 키를 사용하여 구독을 관리하는 새로운 옵션도 있습니다. 자세한 내용은 고객 관리형 키를 참조하세요.

2020년 7월

Read API v3.1 공개 미리 보기에 중국어(간체)용 OCR 추가

Azure AI Vision 읽기 API v3.1 공개 미리 보기에는 중국어 간체에 대한 지원이 추가되었습니다.

  • 이 미리 보기 버전의 Read API는 영어, 네덜란드어, 프랑스어, 독일어, 이탈리아어, 포르투갈어, 중국어 간체 및 스페인어를 지원합니다.

자세한 내용은 Read API 방법 가이드를 참조하세요.

2020년 5월

Azure AI Vision API v3.0에서 Read API에 대한 업데이트와 함께 일반 공급으로 전환되었습니다.

  • 영어, 네덜란드어, 프랑스어, 독일어, 이탈리아어, 포르투갈어 및 스페인어 지원
  • 정확도 개선
  • 추출된 각 단어에 대한 신뢰도 점수
  • 새 출력 형식

자세한 내용은 OCR 개요를 참조하세요.

2020년 4월

새 Face API 인식 모델

  • 새 인식 03 모델은 현재 사용할 수 있는 가장 정확한 모델입니다. 신규 고객인 경우 이 모델을 사용하는 것이 좋습니다. 인식 03은 유사성 비교와 사람 일치 비교 모두에 대해 향상된 정확도를 제공합니다. 자세한 내용은 얼굴 인식 모델 지정을 참조하세요.

2020년 3월

  • 이제 TLS 1.2는 이 서비스에 대한 모든 HTTP 요청에 적용됩니다. 자세한 내용은 Azure AI 서비스 보안을 참조하세요.

2020년 1월

Read API 3.0 공개 미리 보기

이제 Read API의 버전 3.0을 사용하여 이미지에서 인쇄 또는 필기한 텍스트를 추출할 수 있습니다. 이전 버전과 비교하여 3.0은 다음을 제공합니다.

  • 정확도 개선
  • 새 출력 형식
  • 추출된 각 단어에 대한 신뢰도 점수
  • 언어 매개 변수를 사용하여 스페인어 및 영어 모두 지원

3.0 API 사용을 시작하려면 텍스트 추출 빠른 시작을 따르세요.

2019년 6월

새 Face API 감지 모델

2019년 4월

향상된 특성 정확도

  • ageheadPose 특성의 전반적인 정확도가 향상되었습니다. headPose 특성도 이제 사용하도록 설정된 pitch 값으로 업데이트됩니다. 이러한 특성은 Face - 감지returnFaceAttributes 매개 변수의 returnFaceAttributes 매개 변수에 지정하여 사용합니다.

향상된 처리 속도

2019년 3월

새 Face API 인식 모델

2019년 1월

Face Snapshot 기능

  • Snapshot 기능을 통해 서비스에서 구독 간 데이터 마이그레이션을 지원할 수 있습니다.

Important

2023년 6월 30일부터 Face 스냅샷 API는 사용 중지됩니다.

2018년 10월

API 메시지

2018년 5월

향상된 특성 정확도

  • age, glasses, facialHair, hair, makeup 특성과 함께 gender 특성이 크게 향상되었습니다. 얼굴 - 검색returnFaceAttributes 매개 변수를 통해 사용합니다.

파일 크기 제한 증가

2018년 3월

새 데이터 구조

2017년 5월

새 감지 가능한 Face 특성

  • 얼굴 - 검색returnFaceAttributes 매개 변수에서 hair, makeup, accessory, occlusion, blur, exposurenoise 특성이 추가되었습니다.
  • PersonGroup 및 얼굴 - 식별에서만 10K의 사람이 지원되었습니다.
  • starttop이라는 선택적 매개 변수가 있는 PersonGroup 사람 - 목록에 페이지 매김이 지원되었습니다.
  • 다른 FaceLists 및 PersonGroup의 다른 사람에 대해 얼굴이 추가/삭제되는 경우 동시성이 지원되었습니다.

2017년 3월

새 감지 가능한 Face 특성

  • 얼굴 - 검색returnFaceAttributes 매개 변수에서 emotion 특성이 추가되었습니다.

해결된 문제

2016년 11월

새 구독 계층

  • 식별이나 유사성 검사를 위해 PersonGroup 사람 - 얼굴 추가 또는 FaceList - 얼굴 추가를 사용할 경우 추가로 유지될 얼굴을 저장하는 Face Storage 표준을 추가했습니다. 저장된 이미지는 1,000개 얼굴 기준으로 $0.5로 청구되며, 이 요금은 일별로 계산됩니다. 무료 계층 구독은 총 1,000명의 사람으로 계속 제한됩니다.

2016년 10월

API 메시지

  • FaceList - 얼굴 추가PersonGroup 사람 - 얼굴 추가에서 targetFace에 있는 둘 이상의 얼굴에 대한 오류 메시지가 'There are more than one face in the image(이미지에 둘 이상의 얼굴이 있습니다.)'에서 'There is more than one face in the image(이미지에 둘 이상의 얼굴이 있습니다.)'로 변경되었습니다.

2016년 7월

새로운 기능

  • 얼굴 - 확인에서 사람 개체 인증에 얼굴이 지원되었습니다.
  • 두 작업 모드의 선택 영역을 사용하도록 설정하는 선택적 mode 매개 변수가 추가되었습니다. 얼굴 - 유사 항목 찾기에서 matchPersonmatchFace이며 기본값은 matchPerson입니다.
  • 얼굴 - 식별에서 한 얼굴이 사람 개체에 속하는지 여부의 임계값을 설정하도록 사용자에 대한 선택 사항 confidenceThreshold 매개 변수를 추가했습니다.
  • 사용자가 시작점 및 목록에 대한 총 PersonGroups 수를 지정할 수 있도록 PersonGroup - 목록에서 선택 사항 starttop 매개 변수를 추가했습니다.

V0에서 변경된 V1.0 내용

  • 서비스 루트 엔드포인트를 https://westus.api.cognitive.microsoft.com/face/v0/에서 https://westus.api.cognitive.microsoft.com/face/v1.0/으로 업데이트했습니다. 얼굴 - 검색, 얼굴 - 식별, 얼굴 - 유사 항목 찾기얼굴 - 그룹에 적용된 변경 내용입니다.
  • 36x36픽셀로 감지 가능한 최소 얼굴 크기를 업데이트했습니다. 36x36픽셀보다 작은 얼굴은 검색되지 않습니다.
  • Face V0에서 PersonGroup 및 사람 데이터가 사용되지 않았습니다. Face V1.0 서비스를 사용하여 해당 데이터에 액세스할 수 없습니다.
  • 2016년 6월 30 일에 Face API의 V0 엔드포인트가 사용되지 않았습니다.

Azure AI 서비스 업데이트

Azure AI 서비스에 대한 Azure 업데이트 공지 사항