비전 API 서비스 유형
Azure Cognitive Service for Vision은 Cognitive Services에서 가장 광범위한 범주 중 하나입니다. 기계 학습에 대한 지식이 제한된 경우에도 API를 사용하여 애플리케이션에서 이미지 분석, 얼굴 감지, 공간 분석 및 OCR(광학 문자 인식)과 같은 비전 기능을 통합할 수 있습니다.
Services
다음은 몇 가지 광범위한 비전 API 범주입니다.
- Computer Vision 은 관심 있는 시각적 기능을 기반으로 이미지를 처리하고 정보를 반환하는 고급 알고리즘을 제공합니다. OCR, Face 서비스, 이미지 분석 및 공간 분석의 네 가지 서비스를 제공합니다. Form Recognizer는 고급 버전의 OCR입니다.
- Custom Vision 은 고유한 이미지 식별자 모델을 빌드, 배포 및 개선하는 데 사용할 수 있는 이미지 인식 서비스입니다.
- Face Service 는 이미지에서 사람의 얼굴을 감지, 인식 및 분석하는 AI 알고리즘을 제공합니다.
서비스 선택 방법
다음 순서도는 특정 사용 사례에 대한 비전 서비스를 선택하는 데 도움이 될 수 있습니다.
일반 사용 예
Computer Vision
- 이미지를 설명합니다. 이미지를 분석하고, 검색된 개체를 평가하고, 이미지를 설명하는 사람이 읽을 수 있는 구 또는 문장을 생성합니다.
- 시각적 기능에 태그를 추가합니다. 인식할 수 있는 수천 개의 개체 집합을 기반으로 하는 태그를 적용합니다.
- 이미지를 분류합니다. 콘텐츠에 따라 이미지를 분류합니다.
- OCR을 구현합니다. 이미지에서 인쇄 및 필기 텍스트를 검색합니다.
- 이미지 유형을 검색합니다. 예를 들어 클립 아트 이미지 또는 선 드로잉을 식별합니다.
- 색 구성표를 검색합니다. 이미지에서 주된 전경, 배경 및 주체 및 강조색을 식별합니다.
- 썸네일을 생성합니다. 작은 버전의 이미지를 만듭니다.
- 콘텐츠를 조정합니다. 성인 콘텐츠를 포함하거나 피투성이 장면을 묘사하는 이미지를 검색합니다.
- do기본 관련 콘텐츠를 검색합니다. 두 가지 특수한 do기본 모델을 사용합니다.
- 유명 인사. 스포츠, 엔터테인먼트 및 비즈니스에서 잘 알려진 유명 인사의 수천을 식별 할 기본.
- 랜드마크. 타지마할과 자유의 여신상과 같은 유명한 랜드마크를 찾아보세요.
- 개체 감지 공통 개체를 식별하고 경계 상자의 좌표를 반환합니다.
- 브랜드를 검색합니다. 전 세계적으로 인식되는 수천 개의 제품 로고의 기존 데이터베이스에서 로고를 식별합니다.
- 얼굴을 감지합니다. 이미지에서 사람의 얼굴을 감지하고 분석합니다. 주체의 나이를 확인하고 얼굴 위치를 지정하는 경계 상자를 반환할 수 있습니다. Computer Vision 서비스의 얼굴 분석 기능은 전용 Face 서비스에서 제공하는 얼굴 분석 기능의 하위 집합입니다.
Custom Vision
- 이미지를 분류합니다. 기능이라고 하는 입력 집합을 기반으로 범주 또는 클래스를 예측합니다. 가능한 각 클래스에 대한 확률 점수를 계산하고 개체가 속할 가능성이 가장 높은 클래스를 나타내는 레이블을 반환합니다. 이 모델을 사용하려면 기능 및 해당 레이블로 구성된 데이터가 필요합니다.
- 개체 감지 이미지에서 개체의 좌표를 가져옵니다. 이 모델을 사용하려면 기능 및 해당 레이블로 구성된 데이터가 필요합니다.
Face 서비스
- 얼굴을 감지합니다. 일반적으로 얼굴 주위에 사각형을 형성하는 경계 상자 좌표를 반환하여 사람의 얼굴을 포함하는 이미지의 영역을 식별합니다.
- 얼굴을 분석합니다. 얼굴 랜드마크(코, 눈, 눈썹, 입술 등)와 같은 정보를 반환합니다. 이러한 얼굴 랜드마크를 기능으로 사용하여 인식된 연령이나 감정 상태와 같은 사람에 대한 정보를 유추할 수 있는 기계 학습 모델을 학습시킬 수 있습니다.
- 얼굴을 인식합니다. 얼굴 특징에서 알려진 개인을 식별하도록 기계 학습 모델을 학습시킵니다.
참가자
Microsoft에서 이 문서를 유지 관리합니다. 원래 다음 기여자가 작성했습니다.
주요 작성자:
- Ashish Chahuan | 선임 클라우드 솔루션 설계자
- 크루티 메타 | Azure 수석 빠른 추적 엔지니어
기타 기여자:
- Mick Alberts | 테크니컬 라이터
- Brandon Cowen | 선임 클라우드 솔루션 아키텍트
- 오스카 시마부쿠로 | 선임 클라우드 솔루션 설계자
- 만짓 싱 | 소프트웨어 엔지니어
- Christina Skarpathiotaki | 선임 클라우드 솔루션 설계자
- Nathan 위드업 | Azure 수석 빠른 추적 엔지니어
비공개 LinkedIn 프로필을 보려면 LinkedIn에 로그인합니다.
다음 단계
- Computer Vision이란?
- Vision API 블로그 게시물
- 학습 경로: Azure Cognitive Services를 사용하여 Language Understanding 솔루션 만들기
- 학습 경로: Azure Cognitive Services 프로비전 및 관리
- 학습 경로: 컴퓨터 비전 살펴보기
- 학습 경로: Azure Cognitive Services를 사용하여 Computer Vision 솔루션 만들기
- 학습 경로: Azure IoT Edge 및 Azure Cognitive Services를 사용하여 이미지 인식 솔루션 만들기
관련 참고 자료
피드백
https://aka.ms/ContentUserFeedback
출시 예정: 2024년 내내 콘텐츠에 대한 피드백 메커니즘으로 GitHub 문제를 단계적으로 폐지하고 이를 새로운 피드백 시스템으로 바꿀 예정입니다. 자세한 내용은 다음을 참조하세요.다음에 대한 사용자 의견 제출 및 보기