이미지 캡션(버전 4.0 미리 보기)
이미지 분석 4.0(미리 보기)의 이미지 캡션은 캡션 및 조밀 캡션 기능을 통해 사용할 수 있습니다.
캡션은 모든 이미지 콘텐츠에 대해 하나의 문장 설명을 생성합니다. 조밀 캡션은 전체 이미지를 설명하는 것 외에도 이미지의 최대 10개 영역에 대한 한 문장 설명을 생성하여 더 자세한 정보를 제공합니다. 조밀 캡션은 설명된 이미지 영역의 경계 상자 좌표도 반환합니다. 두 기능 모두 최신의 획기적인 Florence 기반 AI 모델을 사용합니다.
현재 이미지 캡션은 영어로만 사용할 수 있습니다.
성 중립적 캡션
모든 캡션에는 기본적으로 "남자", "여자", "소년" 및 "소녀"라는 성별 용어가 포함됩니다. 이러한 용어를 결과에서 "사람"으로 바꾸고 성 중립적 캡션을 받을 수 있습니다. 요청 URL에서 선택적 API 요청 매개 변수인 gender-neutral-caption을 true
로 설정하면 됩니다.
중요
이미지 분석 4.0의 이미지 캡션은 현재 미국 동부, 프랑스 중부, 한국 중부, 북유럽, 동남 아시아, 서유럽, 미국 서부의 Azure 데이터 센터 지역에서만 사용할 수 있습니다. 캡션 및 조밀 캡션 기능에서 결과를 얻으려면 이러한 지역 중 하나에 있는 Computer Vision 리소스를 사용해야 합니다.
이러한 지역 외부에서 Computer Vision 리소스를 사용하여 이미지 캡션을 생성해야 하는 경우 모든 Computer Vision 지역에서 사용할 수 있는 이미지 분석 3.2를 사용하세요.
Vision Studio를 사용하여 브라우저에서 이미지 캡션 기능을 빠르고 쉽게 사용해 보세요.
캡션 및 조밀 캡션 예제
다음 JSON 응답에서는 시각적 기능을 기반으로 이미지 예를 설명할 때 Analyze 4.0 API가 반환하는 내용을 보여 줍니다.
"captions": [
{
"text": "a man pointing at a screen",
"confidence": 0.4891590476036072
}
]
API 사용
이미지 캡션 기능은 Analyze Image API의 일부입니다. features 쿼리 매개 변수에 Caption
를 포함합니다. 그런 다음 전체 JSON 응답을 받으면 "captionResult"
섹션의 콘텐츠에 대한 문자열을 구문 분석합니다.
다음 단계
- 개체 감지의 관련 개념을 알아봅니다.
- 빠른 시작: 이미지 분석 REST API 또는 클라이언트 라이브러리
- Analyze Image API 호출