다음을 통해 공유


개요: 이미지 분석을 사용하여 이미지 대체 텍스트 생성

대체 텍스트란?

대체 텍스트는 애플리케이션 또는 웹 페이지에 이미지를 표시하기 위해 <img> 태그에 추가된 HTML 특성입니다. 일반 HTML 코드에서는 다음과 같습니다.

<img src="elephant.jpg" alt="An elephant in a grassland.">

대체 텍스트를 사용하면 웹 사이트 소유자가 일반 텍스트로 이미지를 설명할 수 있습니다. 이러한 이미지 설명은 Microsoft 내레이터, JAWS 및 NVDA와 같은 화면 읽기 프로그램이 저시력 및 시각 장애인 사용자에게 이미지 콘텐츠를 정확하게 전달할 수 있도록 하여 접근성을 향상시킵니다.

대체 텍스트는 SEO(이미지 검색 엔진 최적화)에도 중요합니다. 검색 엔진이 이미지의 시각적 콘텐츠를 이해하는 데 도움이 됩니다. 그러면 검색 엔진은 사용자가 웹 사이트에서 콘텐츠를 검색할 때 검색 결과에 웹 사이트를 더 잘 포함하고 순위를 매길 수 있습니다.

이미지 분석을 사용하여 대체 텍스트 자동 생성

이미지 분석은 이미지의 시각적 콘텐츠에 대한 한 문장 설명을 생성하는 이미지 캡션 모델을 제공합니다. 이러한 AI 생성 캡션을 이미지의 대체 텍스트로 사용할 수 있습니다.

An elephant in a grassland.

자동 생성 캡션: "초원에 있는 코끼리"

PowerPoint, Word 및 Edge 브라우저와 같은 Microsoft 자체 제품은 이미지 분석의 이미지 캡션을 사용하여 대체 텍스트를 생성합니다.

Screenshot of a PowerPoint slide with alt text written on the side.

웹 사이트의 이점

  • 시각 장애인 및 저시력 사용자를 위한 접근성 및 사용자 환경 개선. 대체 텍스트는 시각 장애인 및 저시력 사용자가 사용하는 화면 읽기 프로그램에 이미지의 시각적 정보를 제공합니다.
  • 법적 규정 준수 요구 사항 충족. 일부 웹 사이트는 모든 접근성 장벽을 제거하도록 법적으로 요구될 수 있습니다. 접근성을 위해 대체 텍스트를 사용하면 웹 사이트 소유자가 현재와 미래의 법적 조치 위험을 최소화할 수 있습니다.
  • 웹 사이트를 더 쉽게 탐색 및 검색 가능하도록 함. 이미지 대체 텍스트는 검색 엔진 크롤러가 웹 사이트에서 이미지를 더 쉽게 찾고 검색 결과에서 더 높은 순위를 지정하는 데 도움이 됩니다.

자주 묻는 질문

이미지 캡션은 어떤 언어로 제공되나요?

이미지 캡션은 이미지 분석 3.2 API에서 영어, 중국어, 포르투갈어, 일본어 및 스페인어로 제공됩니다. 이미지 분석 4.0 API에서는 이미지 캡션이 영어로만 제공됩니다.

어떤 신뢰도 임계값을 사용해야 하나요?

모든 이미지에 대해 정확한 대체 텍스트를 보장하기 위해 특정 신뢰도 수준 이상의 캡션만 허용하도록 선택할 수 있습니다. 올바른 신뢰도 수준은 이미지 유형 및 사용 시나리오에 따라 다르며 사용자마다 달라집니다.

일반적으로 이미지 분석 3.2 API의 경우 신뢰도 임계값 0.4, 이미지 분석 4.0 API의 경우 신뢰도 임계값 0.0을 권장합니다.

당황스럽거나 잘못된 캡션에 대해 어떤 조치를 취할 수 있나요?

드문 경우지만 이미지 캡션에는 남성을 나타내는 사람을 "여성"으로 레이블 지정하거나 성인 여성을 "소녀"로 레이블 지정하는 등 당황스러운 오류가 포함될 수 있습니다. 성 중립적 캡션을 지원하여 일부 오류를 제거하는 최신 이미지 분석 4.0 API를 사용하도록 하는 것이 좋습니다.

Azure Portal로 이동하고 오른쪽 위에 있는 피드백 단추로 이동하여 당황스럽거나 불쾌감을 주는 캡션을 보고하세요.

다음 단계

빠른 시작에 따라 이미지 분석에서 이미지 캡션을 사용하면 대체 텍스트가 자동으로 생성되기 시작합니다.