이미지 분석

완료됨

이미지를 분석하려면 선호하는 프로그래밍 언어용 SDK에서 이미지 분석 REST 메서드 또는 동급의 메서드를 사용하여 분석에 포함할 시각적 기능을 지정합니다(또한 범주를 선택하는 경우 유명인 또는 랜드마크의 세부 정보를 포함할지 여부 지정). 이 메서드는 요청된 정보를 포함하는 JSON 문서를 반환합니다.

참고

유명인을 검색하려면 제한된 액세스 정책을 통해 승인을 받아야 합니다. 책임 있는 AI 표준에 이 정책을 추가하는 방법에 대해 자세히 알아보세요. 일부 스크린샷에는 유명인 인식이 표시되지만 랩에는 포함되지 않습니다.

using Azure.AI.Vision.ImageAnalysis;

ImageAnalysisClient client = new ImageAnalysisClient(
    Environment.GetEnvironmentVariable("ENDPOINT"),
    new AzureKeyCredential(Environment.GetEnvironmentVariable("KEY")));

ImageAnalysisResult result = client.Analyze(
    new Uri("<url>"),
    VisualFeatures.Caption | VisualFeatures.Read,
    new ImageAnalysisOptions { GenderNeutralCaption = true });
from azure.ai.vision.imageanalysis import ImageAnalysisClient
from azure.ai.vision.imageanalysis.models import VisualFeatures
from azure.core.credentials import AzureKeyCredential

client = ImageAnalysisClient(
    endpoint=os.environ["ENDPOINT"],
    credential=AzureKeyCredential(os.environ["KEY"])
)

result = client.analyze(
    image_url="<url>",
    visual_features=[VisualFeatures.CAPTION, VisualFeatures.READ],
    gender_neutral_caption=True,
    language="en",
)

사용 가능한 시각적 기능은 열거형에 VisualFeatures 포함됩니다.

  • VisualFeatures.Tags: 개체, 풍경, 설정 및 작업을 포함하여 이미지에 대한 태그를 식별합니다.
  • VisualFeatures.Objects: 검색된 각 개체에 대한 경계 상자를 반환합니다.
  • VisualFeatures.Caption: 자연어로 이미지의 캡션 생성합니다.
  • VisualFeatures.DenseCaptions: 검색된 개체에 대한 자세한 캡션 생성합니다.
  • VisualFeatures. 사람: 검색된 사용자에 대한 경계 상자를 반환합니다.
  • VisualFeatures.SmartCrops: 관심 영역에 대해 지정된 가로 세로 비율의 경계 상자를 반환합니다.
  • VisualFeatures.Read: 읽을 수 있는 텍스트를 추출합니다.
  • VisualFeatures.TAGS: 개체, 풍경, 설정 및 작업을 포함하여 이미지에 대한 태그를 식별합니다.
  • VisualFeatures.OBJECTS: 검색된 각 개체에 대한 경계 상자를 반환합니다.
  • VisualFeatures.CAPTION: 자연어로 이미지의 캡션 생성합니다.
  • VisualFeatures.DENSE_CAPTIONS: 검색된 개체에 대한 자세한 캡션 생성합니다.
  • VisualFeatures.PEOPLE: 검색된 사용자에 대한 경계 상자를 반환합니다.
  • VisualFeatures.SMART_CROPS: 관심 영역에 대해 지정된 가로 세로 비율의 경계 상자를 반환합니다.
  • VisualFeatures.READ: 읽을 수 있는 텍스트를 추출합니다.

이미지에서 분석하려는 시각적 기능을 지정하면 응답에 포함할 정보가 결정됩니다. 대부분의 응답에는 경계 상자(이미지의 위치가 적절한 경우) 또는 신뢰도 점수(태그 또는 캡션 같은 기능의 경우)가 포함됩니다.

이미지 분석에 대한 JSON 응답은 요청된 기능에 따라 이 예제와 유사합니다.

{
  "apim-request-id": "abcde-1234-5678-9012-f1g2h3i4j5k6",
  "modelVersion": "<version>",
  "denseCaptionsResult": {
    "values": [
      {
        "text": "a house in the woods",
        "confidence": 0.7055229544639587,
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 640,
          "h": 640
        }
      },
      {
        "text": "a trailer with a door and windows",
        "confidence": 0.6675070524215698,
        "boundingBox": {
          "x": 214,
          "y": 434,
          "w": 154,
          "h": 108
        }
      }
    ]
  },
  "metadata": {
    "width": 640,
    "height": 640
  }
}