개체 감지(버전 4.0)

개체 검색은 태깅과 유사하지만, API는 이미지에서 검색된 각 개체에 대해 경계 상자 좌표(픽셀 단위)를 반환합니다. 예를 들어 이미지에 개, 고양이, 사람이 포함된 경우 개체 감지 작업은 해당 개체를 좌표와 함께 이미지에 나열합니다. 이 기능을 사용하여 이미지의 개체 간 관계를 처리할 수 있습니다. 또한 이미지에 동일한 개체의 인스턴스가 여러 개 있는지 여부도 확인할 수 있습니다.

개체 검색 함수는 이미지에서 식별되는 개체 또는 생물을 기준으로 태그를 적용합니다. 태깅 분류와 개체 감지 분류 간에는 공식적 관계가 없습니다. 개념 수준에서 개체 검색 함수는 개체 및 생물만 검색하지만, 태그 함수는 경계 상자로 지역화할 수 없는 “실내” 같은 상황별 용어를 포함할 수도 있습니다.

Vision Studio를 사용하여 브라우저에서 빠르고 쉽게 개체 감지 기능을 사용해 보세요.

Azure OpenAI 서비스를 통해 개체 감지 기능을 사용할 수 있습니다. GPT-4 Turbo with Vision 모델을 사용하면 공유하는 이미지를 분석할 수 있는 AI 도우미와 채팅할 수 있으며, 비전 향상 옵션은 이미지 분석을 사용하여 이미지에 대한 자세한 정보(읽기 가능한 텍스트 및 개체 위치)를 AI 지원에 제공합니다. 자세한 내용은 GPT-4 Turbo with Vision 빠른 시작을 참조하세요.

개체 검색 예제

다음 JSON 응답은 예제 이미지에서 개체를 검색할 때 Analyze 4.0 API가 반환하는 내용을 보여 줍니다.

A woman using a Microsoft Surface device in a kitchen

{
    "metadata":
    {
        "width": 1260,
        "height": 473
    },
    "objectsResult":
    {
        "values":
        [
            {
                "name": "kitchen appliance",
                "confidence": 0.501,
                "boundingBox": {"x":730,"y":66,"w":135,"h":85}
            },
            {
                "name": "computer keyboard",
                "confidence": 0.51,
                "boundingBox": {"x":523,"y":377,"w":185,"h":46}
            },
            {
                "name": "Laptop",
                "confidence": 0.85,
                "boundingBox": {"x":471,"y":218,"w":289,"h":226}
            },
            {
                "name": "person",
                "confidence": 0.855,
                "boundingBox": {"x":654,"y":0,"w":584,"h":473}
            }
        ]
    }
}

제한 사항

거짓 부정(누락된 개체) 및 제한된 세부 정보의 영향을 방지하거나 완화할 수 있도록 개체 검색 기능의 제한 사항에 유의해야 합니다.

  • 일반적으로 개체는 작으면 검색되지 않습니다(이미지의 5% 미만).
  • 일반적으로 개체는 근접하게 배열되어 있으면 검색되지 않습니다(예: 접시 더미).
  • 개체는 브랜드 또는 제품 이름으로 구분되지 않습니다(예: 상점 선반에 있는 다양한 유형의 탄산 음료). 그러나 브랜드 검색 기능을 사용하여 이미지에서 브랜드 정보를 가져올 수 있습니다.

API 사용

개체 검색 기능은 이미지 분석 API의 일부입니다. REST를 사용하여 이 API를 호출할 수 있습니다. features 쿼리 매개 변수에 Objects를 포함합니다. 그런 다음, 전체 JSON 응답을 받으면 "objects" 섹션의 콘텐츠에 대한 문자열을 구문 분석합니다.

다음 단계