다음을 통해 공유


개체 감지

이 문서에서는 개체 감지의 개념을 설명합니다. 개체 검색은 태깅과 유사하지만, API는 이미지에서 검색된 각 개체에 대해 경계 상자 좌표(픽셀 단위)를 반환합니다. 예를 들어 이미지에 개, 고양이, 사람이 포함된 경우 개체 감지 작업에서는 해당 개체를 이미지의 좌표와 함께 나열합니다. 이 기능을 사용하여 이미지의 개체 간 관계를 처리할 수 있습니다. 또한 이미지에 동일한 개체의 인스턴스가 여러 개 있는지 여부도 확인할 수 있습니다.

개체 검색 함수는 이미지에서 식별되는 개체 또는 생물을 기준으로 태그를 적용합니다. 태그 지정 분류와 개체 감지 분류 간에는 공식적 관계가 없습니다. 개념적 수준에서 개체 감지 함수는 개체와 생명체만 찾은 반면 태그 함수는 경계 상자로 지역화할 수 없는 실내와 같은 컨텍스트 용어를 포함할 수도 있습니다.

Azure AI Vision Studio를 사용하여 브라우저에서 개체 검색 기능을 빠르고 쉽게 사용해 보세요.

개체 검색 예제

다음 JSON 응답은 이미지 분석 API가 예제 이미지에서 개체를 검색할 때 반환하는 내용을 보여 줍니다.

부엌에서 Microsoft Surface 장치를 사용하는 여성을 보여주는 사진.

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

제한 사항

거짓 부정(누락된 개체) 및 제한된 세부 정보의 영향을 방지하거나 완화할 수 있도록 개체 검색 기능의 제한 사항에 유의해야 합니다.

  • 일반적으로 개체가 작은 경우(이미지의 5% 미만)에는 개체가 감지되지 않습니다.
  • 일반적으로 개체가 근접하게 배열되어 있는 경우에는 개체가 감지되지 않습니다(예: 접시 더미).
  • 개체는 브랜드 또는 제품 이름으로 구분되지 않습니다(예: 상점 선반에 있는 다양한 유형의 탄산 음료). 그러나 브랜드 검색 기능을 사용하여 이미지에서 브랜드 정보를 가져올 수 있습니다.

API 사용

개체 검색 기능은 이미지 분석 API의 일부입니다. 이 API는 네이티브 SDK 또는 REST 호출을 통해 호출할 수 있습니다. 쿼리 매개 변수에 visualFeatures 포함합니다Objects. 그런 다음 전체 JSON 응답을 받으면 개체 섹션의 내용에 대한 문자열을 구문 분석합니다.