명명된 엔터티 인식 기술(v2)

명명된 엔터티 인식 기술(v2)은 텍스트에서 명명된 엔터티를 추출합니다. 사용 가능한 엔터티에는 형식 personlocationorganization.

Important

명명된 엔터티 인식 기술(v2)(Microsoft.Skills.Text.NamedEntityRecognitionSkill)은 이제 Microsoft.Skills.Text.V3.EntityRecognitionSkill로 대체되어 사용되지 않습니다. 사용되지 않는 Azure AI Search 기술의 권장 사항에 따라 지원되는 기술로 마이그레이션합니다.

참고 항목

처리 빈도를 높이거나, 문서를 더 추가하거나, AI 알고리즘을 더 추가하여 범위를 확장할 때 청구 가능한 Azure AI 서비스 리소스를 연결해야 합니다. 요금은 Azure AI 서비스에서 API를 호출할 때 발생하며, Azure AI Search의 문서 크래킹 단계의 일부로 이미지 추출에 대해 발생합니다. 문서에서 텍스트 추출에 대한 요금은 없습니다. 기본 제공 기술의 실행은 기존 Azure AI 서비스 종량제 가격으로 청구됩니다.

이미지 추출은 가격 책정 페이지에 설명된 대로 Azure AI Search에서 계량한 추가 요금입니다. 텍스트 추출은 무료입니다.

@odata.type

Microsoft.Skills.Text.NamedEntityRecognitionSkill

데이터 제한

레코드의 최대 크기는 String.Length에 의해 측정된 대로 50,000자여야 합니다. 핵심 구 추출기로 보내기 전에 데이터를 분리해야 하는 경우 텍스트 분할 기술을 사용하는 것이 좋습니다. 텍스트 분할 기술을 사용하는 경우 최상의 성능을 위해 페이지 길이를 5000으로 설정합니다.

기술 매개 변수

매개 변수는 대/소문자를 구분합니다.

매개 변수 이름 설명
범주 추출해야 하는 범주의 배열입니다. 가능한 범주 유형: "Person", "Location". "Organization" 범주가 제공되지 않으면 모든 형식이 반환됩니다.
defaultLanguageCode 입력 텍스트의 언어 코드입니다. 지원되는 언어는 다음과 같습니다. de, en, es, fr, it
minimumPrecision 0에서 1 사이의 숫자입니다. 전체 자릿수가 이 값보다 낮으면 엔터티가 반환되지 않습니다. 기본값은 0입니다.

기술 입력

입력 이름 설명
languageCode 선택 사항. 기본값은 "en"입니다.
text 분석할 텍스트입니다.

기술 출력

출력 이름 설명
persons 각 문자열이 사람의 이름을 나타내는 문자열 배열입니다.
위치 각 문자열이 위치를 나타내는 경우 문자열 배열입니다.
organizations 각 문자열이 조직을 나타내는 경우 문자열 배열입니다.
엔터티 복합 형식의 배열입니다. 각 복합 형식에는 다음 필드가 포함됩니다.
  • 범주("person", "organization"또는 "location")
  • 값(실제 엔터티 이름)
  • 오프셋(텍스트에서 발견된 위치)
  • confidence(값이 실제 엔터티라는 확신을 나타내는 0에서 1 사이의 값)

샘플 정의

  {
    "@odata.type": "#Microsoft.Skills.Text.NamedEntityRecognitionSkill",
    "categories": [ "Person", "Location", "Organization"],
    "defaultLanguageCode": "en",
    "inputs": [
      {
        "name": "text",
        "source": "/document/content"
      }
    ],
    "outputs": [
      {
        "name": "persons",
        "targetName": "people"
      }
    ]
  }

샘플 입력

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "This is the loan application for Joe Romero, a Microsoft employee who was born in Chile and who then moved to Australia… Ana Smith is provided as a reference.",
             "languageCode": "en"
           }
      }
    ]
}

샘플 출력

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "persons": [ "Joe Romero", "Ana Smith"],
        "locations": ["Chile", "Australia"],
        "organizations":["Microsoft"],
        "entities":  
        [
          {
            "category":"person",
            "value": "Joe Romero",
            "offset": 33,
            "confidence": 0.87
          },
          {
            "category":"person",
            "value": "Ana Smith",
            "offset": 124,
            "confidence": 0.87
          },
          {
            "category":"location",
            "value": "Chile",
            "offset": 88,
            "confidence": 0.99
          },
          {
            "category":"location",
            "value": "Australia",
            "offset": 112,
            "confidence": 0.99
          },
          {
            "category":"organization",
            "value": "Microsoft",
            "offset": 54,
            "confidence": 0.99
          }
        ]
      }
    }
  ]
}

경고 사례

문서의 언어 코드가 지원되지 않으면 경고가 반환되고 엔터티가 추출되지 않습니다.

참고 항목