NER(명명된 엔터티 인식) 사용 방법

NER 기능은 구조화되지 않은 텍스트를 평가하고 미리 정의된 여러 범주(예: 사람, 위치, 이벤트, 제품 및 조직)의 텍스트에서 명명된 엔터티를 추출할 수 있습니다.

개발 옵션

명명된 엔터티 인식을 사용하려면 분석을 위해 원시 비구조적 텍스트를 제출하고 애플리케이션에서 API 출력을 처리합니다. 분석은 데이터에 사용되는 모델에 대한 추가 사용자 지정 없이 있는 그대로 수행됩니다. 명명된 엔터티 인식을 사용하는 방법에는 두 가지가 있습니다.

개발 옵션 설명
Language Studio Language Studio는 등록 시 Azure 계정 및 고유한 데이터 없이 텍스트 예제와 엔터티 링크 설정을 시도할 수 있는 웹 기반 플랫폼입니다. 자세한 내용은 Language Studio 웹 사이트 또는 Language Studio 빠른 시작을 참조하세요.
REST API 또는 클라이언트 라이브러리(Azure SDK) REST API 또는 다양한 언어로 제공되는 클라이언트 라이브러리를 사용하여 명명된 엔터티 인식을 애플리케이션에 통합합니다. 자세한 내용은 명명된 엔터티 인식 빠른 시작을 참조하세요.

데이터 처리 방법 결정(선택 사항)

입력 언어

처리할 문서를 제출할 때 문서가 작성된 지원되는 언어를 지정할 수 있습니다. 언어를 지정하지 않으면 핵심 구 추출은 기본적으로 영어로 설정됩니다. API는 다양한 다국어 및 그림 이모티콘 인코딩을 지원하기 위해 응답에 오프셋을 반환할 수 있습니다.

데이터 제출

요청을 받으면 분석이 수행됩니다. NER 기능을 동기적으로 사용하는 것은 상태 비저장입니다. 계정에 데이터가 저장되지 않으며, 결과가 응답에서 즉시 반환됩니다.

이 기능을 비동기적으로 사용하는 경우 요청이 수집된 시간부터 24시간 동안 API 결과를 사용할 수 있으며 응답에 표시됩니다. 이 기간이 지나면 결과가 제거되고 더 이상 검색할 수 없습니다.

API는 지정된 문서 언어에 대해 정의된 항목 범주를 검색하려고 시도합니다.

NER 결과 얻기

NER에서 결과를 얻은 경우 결과를 애플리케이션으로 스트리밍하거나 출력을 로컬 시스템의 파일에 저장할 수 있습니다. API 응답에는 범주, 하위 범주, 신뢰도 점수를 비롯한 인식된 엔터티가 포함됩니다.

반환될 엔터티 선택(미리 보기 API에만 해당)

API 버전 2023-04-15-미리 보기부터는 API가 지정된 문서 언어에 대해 정의된 엔터티 형식 및 태그를 검색하려고 시도합니다. 엔터티 형식 및 태그는 이전 모델에서 보다 유연하게 엔터티를 정의하기 위해 사용하는 범주 및 하위 범주 구조를 대체합니다. 적절한 엔터티 형식을 통해 선택적 includeListexcludeList 매개 변수를 사용하면 검색 및 반환되는 엔터티를 지정할 수도 있습니다. 다음 예에서는 Location만 검색합니다. 반환할 엔터티 형식을 하나 이상 지정할 수 있습니다. 이 버전에 도입된 형식과 태그 계층 구조로 인해 다음과 같이 다양한 세분성 수준을 유연하게 필터링할 수 있습니다.

입력:

참고 항목

이 예제에서는 위치 엔터티 형식만 반환합니다.

{
    "kind": "EntityRecognition",
    "parameters": 
    {
        "includeList" :
        [
            "Location"
        ]
    },
    "analysisInput":
    {
        "documents":
        [
            {
                "id":"1",
                "language": "en",
                "text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
            }
        ]
    }
}

위의 예제에서는 Location에 속하는 엔터티인 GPE, Structural, Geological 태그가 지정된 엔터티 등을 엔터티 형식 및 태그에 설명된 대로 반환합니다. 또한 GPE 태그 필터링과 같은 Location 엔터티 형식 관련 엔터티 태그 가운데 하나를 설명된 대로만 필터링하여 반환된 엔터티를 추가로 필터링할 수 있습니다.


    "parameters": 
    {
        "includeList" :
        [
            "GPE"
        ]
    }
    

이 메서드는 GPE 태그에만 속하는 모든 Location 엔터티를 반환하고 Structural 또는 Geological 태그가 지정된 Location 엔터티 같이 다른 엔터티 태그가 지정된 Location 형식에 속하는 나머지 엔터티를 무시합니다. excludeList 매개 변수를 사용하여 결과를 추가로 드릴다운할 수도 있습니다. GPE 태그가 지정된 엔터티는 City, State, CountryRegion, Continent 태그를 지정할 수 있습니다. 예를 들어 예제에 맞게 Continent 태그와 CountryRegion 태그를 제외할 수 있습니다.


    "parameters": 
    {
        "includeList" :
        [
            "GPE"
        ],
        "excludeList": :
        [
            "Continent",
            "CountryRegion"
        ]
    }
    

GPE 엔터티 태그가 includeList 매개 변수에 포함되어 Location 형식에 속하기 대문에 이러한 매개 변수를 사용하면 Location 엔터티 형식만 필터링할 수 있습니다. 그런 다음 지정학적 엔터티만 필터링하고 Continent 또는 CountryRegion 태그가 지정된 엔터티를 제외합니다.

NER 모델 지정

기본적으로 이 기능은 텍스트에서 사용 가능한 최신 AI 모델을 사용합니다. 특정 모델 버전을 사용하도록 API 요청을 구성할 수도 있습니다.

서비스 및 데이터 제한

분당 및 초당 보낼 수 있는 요청의 크기와 수에 대한 내용은 서비스 제한 문서를 참조하세요.

다음 단계

명명된 엔터티 인식 개요