언어 감지 인지 기술

언어 감지 기술은 입력 텍스트의 언어를 검색하고 요청에 제출된 모든 문서에 대해 단일 언어 코드를 보고합니다. 언어 코드는 분석의 강도를 나타내는 점수와 쌍을 이깁니다. 이 기술은 Azure AI Language에서 제공하는 기계 학습 모델을 사용합니다.

이 기능은 텍스트 언어를 다른 기술에 대한 입력으로 제공해야 할 경우 특히 유용합니다(예를 들어 감정 분석 기술 또는 텍스트 분할 기술).

언어 감지에 대해 지원되는 언어를 참조하세요. 지원되지 않는 언어로 표현된 콘텐츠가 있는 경우 응답은 (Unknown)입니다.

참고 항목

이 기술은 Azure AI 서비스에 바인딩되며 하루에 인덱서당 20개의 문서를 초과하는 트랜잭션에 대해 청구 가능한 리소스가 필요합니다. 기본 제공 기술의 실행은 기존 Azure AI 서비스 종량제 가격으로 청구됩니다.

@odata.type

Microsoft.Skills.Text.LanguageDetectionSkill

데이터 제한

레코드의 최대 크기는 String.Length에 의해 측정된 대로 50,000자여야 합니다. 데이터를 언어 감지 기술로 보내기 전에 분리해야 하는 경우 텍스트 분할 기술을 사용할 수 있습니다.

기술 매개 변수

매개 변수는 대/소문자를 구분합니다.

입력 설명
defaultCountryHint (선택 사항) 언어를 명확하게 구분할 수 없는 경우 ISO 3166-1 alpha-2 2 문자 국가 코드를 언어 감지 모델에 대한 힌트로 사용할 수 있습니다. 특히 매개 변수는 입력을 defaultCountryHint 명시적으로 지정 countryHint 하지 않는 문서에 사용됩니다.
modelVersion (선택 사항) 언어 감지를 호출할 때 사용할 모델의 버전을 지정합니다. 지정하지 않으면 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다.

기술 입력

매개 변수는 대/소문자를 구분합니다.

입력 설명
text 분석할 텍스트입니다.
countryHint 언어를 구분할 수 없는 경우 언어 감지 모델에 대한 힌트로 사용할 ISO 3166-1 alpha-2 2 문자 국가 코드입니다.

기술 출력

출력 이름 설명
languageCode 식별된 언어에 대한 ISO 6391 언어 코드입니다. 예를 들어 "en"입니다.
languageName 언어의 이름입니다. 예를 들어 "영어"입니다.
score 0에서 1 사이의 값입니다. 언어를 올바르게 식별하는 가능성입니다. 문장에 혼합 언어가 있는 경우 점수는 1보다 낮을 수 있습니다.

샘플 정의

 {
    "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      },
      {
        "name": "countryHint",
        "source": "/document/countryHint"
      }
    ],
    "outputs": [
      {
        "name": "languageCode",
        "targetName": "myLanguageCode"
      },
      {
        "name": "languageName",
        "targetName": "myLanguageName"
      },
      {
        "name": "score",
        "targetName": "myLanguageScore"
      }

    ]
  }

샘플 입력

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
           }
      },
      {
        "recordId": "2",
        "data":
           {
             "text": "Estamos muy felices de estar con ustedes."
           }
      },
      {
        "recordId": "3",
        "data":
           {
             "text": "impossible",
             "countryHint": "fr"
           }
      }
    ]

샘플 출력

{
    "values": [
      {
        "recordId": "1",
        "data":
            {
              "languageCode": "en",
              "languageName": "English",
              "score": 1,
            }
      },
      {
        "recordId": "2",
        "data":
            {
              "languageCode": "es",
              "languageName": "Spanish",
              "score": 1,
            }
      },
      {
        "recordId": "3",
        "data":
            {
              "languageCode": "fr",
              "languageName": "French",
              "score": 1,
            }
      }
    ]
}

참고 항목