다음을 통해 공유


언어 감지 인지 기술

언어 감지 기술은 입력 텍스트의 언어를 검색하고 요청에 제출된 모든 문서에 대해 단일 언어 코드를 보고합니다. 언어 코드는 분석의 강도를 나타내는 점수와 쌍을 이깁니다. 이 기술은 Azure AI Language에서 제공하는 기계 학습 모델을 사용합니다.

이 기능은 텍스트 언어를 다른 기술에 대한 입력으로 제공해야 할 경우 특히 유용합니다(예를 들어 감정 분석 기술 또는 텍스트 분할 기술).

언어 감지에 대해 지원되는 언어를 참조하세요. 지원되지 않는 언어로 표현된 콘텐츠가 있는 경우 응답은 (Unknown)입니다.

참고 항목

이 기술은 Azure AI 서비스에 바인딩되며, 하루에 인덱서당 20개의 문서를 초과하는 트랜잭션에 대해 청구 가능한 리소스를 필요로 합니다. 기본 제공 기술을 실행하는 요금은 기존 Azure AI 서비스 종량제 가격으로 청구됩니다.

@odata.type

Microsoft.Skills.Text.LanguageDetectionSkill

데이터 제한

레코드의 최대 크기는 String.Length에 의해 측정된 대로 50,000자여야 합니다. 데이터를 언어 감지 기술로 보내기 전에 분리해야 하는 경우 텍스트 분할 기술을 사용할 수 있습니다.

기술 매개 변수

매개 변수는 대/소문자를 구분합니다.

입력 설명
defaultCountryHint (선택 사항) 언어를 명확하게 구분할 수 없는 경우 ISO 3166-1 alpha-2 2 문자 국가 코드를 언어 감지 모델에 대한 힌트로 사용할 수 있습니다. 특히 매개 변수는 입력을 defaultCountryHint 명시적으로 지정 countryHint 하지 않는 문서에 사용됩니다.
modelVersion (선택 사항) 언어 감지를 호출할 때 사용할 모델의 버전을 지정합니다. 지정하지 않으면 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다.

기술 입력

매개 변수는 대/소문자를 구분합니다.

입력 설명
text 분석할 텍스트입니다.
countryHint 언어를 구분할 수 없는 경우 언어 감지 모델에 대한 힌트로 사용할 ISO 3166-1 alpha-2 2 문자 국가 코드입니다.

기술 출력

출력 이름 설명
languageCode 식별된 언어에 대한 ISO 6391 언어 코드입니다. 예를 들어 "en"입니다.
languageName 언어의 이름입니다. 예를 들어 "영어"입니다.
score 0에서 1 사이의 값입니다. 언어를 올바르게 식별하는 가능성입니다. 문장에 혼합 언어가 있는 경우 점수는 1보다 낮을 수 있습니다.

샘플 정의

 {
    "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      },
      {
        "name": "countryHint",
        "source": "/document/countryHint"
      }
    ],
    "outputs": [
      {
        "name": "languageCode",
        "targetName": "myLanguageCode"
      },
      {
        "name": "languageName",
        "targetName": "myLanguageName"
      },
      {
        "name": "score",
        "targetName": "myLanguageScore"
      }

    ]
  }

샘플 입력

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
           }
      },
      {
        "recordId": "2",
        "data":
           {
             "text": "Estamos muy felices de estar con ustedes."
           }
      },
      {
        "recordId": "3",
        "data":
           {
             "text": "impossible",
             "countryHint": "fr"
           }
      }
    ]

샘플 출력

{
    "values": [
      {
        "recordId": "1",
        "data":
            {
              "languageCode": "en",
              "languageName": "English",
              "score": 1,
            }
      },
      {
        "recordId": "2",
        "data":
            {
              "languageCode": "es",
              "languageName": "Spanish",
              "score": 1,
            }
      },
      {
        "recordId": "3",
        "data":
            {
              "languageCode": "fr",
              "languageName": "French",
              "score": 1,
            }
      }
    ]
}

참고 항목