언어 감지 인지 기술
언어 감지 기술은 입력 텍스트의 언어를 검색하고 요청에 제출된 모든 문서에 대해 단일 언어 코드를 보고합니다. 언어 코드는 분석의 강도를 나타내는 점수와 쌍을 이깁니다. 이 기술은 Azure AI Language에서 제공하는 기계 학습 모델을 사용합니다.
이 기능은 텍스트 언어를 다른 기술에 대한 입력으로 제공해야 할 경우 특히 유용합니다(예를 들어 감정 분석 기술 또는 텍스트 분할 기술).
언어 감지에 대해 지원되는 언어를 참조하세요. 지원되지 않는 언어로 표현된 콘텐츠가 있는 경우 응답은 (Unknown)
입니다.
참고 항목
이 기술은 Azure AI 서비스에 바인딩되며, 하루에 인덱서당 20개의 문서를 초과하는 트랜잭션에 대해 청구 가능한 리소스를 필요로 합니다. 기본 제공 기술을 실행하는 요금은 기존 Azure AI 서비스 종량제 가격으로 청구됩니다.
@odata.type
Microsoft.Skills.Text.LanguageDetectionSkill
데이터 제한
레코드의 최대 크기는 String.Length
에 의해 측정된 대로 50,000자여야 합니다. 데이터를 언어 감지 기술로 보내기 전에 분리해야 하는 경우 텍스트 분할 기술을 사용할 수 있습니다.
기술 매개 변수
매개 변수는 대/소문자를 구분합니다.
입력 | 설명 |
---|---|
defaultCountryHint |
(선택 사항) 언어를 명확하게 구분할 수 없는 경우 ISO 3166-1 alpha-2 2 문자 국가 코드를 언어 감지 모델에 대한 힌트로 사용할 수 있습니다. 특히 매개 변수는 입력을 defaultCountryHint 명시적으로 지정 countryHint 하지 않는 문서에 사용됩니다. |
modelVersion |
(선택 사항) 언어 감지를 호출할 때 사용할 모델의 버전을 지정합니다. 지정하지 않으면 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다. |
기술 입력
매개 변수는 대/소문자를 구분합니다.
입력 | 설명 |
---|---|
text |
분석할 텍스트입니다. |
countryHint |
언어를 구분할 수 없는 경우 언어 감지 모델에 대한 힌트로 사용할 ISO 3166-1 alpha-2 2 문자 국가 코드입니다. |
기술 출력
출력 이름 | 설명 |
---|---|
languageCode |
식별된 언어에 대한 ISO 6391 언어 코드입니다. 예를 들어 "en"입니다. |
languageName |
언어의 이름입니다. 예를 들어 "영어"입니다. |
score |
0에서 1 사이의 값입니다. 언어를 올바르게 식별하는 가능성입니다. 문장에 혼합 언어가 있는 경우 점수는 1보다 낮을 수 있습니다. |
샘플 정의
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"inputs": [
{
"name": "text",
"source": "/document/text"
},
{
"name": "countryHint",
"source": "/document/countryHint"
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "myLanguageCode"
},
{
"name": "languageName",
"targetName": "myLanguageName"
},
{
"name": "score",
"targetName": "myLanguageScore"
}
]
}
샘플 입력
{
"values": [
{
"recordId": "1",
"data":
{
"text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
}
},
{
"recordId": "2",
"data":
{
"text": "Estamos muy felices de estar con ustedes."
}
},
{
"recordId": "3",
"data":
{
"text": "impossible",
"countryHint": "fr"
}
}
]
샘플 출력
{
"values": [
{
"recordId": "1",
"data":
{
"languageCode": "en",
"languageName": "English",
"score": 1,
}
},
{
"recordId": "2",
"data":
{
"languageCode": "es",
"languageName": "Spanish",
"score": 1,
}
},
{
"recordId": "3",
"data":
{
"languageCode": "fr",
"languageName": "French",
"score": 1,
}
}
]
}