Kognitivní dovednost rozpoznávání jazyka

Dovednost Rozpoznávání jazyka rozpozná jazyk vstupního textu a hlásí jeden kód jazyka pro každý dokument odeslaný na žádost. Kód jazyka je spárovaný se skóre označujícím sílu analýzy. Tato dovednost využívá modely strojového učení poskytované v jazyce Azure AI.

Tato funkce je užitečná zejména v případě, že potřebujete poskytnout jazyk textu jako vstup do jiných dovedností (například dovednost analýza mínění nebo dovednost Rozdělení textu).

Viz podporované jazyky pro rozpoznávání jazyka. Pokud máte obsah vyjádřený v nepodporovaném jazyce, odpověď je (Unknown).

Poznámka:

Tato dovednost je vázána na služby Azure AI a vyžaduje fakturovatelný prostředek pro transakce, které překračují 20 dokumentů na indexer za den. Provádění integrovaných dovedností se účtuje za stávající cenu průběžných plateb za služby Azure AI.

@odata.type

Microsoft.Skills.Text.LanguageDetectionSkill

Omezení dat

Maximální velikost záznamu by měla být 50 000 znaků měřená String.Lengthhodnotou . Pokud potřebujete data rozdělit před odesláním do dovednosti rozpoznávání jazyka, můžete použít dovednost Rozdělení textu.

Parametry dovedností

Parametry rozlišují malá a velká písmena.

Vstupy Popis
defaultCountryHint (Volitelné) Kód země se dvěma písmeny ISO 3166-1 alfa-2 lze poskytnout jako nápovědu k modelu rozpoznávání jazyka, pokud jazyk nedokáže nejednoznačit. Konkrétně se defaultCountryHint parametr používá s dokumenty, které nezadávají countryHint vstup explicitně.
modelVersion (Volitelné) Určuje verzi modelu, která se má použít při volání rozpoznávání jazyka. Výchozí hodnota je nejnovější dostupná, pokud není zadána. Tuto hodnotu doporučujeme nezadávat, pokud není nutná.

Vstupy dovedností

Parametry rozlišují malá a velká písmena.

Vstupy Popis
text Text, který se má analyzovat.
countryHint Kód země iso 3166-1 alfa-2, který se použije jako nápověda k modelu rozpoznávání jazyka, pokud jazyk nedokáže nejednoznačit.

Výstupy dovedností

Název výstupu Popis
languageCode Kód jazyka ISO 6391 pro identifikovaný jazyk. Například "en".
languageName Název jazyka. Například "Angličtina".
score Hodnota mezi 0 a 1. Pravděpodobnost správné identifikace jazyka. Pokud má věta smíšené jazyky, může být skóre nižší než 1.

Ukázková definice

 {
    "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      },
      {
        "name": "countryHint",
        "source": "/document/countryHint"
      }
    ],
    "outputs": [
      {
        "name": "languageCode",
        "targetName": "myLanguageCode"
      },
      {
        "name": "languageName",
        "targetName": "myLanguageName"
      },
      {
        "name": "score",
        "targetName": "myLanguageScore"
      }

    ]
  }

Ukázkový vstup

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
           }
      },
      {
        "recordId": "2",
        "data":
           {
             "text": "Estamos muy felices de estar con ustedes."
           }
      },
      {
        "recordId": "3",
        "data":
           {
             "text": "impossible",
             "countryHint": "fr"
           }
      }
    ]

Ukázkový výstup

{
    "values": [
      {
        "recordId": "1",
        "data":
            {
              "languageCode": "en",
              "languageName": "English",
              "score": 1,
            }
      },
      {
        "recordId": "2",
        "data":
            {
              "languageCode": "es",
              "languageName": "Spanish",
              "score": 1,
            }
      },
      {
        "recordId": "3",
        "data":
            {
              "languageCode": "fr",
              "languageName": "French",
              "score": 1,
            }
      }
    ]
}

Viz také