Kognitiv kunskap om språkidentifiering

Språkidentifieringsfärdigheten identifierar språket för indatatext och rapporterar en enda språkkod för varje dokument som skickas på begäran. Språkkoden paras ihop med en poäng som anger analysens styrka. Den här färdigheten använder maskininlärningsmodellerna i Azure AI Language.

Den här funktionen är särskilt användbar när du behöver ange språket i texten som indata till andra färdigheter (till exempel färdigheten Attitydanalys eller Kunskaper om textdelning).

Se språk som stöds för Språkidentifiering. Om du har innehåll uttryckt på ett språk som inte stöds är (Unknown)svaret .

Kommentar

Den här kompetensen är bunden till Azure AI-tjänster och kräver en fakturerbar resurs för transaktioner som överstiger 20 dokument per indexerare och dag. Körning av inbyggda kunskaper debiteras enligt det befintliga priset för Betala per användning för Azure AI-tjänster.

@odata.type

Microsoft.Skills.Text.LanguageDetectionSkill

Databegränsningar

Den maximala storleken på en post ska vara 50 000 tecken mätt med String.Length. Om du behöver dela upp dina data innan du skickar dem till språkidentifieringsfärdigheten kan du använda färdigheten Textdelning.

Kompetensparametrar

Parametrar är skiftlägeskänsliga.

Indata beskrivning
defaultCountryHint (Valfritt) En ISO 3166-1 alfa-2 två bokstäver landskod kan tillhandahållas för användning som ett tips till språkidentifieringsmodellen om det inte kan skilja språket. Mer specifikt används parametern defaultCountryHint med dokument som inte uttryckligen countryHint anger indata.
modelVersion (Valfritt) Anger vilken version av modellen som ska användas när språkidentifiering anropas. Den är som standard den senaste tillgängliga när den inte har angetts. Vi rekommenderar att du inte anger det här värdet om det inte är nödvändigt.

Kunskapsindata

Parametrar är skiftlägeskänsliga.

Indata beskrivning
text Texten som ska analyseras.
countryHint En ISO 3166-1 alfa-2 två bokstäver landskod att använda som ett tips till språkidentifieringsmodellen om det inte kan skilja språket.

Kunskapsutdata

Utdatanamn beskrivning
languageCode ISO 6391-språkkoden för det identifierade språket. Till exempel "en".
languageName Språkets namn. Till exempel "engelska".
score Ett värde mellan 0 och 1. Sannolikheten för att språket identifieras korrekt. Poängen kan vara lägre än 1 om meningen har blandade språk.

Exempeldefinition

 {
    "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      },
      {
        "name": "countryHint",
        "source": "/document/countryHint"
      }
    ],
    "outputs": [
      {
        "name": "languageCode",
        "targetName": "myLanguageCode"
      },
      {
        "name": "languageName",
        "targetName": "myLanguageName"
      },
      {
        "name": "score",
        "targetName": "myLanguageScore"
      }

    ]
  }

Exempelindata

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
           }
      },
      {
        "recordId": "2",
        "data":
           {
             "text": "Estamos muy felices de estar con ustedes."
           }
      },
      {
        "recordId": "3",
        "data":
           {
             "text": "impossible",
             "countryHint": "fr"
           }
      }
    ]

Exempelutdata

{
    "values": [
      {
        "recordId": "1",
        "data":
            {
              "languageCode": "en",
              "languageName": "English",
              "score": 1,
            }
      },
      {
        "recordId": "2",
        "data":
            {
              "languageCode": "es",
              "languageName": "Spanish",
              "score": 1,
            }
      },
      {
        "recordId": "3",
        "data":
            {
              "languageCode": "fr",
              "languageName": "French",
              "score": 1,
            }
      }
    ]
}

Se även