Competenza cognitiva di rilevamento lingua

La competenza Rilevamento lingua rileva la lingua del testo di input e segnala un singolo codice linguistico per ogni documento inviato nella richiesta. Il codice lingua è associato a un punteggio che indica il livello di attendibilità dell'analisi. Questa competenza usa i modelli di Machine Learning forniti in Linguaggio di Azure in Strumenti foundry.

Questa funzionalità è particolarmente utile quando è necessario specificare la lingua del testo come input per altre competenze (ad esempio, la competenza Analisi del sentiment o la competenza Divisione del testo).

Vedere le lingue supportate per il rilevamento della lingua. Se il contenuto è espresso in una lingua non supportata, la risposta è (Unknown).

Note

Questa competenza è associata a Foundry Tools e richiede una risorsa fatturabile per le transazioni che superano 20 documenti per indicizzatore al giorno. L'esecuzione di competenze predefinite viene addebitata al prezzo standard degli strumenti Foundry esistenti.

@odata.type

Microsoft.Skills.Text.LanguageDetectionSkill

Data limits

Le dimensioni massime di un record devono essere di 50.000 caratteri in base alla misurazione di String.Length. Se è necessario suddividere i dati prima di inviarli alla competenza di rilevamento della lingua, è possibile usare la competenza Suddivisione testo.

Skill parameters

I parametri fanno distinzione tra maiuscole e minuscole.

Inputs Description
defaultCountryHint (Facoltativo) È possibile specificare un codice paese ISO 3166-1 alfa-2 di due lettere da usare come suggerimento per il modello di rilevamento della lingua se non può disambiguare la lingua. In particolare, il defaultCountryHint parametro viene usato con i documenti che non specificano l'input countryHint in modo esplicito.
modelVersion (Facoltativo) Specifica la versione del modello da usare quando si chiama il rilevamento della lingua. Per impostazione predefinita, la versione più recente disponibile quando non è specificata. È consigliabile non specificare questo valore a meno che non sia necessario.

Skill inputs

I parametri fanno distinzione tra maiuscole e minuscole.

Inputs Description
text Testo da analizzare.
countryHint Codice paese ISO 3166-1 alfa-2 da usare come suggerimento per il modello di rilevamento della lingua se non può disambiguare la lingua.

Skill outputs

Output Name Description
languageCode Il codice di lingua ISO 6391 per la lingua identificata. Ad esempio, "en".
languageName Il nome della lingua. Ad esempio, "Inglese".
score Immettere un valore compreso tra 0 e 1. La probabilità che lingua sia identificata correttamente. Il punteggio può essere inferiore a 1 se la frase ha lingue miste.

Sample definition

 {
    "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      },
      {
        "name": "countryHint",
        "source": "/document/countryHint"
      }
    ],
    "outputs": [
      {
        "name": "languageCode",
        "targetName": "myLanguageCode"
      },
      {
        "name": "languageName",
        "targetName": "myLanguageName"
      },
      {
        "name": "score",
        "targetName": "myLanguageScore"
      }

    ]
  }

Sample input

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
           }
      },
      {
        "recordId": "2",
        "data":
           {
             "text": "Estamos muy felices de estar con ustedes."
           }
      },
      {
        "recordId": "3",
        "data":
           {
             "text": "impossible",
             "countryHint": "fr"
           }
      }
    ]

Sample output

{
    "values": [
      {
        "recordId": "1",
        "data":
            {
              "languageCode": "en",
              "languageName": "English",
              "score": 1,
            }
      },
      {
        "recordId": "2",
        "data":
            {
              "languageCode": "es",
              "languageName": "Spanish",
              "score": 1,
            }
      },
      {
        "recordId": "3",
        "data":
            {
              "languageCode": "fr",
              "languageName": "French",
              "score": 1,
            }
      }
    ]
}

See also