Udostępnij za pośrednictwem


Umiejętność poznawcza wykrywania języka

Umiejętność wykrywania języka wykrywa język tekstu wejściowego i zgłasza pojedynczy kod języka dla każdego dokumentu przesłanego na żądanie. Kod języka jest sparowany z wynikiem wskazującym siłę analizy. Ta umiejętność korzysta z modeli uczenia maszynowego dostępnych w języku azure AI.

Ta funkcja jest szczególnie przydatna, gdy musisz podać język tekstu jako dane wejściowe do innych umiejętności (na przykład umiejętności analizy tonacji lub umiejętności dzielenia tekstu).

Zobacz obsługiwane języki wykrywania języka. Jeśli masz zawartość wyrażoną w nieobsługiwanym języku, odpowiedź to (Unknown).

Uwaga

Ta umiejętność jest powiązana z usługami azure AI i wymaga rozliczanego zasobu dla transakcji, które przekraczają 20 dokumentów na indeksator dziennie. Wykonanie wbudowanych umiejętności jest naliczane za istniejące usługi Azure AI z płatnością zgodnie z rzeczywistym użyciem.

@odata.type

Microsoft.Skills.Text.LanguageDetectionSkill

Limity danych

Maksymalny rozmiar rekordu powinien wynosić 50 000 znaków mierzonych przez String.Lengthwartość . Jeśli musisz podzielić dane przed wysłaniem ich do umiejętności wykrywania języka, możesz użyć umiejętności dzielenia tekstu.

Parametry umiejętności

W parametrach jest rozróżniana wielkość liter.

Dane wejściowe opis
defaultCountryHint (Opcjonalnie) Dwuliterowy kod kraju ISO 3166-1 alfa-2 można podać jako wskazówkę dla modelu wykrywania języka, jeśli nie może uściślać języka. W szczególności defaultCountryHint parametr jest używany z dokumentami, które nie określają jawnie danych wejściowych countryHint .
modelVersion (Opcjonalnie) Określa wersję modelu do użycia podczas wywoływania wykrywania języka. Wartość domyślna to najnowsza dostępna, jeśli nie zostanie określona. Zalecamy, aby nie określać tej wartości, chyba że jest to konieczne.

Dane wejściowe umiejętności

W parametrach jest rozróżniana wielkość liter.

Dane wejściowe opis
text Tekst do przeanalizowania.
countryHint Dwuliterowy kod kraju ISO 3166-1 alfa-2 do użycia jako wskazówka dla modelu wykrywania języka, jeśli nie może uściślać języka.

Dane wyjściowe umiejętności

Nazwa danych wyjściowych opis
languageCode Kod języka ISO 6391 dla określonego języka. Na przykład "en".
languageName Nazwa języka. Na przykład "Angielski".
score Wartość z zakresu od 0 do 1. Prawdopodobieństwo poprawnego zidentyfikowania języka. Wynik może być niższy niż 1, jeśli zdanie ma języki mieszane.

Przykładowa definicja

 {
    "@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
    "inputs": [
      {
        "name": "text",
        "source": "/document/text"
      },
      {
        "name": "countryHint",
        "source": "/document/countryHint"
      }
    ],
    "outputs": [
      {
        "name": "languageCode",
        "targetName": "myLanguageCode"
      },
      {
        "name": "languageName",
        "targetName": "myLanguageName"
      },
      {
        "name": "score",
        "targetName": "myLanguageScore"
      }

    ]
  }

Przykładowe dane wejściowe

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Glaciers are huge rivers of ice that ooze their way over land, powered by gravity and their own sheer weight. "
           }
      },
      {
        "recordId": "2",
        "data":
           {
             "text": "Estamos muy felices de estar con ustedes."
           }
      },
      {
        "recordId": "3",
        "data":
           {
             "text": "impossible",
             "countryHint": "fr"
           }
      }
    ]

Przykładowe dane wyjściowe

{
    "values": [
      {
        "recordId": "1",
        "data":
            {
              "languageCode": "en",
              "languageName": "English",
              "score": 1,
            }
      },
      {
        "recordId": "2",
        "data":
            {
              "languageCode": "es",
              "languageName": "Spanish",
              "score": 1,
            }
      },
      {
        "recordId": "3",
        "data":
            {
              "languageCode": "fr",
              "languageName": "French",
              "score": 1,
            }
      }
    ]
}

Zobacz też