Udostępnij za pośrednictwem


Umiejętność poznawcza łączenia jednostek (wersja 3)

Umiejętność entity linking (wersja 3) zwraca listę rozpoznanych jednostek z linkami do artykułów w dobrze znanym baza wiedzy (Wikipedia).

Uwaga

Ta umiejętność jest powiązana z modelami uczenia maszynowego entity linking w języku AI platformy Azure i wymaga rozliczanego zasobu dla transakcji, które przekraczają 20 dokumentów na indeksator dziennie. Wykonanie wbudowanych umiejętności jest naliczane za istniejące usługi Azure AI z płatnością zgodnie z rzeczywistym użyciem.

@odata.type

Microsoft.Skills.Text.V3.EntityLinkingSkill

Limity danych

Maksymalny rozmiar rekordu powinien wynosić 50 000 znaków mierzonych przez String.Lengthwartość . Jeśli musisz podzielić dane przed wysłaniem ich do umiejętności EntityLinking, rozważ użycie umiejętności dzielenia tekstu. Jeśli używasz umiejętności dzielenia tekstu, ustaw długość strony na 5000, aby uzyskać najlepszą wydajność.

Parametry umiejętności

Nazwy parametrów są uwzględniane w wielkości liter i są opcjonalne.

Nazwa parametru opis
defaultLanguageCode Kod języka tekstu wejściowego. Jeśli nie określono domyślnego kodu języka, język angielski (en) będzie używany jako domyślny kod języka.
Zobacz pełną listę obsługiwanych języków.
minimumPrecision Wartość z zakresu od 0 do 1. Jeśli wynik ufności (w danych wyjściowych entities ) jest niższy niż ta wartość, jednostka nie jest zwracana. Wartość domyślna to 0.
modelVersion (Opcjonalnie) Określa wersję modelu do użycia podczas wywoływania łączenia jednostek. Jeśli nie zostanie określona, będzie ona domyślnie dostępna do najnowszej. Zalecamy, aby nie określać tej wartości, chyba że jest to konieczne.

Dane wejściowe umiejętności

Nazwa danych wejściowych opis
languageCode Ciąg wskazujący język rekordów. Jeśli ten parametr nie zostanie określony, domyślny kod języka będzie używany do analizowania rekordów.
Zobacz pełną listę obsługiwanych języków.
text Tekst do przeanalizowania.

Dane wyjściowe umiejętności

Nazwa danych wyjściowych opis
entities Tablica typów złożonych, które zawierają następujące pola:
  • "name" (Rzeczywista nazwa jednostki wyświetlana w tekście)
  • "id"
  • "language" (Język tekstu określony przez umiejętności)
  • "url" (Połączony adres URL z tą jednostką)
  • "bingId" (identyfikator bingId dla tej połączonej jednostki)
  • "dataSource" (Źródło danych skojarzone z adresem URL)
  • "matches"(Tablica typów złożonych, które zawierają: text, length offseti confidenceScore)

Przykładowa definicja

  {
    "@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
    "context": "/document",
    "defaultLanguageCode": "en", 
    "minimumPrecision": 0.5, 
    "inputs": [
        {
            "name": "text", 
            "source": "/document/content"
        },
        {
            "name": "languageCode", 
            "source": "/document/language"
        }
    ],
    "outputs": [
        {
            "name": "entities", 
            "targetName": "entities" 
        }
    ]
}

Przykładowe dane wejściowe

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Microsoft is liked by many.",
             "languageCode": "en"
           }
      }
    ]
}

Przykładowe dane wyjściowe

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "entities": [
          {
            "name": "Microsoft", 
            "id": "Microsoft",
            "language": "en", 
            "url": "https://en.wikipedia.org/wiki/Microsoft", 
            "bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85", 
            "dataSource": "Wikipedia", 
            "matches": [
                {
                    "text": "Microsoft", 
                    "offset": 0, 
                    "length": 9, 
                    "confidenceScore": 0.13 
                }
            ]
          }
        ],
      }
    }
  ]
}

Przesunięcia zwracane dla jednostek w danych wyjściowych tej umiejętności są zwracane bezpośrednio z interfejsów API usługi językowej, co oznacza, że jeśli używasz ich do indeksowania do oryginalnego ciągu, należy użyć klasy StringInfo na platformie .NET, aby wyodrębnić poprawną zawartość. Aby uzyskać więcej informacji, zobacz Obsługa wielojęzycznych i emoji w temacie Funkcje usługi językowej.

Przypadki ostrzegawcze

Jeśli kod języka dokumentu nie jest obsługiwany, zwracane jest ostrzeżenie i nie są wyodrębniane żadne jednostki.

Zobacz też