Keterampilan kognitif Penautan Entitas (v3)

Keterampilan Penautan Entitas (v3) mengembalikan daftar entitas yang dikenali dengan tautan ke artikel dalam basis pengetahuan terkenal (Wikipedia).

Note

Keterampilan ini terikat pada model pembelajaran mesin Penautan Entitas di Azure Vision di Foundry Tools. Ini memerlukan sumber daya yang dapat ditagih untuk transaksi yang melebihi 20 dokumen per pengindeks per hari. Eksekusi keterampilan bawaan dibebankan pada harga Foundry Tools Standard yang ada.

@odata.type

Microsoft.Skills.Text.V3.EntityLinkingSkill

Data limits

Ukuran maksimum rekaman harus 50.000 karakter sebagaimana diukur oleh String.Length. Jika Anda perlu memecah data sebelum mengirimkannya ke keterampilan EntityLinking, pertimbangkan untuk menggunakan keterampilan Pemisahan Teks. Jika Anda menggunakan keterampilan pemisahan teks, atur panjang halaman ke 5000 untuk performa terbaik.

Skill parameters

Nama parameter peka terhadap huruf besar/kecil dan semuanya bersifat opsional.

Parameter name Description
defaultLanguageCode Kode bahasa dari teks input. Jika kode bahasa default tidak ditentukan, bahasa Inggris (en) digunakan sebagai kode bahasa default.
Lihat daftar lengkap bahasa yang didukung.
minimumPrecision Nilai antara 0 dan 1. Jika skor keyakinan (dalam entities output) lebih rendah dari nilai ini, entitas tidak dikembalikan. Defaultnya adalah 0.
modelVersion (Opsional) Menentukan versi model yang akan digunakan saat memanggil penautan entitas. Ini default ke yang terbaru yang tersedia ketika tidak ditentukan. Kami sarankan Anda tidak menentukan nilai ini kecuali diperlukan.

Skill inputs

Input name Description
languageCode String yang menunjukkan bahasa rekaman. Jika parameter ini tidak ditentukan, kode bahasa default digunakan untuk menganalisis rekaman.
Lihat daftar lengkap bahasa yang didukung.
text Teks yang akan dianalisis.

Skill outputs

Output name Description
entities Array jenis kompleks yang berisi bidang berikut:
  • "name" (Nama entitas aktual seperti yang muncul dalam teks)
  • "id"
  • "language" (Bahasa teks sebagaimana ditentukan oleh keterampilan)
  • "url" (Url tertaut ke entitas ini)
  • "bingId" (bingId untuk entitas tertaut ini)
  • "dataSource" (Sumber data yang terkait dengan url)
  • "matches" (Array jenis kompleks yang berisi: text, offset, length dan confidenceScore)

Sample definition

  {
    "@odata.type": "#Microsoft.Skills.Text.V3.EntityLinkingSkill",
    "context": "/document",
    "defaultLanguageCode": "en", 
    "minimumPrecision": 0.5, 
    "inputs": [
        {
            "name": "text", 
            "source": "/document/content"
        },
        {
            "name": "languageCode", 
            "source": "/document/language"
        }
    ],
    "outputs": [
        {
            "name": "entities", 
            "targetName": "entities" 
        }
    ]
}

Sample input

{
    "values": [
      {
        "recordId": "1",
        "data":
           {
             "text": "Microsoft is liked by many.",
             "languageCode": "en"
           }
      }
    ]
}

Sample output

{
  "values": [
    {
      "recordId": "1",
      "data" : 
      {
        "entities": [
          {
            "name": "Microsoft", 
            "id": "Microsoft",
            "language": "en", 
            "url": "https://en.wikipedia.org/wiki/Microsoft", 
            "bingId": "a093e9b9-90f5-a3d5-c4b8-5855e1b01f85", 
            "dataSource": "Wikipedia", 
            "matches": [
                {
                    "text": "Microsoft", 
                    "offset": 0, 
                    "length": 9, 
                    "confidenceScore": 0.13 
                }
            ]
          }
        ],
      }
    }
  ]
}

Offset yang dikembalikan untuk entitas dalam output keterampilan ini langsung dikembalikan dari API Layanan Bahasa, yang berarti jika Anda menggunakannya untuk mengindeks ke dalam string asli, Anda harus menggunakan kelas StringInfo di .NET untuk mengekstrak konten yang benar. Untuk informasi selengkapnya, lihat Dukungan multibahasa dan emoji dalam fitur layanan Bahasa.

Warning cases

Jika kode bahasa untuk dokumen tidak didukung, peringatan akan ditampilkan dan tidak ada entitas yang diekstraksi.

See also