Cara menggunakan Pengenalan Entitas Bernama (NER)
Fitur NER dapat mengevaluasi teks yang tidak terstruktur, dan mengekstrak entitas bernama dari teks dalam beberapa kategori yang telah ditentukan sebelumnya, misalnya: orang, lokasi, peristiwa, produk, dan organisasi.
Opsi pengembangan
Untuk menggunakan pengenalan entitas bernama, Anda mengirimkan teks mentah yang tidak terstruktur untuk analisis dan menangani output API di aplikasi Anda. Analisis dilakukan sebagaimana adanya, tanpa penyesuaian tambahan untuk model yang digunakan pada data Anda. Ada dua cara untuk menggunakan pengenalan entitas bernama:
Opsi pengembangan | Deskripsi |
---|---|
Studio bahasa | Language Studio adalah platform berbasis web yang memungkinkan Anda mencoba penautan entitas dengan contoh teks tanpa akun Azure, dan data Anda sendiri saat mendaftar. Untuk informasi selengkapnya, lihat mulai cepat situs web Language Studio atau studio bahasa. |
REST API atau Pustaka Klien (Azure SDK) | Integrasikan pengenalan entitas bernama ke dalam aplikasi Anda menggunakan REST API, atau pustaka klien yang tersedia dalam berbagai bahasa. Untuk informasi selengkapnya, lihat mulai cepat pengenalan entitas bernama. |
Menentukan cara memproses data (opsional)
Bahasa input
Saat mengirimkan dokumen yang akan diproses, Anda dapat menentukan bahasa mana yang didukung yang ditulis. jika Anda tidak menentukan bahasa, ekstraksi frasa kunci default ke bahasa Inggris. API dapat menampilkan offset dalam respons untuk mendukung pengodean multibahasa dan emoji yang berbeda.
Mengirimkan data
Analisis dilakukan setelah permintaan diterima. Menggunakan fitur NER secara sinkron bersifat tanpa status. Tidak ada data yang disimpan di akun Anda, dan hasilnya segera dikembalikan sebagai respons.
Saat menggunakan fitur ini secara asinkron, hasil API tersedia selama 24 jam sejak permintaan diterima, dan ditunjukkan dalam respons. Setelah jangka waktu ini, hasilnya akan dihapus menyeluruh dan tidak lagi tersedia untuk diambil.
API mencoba mendeteksi kategori entitas yang ditentukan untuk bahasa dokumen tertentu.
Mendapatkan hasil NER
Saat mendapatkan hasil dari NER, Anda dapat mengalirkan hasilnya ke aplikasi atau menyimpan output ke file di sistem lokal. Tanggapan API akan mencakup entitas yang dikenali, termasuk kategori dan subkategorinya, serta skor kepercayaan.
Pilih entitas mana yang akan dikembalikan (hanya API Pratinjau)
Dimulai dengan api versi 2023-04-15-preview, API mencoba mendeteksi jenis entitas dan tag yang ditentukan untuk bahasa dokumen tertentu. Jenis entitas dan tag menggantikan kategori dan struktur subkategori yang digunakan model lama untuk menentukan entitas untuk fleksibilitas yang lebih tinggi. Anda juga dapat menentukan entitas mana yang terdeteksi dan dikembalikan, menggunakan opsional includeList
dan excludeList
parameter dengan jenis entitas yang sesuai. Contoh berikut ini hanya akan mendeteksi Location
. Anda dapat menentukan satu atau beberapa jenis entitas yang akan dikembalikan. Mengingat hierarki jenis dan tag yang diperkenalkan untuk versi ini, Anda memiliki fleksibilitas untuk memfilter tingkat granularitas yang berbeda seperti:
Input:
Catatan
Dalam contoh ini, hanya mengembalikan jenis entitas Lokasi .
{
"kind": "EntityRecognition",
"parameters":
{
"includeList" :
[
"Location"
]
},
"analysisInput":
{
"documents":
[
{
"id":"1",
"language": "en",
"text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
}
]
}
}
Contoh di atas akan mengembalikan entitas yang termasuk dalam Location
jenis entitas seperti GPE
entitas , , Structural
dan Geological
yang ditandai seperti yang diuraikan oleh jenis entitas dan tag. Kita juga dapat memfilter lebih lanjut entitas yang dikembalikan dengan memfilter menggunakan salah satu tag entitas untuk Location
jenis entitas seperti pemfilteran melalui GPE
tag hanya seperti yang diuraikan:
"parameters":
{
"includeList" :
[
"GPE"
]
}
Metode ini mengembalikan semua Location
entitas yang hanya termasuk dalam GPE
tag dan mengabaikan entitas lain yang termasuk dalam Location
jenis yang ditandai dengan tag entitas lain seperti Structural
atau Geological
entitas yang ditandai Location
. Kami juga dapat menelusuri lebih lanjut hasil kami dengan menggunakan excludeList
parameter . GPE
entitas yang ditandai dapat ditandai dengan tag berikut: City
, , State
CountryRegion
, Continent
. Kita bisa, misalnya, mengecualikan Continent
dan CountryRegion
tag untuk contoh kita:
"parameters":
{
"includeList" :
[
"GPE"
],
"excludeList": :
[
"Continent",
"CountryRegion"
]
}
Menggunakan parameter ini kita dapat berhasil memfilter hanya Location
pada jenis entitas, karena GPE
tag entitas yang disertakan dalam includeList
parameter, termasuk dalam Location
jenis . Kami kemudian hanya memfilter entitas Geopolitik dan mengecualikan entitas apa pun yang ditandai dengan Continent
atau CountryRegion
tag.
Menentukan model NER
Secara default, fitur ini menggunakan model AI terbaru yang tersedia pada teks Anda. Anda juga dapat mengonfigurasikan permintaan API untuk menggunakan versi model tertentu.
Batas layanan dan data
Untuk informasi tentang ukuran dan jumlah permintaan yang dapat Anda kirim per menit dan detik, lihat artikel batas layanan.