Cara menggunakan Pengenalan Entitas Bernama (NER)

Fitur NER dapat mengevaluasi teks yang tidak terstruktur, dan mengekstrak entitas bernama dari teks dalam beberapa kategori yang telah ditentukan sebelumnya, misalnya: orang, lokasi, peristiwa, produk, dan organisasi.

Opsi pengembangan

Untuk menggunakan pengenalan entitas bernama, Anda mengirimkan teks mentah yang tidak terstruktur untuk analisis dan menangani output API di aplikasi Anda. Analisis dilakukan sebagaimana adanya, tanpa penyesuaian tambahan untuk model yang digunakan pada data Anda. Ada dua cara untuk menggunakan pengenalan entitas bernama:

Opsi pengembangan Deskripsi
Studio bahasa Language Studio adalah platform berbasis web yang memungkinkan Anda mencoba penautan entitas dengan contoh teks tanpa akun Azure, dan data Anda sendiri saat mendaftar. Untuk informasi selengkapnya, lihat mulai cepat situs web Language Studio atau studio bahasa.
REST API atau Pustaka Klien (Azure SDK) Integrasikan pengenalan entitas bernama ke dalam aplikasi Anda menggunakan REST API, atau pustaka klien yang tersedia dalam berbagai bahasa. Untuk informasi selengkapnya, lihat mulai cepat pengenalan entitas bernama.

Menentukan cara memproses data (opsional)

Bahasa input

Saat mengirimkan dokumen yang akan diproses, Anda dapat menentukan bahasa mana yang didukung yang ditulis. jika Anda tidak menentukan bahasa, ekstraksi frasa kunci default ke bahasa Inggris. API dapat menampilkan offset dalam respons untuk mendukung pengodean multibahasa dan emoji yang berbeda.

Mengirimkan data

Analisis dilakukan setelah permintaan diterima. Menggunakan fitur NER secara sinkron bersifat tanpa status. Tidak ada data yang disimpan di akun Anda, dan hasilnya segera dikembalikan sebagai respons.

Saat menggunakan fitur ini secara asinkron, hasil API tersedia selama 24 jam sejak permintaan diterima, dan ditunjukkan dalam respons. Setelah jangka waktu ini, hasilnya akan dihapus menyeluruh dan tidak lagi tersedia untuk diambil.

API mencoba mendeteksi kategori entitas yang ditentukan untuk bahasa dokumen tertentu.

Mendapatkan hasil NER

Saat mendapatkan hasil dari NER, Anda dapat mengalirkan hasilnya ke aplikasi atau menyimpan output ke file di sistem lokal. Tanggapan API akan mencakup entitas yang dikenali, termasuk kategori dan subkategorinya, serta skor kepercayaan.

Pilih entitas mana yang akan dikembalikan (hanya API Pratinjau)

Dimulai dengan api versi 2023-04-15-preview, API mencoba mendeteksi jenis entitas dan tag yang ditentukan untuk bahasa dokumen tertentu. Jenis entitas dan tag menggantikan kategori dan struktur subkategori yang digunakan model lama untuk menentukan entitas untuk fleksibilitas yang lebih tinggi. Anda juga dapat menentukan entitas mana yang terdeteksi dan dikembalikan, menggunakan opsional includeList dan excludeList parameter dengan jenis entitas yang sesuai. Contoh berikut ini hanya akan mendeteksi Location. Anda dapat menentukan satu atau beberapa jenis entitas yang akan dikembalikan. Mengingat hierarki jenis dan tag yang diperkenalkan untuk versi ini, Anda memiliki fleksibilitas untuk memfilter tingkat granularitas yang berbeda seperti:

Input:

Catatan

Dalam contoh ini, hanya mengembalikan jenis entitas Lokasi .

{
    "kind": "EntityRecognition",
    "parameters": 
    {
        "includeList" :
        [
            "Location"
        ]
    },
    "analysisInput":
    {
        "documents":
        [
            {
                "id":"1",
                "language": "en",
                "text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
            }
        ]
    }
}

Contoh di atas akan mengembalikan entitas yang termasuk dalam Location jenis entitas seperti GPEentitas , , Structuraldan Geological yang ditandai seperti yang diuraikan oleh jenis entitas dan tag. Kita juga dapat memfilter lebih lanjut entitas yang dikembalikan dengan memfilter menggunakan salah satu tag entitas untuk Location jenis entitas seperti pemfilteran melalui GPE tag hanya seperti yang diuraikan:


    "parameters": 
    {
        "includeList" :
        [
            "GPE"
        ]
    }
    

Metode ini mengembalikan semua Location entitas yang hanya termasuk dalam GPE tag dan mengabaikan entitas lain yang termasuk dalam Location jenis yang ditandai dengan tag entitas lain seperti Structural atau Geological entitas yang ditandai Location . Kami juga dapat menelusuri lebih lanjut hasil kami dengan menggunakan excludeList parameter . GPEentitas yang ditandai dapat ditandai dengan tag berikut: City, , StateCountryRegion, Continent. Kita bisa, misalnya, mengecualikan Continent dan CountryRegion tag untuk contoh kita:


    "parameters": 
    {
        "includeList" :
        [
            "GPE"
        ],
        "excludeList": :
        [
            "Continent",
            "CountryRegion"
        ]
    }
    

Menggunakan parameter ini kita dapat berhasil memfilter hanya Location pada jenis entitas, karena GPE tag entitas yang disertakan dalam includeList parameter, termasuk dalam Location jenis . Kami kemudian hanya memfilter entitas Geopolitik dan mengecualikan entitas apa pun yang ditandai dengan Continent atau CountryRegion tag.

Menentukan model NER

Secara default, fitur ini menggunakan model AI terbaru yang tersedia pada teks Anda. Anda juga dapat mengonfigurasikan permintaan API untuk menggunakan versi model tertentu.

Batas layanan dan data

Untuk informasi tentang ukuran dan jumlah permintaan yang dapat Anda kirim per menit dan detik, lihat artikel batas layanan.

Langkah berikutnya

Ringkasan Pengenalan Entitas Karakter