Jenis entitas
Penting
LUIS akan dihentikan pada 1 Oktober 2025 dan mulai 1 April 2023 Anda tidak akan dapat membuat sumber daya LUIS baru. Sebaiknya migrasikan aplikasi LUIS Anda ke pemahaman bahasa percakapan untuk mendapatkan manfaat dari dukungan produk berkelanjutan dan kemampuan multibahasa.
Entitas adalah item atau elemen yang relevan dengan niat pengguna. Entitas mendefinisikan data yang dapat diekstrak dari ucapan dan penting untuk menyelesaikan tindakan yang diperlukan pengguna. Contohnya:
Ucapan | Prediksi niat | Entitas diekstrak | Penjelasan |
---|---|---|---|
Halo, bagaimana kabar Anda? | Pesan Pembuka | - | Tidak ada yang dapat diekstrak. |
Saya ingin memesan pizza kecil | orderPizza | 'kecil' | Entitas 'Ukuran' diekstrak sebagai 'kecil.' |
Matikan lampu kamar tidur | turnOff | 'kamar tidur' | Entitas "Kamar" diekstrak sebagai "kamar tidur". |
Cek saldo di rekening tabungan saya yang berakhiran 4406 | checkBalance | 'tabungan', '4406' | Entitas 'accountType' diekstrak sebagai entitas 'savings' dan 'accountNumber' diekstrak sebagai '4406.' |
Beli 3 tiket ke New York | buyTickets | '3', 'New York' | Entitas 'ticketsCount' diekstrak sebagai entitas '3' dan 'Tujuan' diekstraksi sebagai 'New York'. |
Entitas bersifat opsional tetapi disarankan. Anda tidak perlu membuat entitas untuk setiap konsep di aplikasi, hanya ketika:
- Aplikasi klien yang membutuhkan data, atau
- Entitas yang bertindak sebagai petunjuk atau sinyal ke entitas atau niat lain. Untuk mempelajari lebih lanjut tentang entitas sebagai Fitur, buka Entitas sebagai fitur.
Jenis entitas
Untuk membuat entitas, Anda harus memberi nama dan jenis. Ada beberapa jenis entitas dalam LUIS.
Entitas daftar
Entitas daftar mewakili kumpulan kata terkait yang tetap dan tertutup beserta sinonimnya. Anda dapat menggunakan entitas daftar untuk mengenali beberapa sinonim atau variasi dan mengekstrak output yang dinormalisasi untuk entitas. Gunakan opsi yang disarankan untuk melihat saran kata baru berdasarkan daftar saat ini.
Entitas daftar tidak dipelajari dengan mesin, artinya LUIS tidak menemukan nilai lainnya untuk entitas daftar. LUIS menandai kecocokan apa pun dengan item dalam daftar apa pun sebagai entitas dalam respons.
Pencocokan dalam entitas daftar bersifat peka terhadap huruf besar-kecil dan harus menjadi kecocokan yang tepat. Nilai yang dinormalisasi juga digunakan saat mencocokkan entitas daftar. Contohnya:
Nilai yang dinormalisasi | Sinonim |
---|---|
Bentuk dan | sm , , sml tiny ,smallest |
Medium | md , , mdm regular , , average ,middle |
Bentuk dan | lg , , lrg big |
Lihat artikel referensi entitas daftar untuk informasi selengkapnya.
Entitas regex
Entitas ekspresi reguler mengekstrak entitas berdasarkan pola ekspresi reguler yang Anda berikan. Regex mengabaikan huruf besar/kecil dan mengabaikan varian budaya. Entitas regex paling cocok untuk teks terstruktur atau urutan nilai alfanumerik yang telah ditentukan sebelumnya yang diharapkan dalam format tertentu. Contohnya:
Entity | Ekspresi reguler | Contoh |
---|---|---|
Nomor penerbangan | flight [A-Z]{2} [0-9]{4} |
flight AS 1234 |
Nomor Kartu Kredit | [0-9]{16} |
5478789865437632 |
Lihat artikel referensi entitas regex untuk informasi selengkapnya.
Entitas bawaan
LUIS menyertakan sekumpulan entitas bawaan untuk mengenali jenis informasi umum, seperti tanggal, waktu, angka, pengukuran, dan mata uang. Dukungan entitas bawaan bervariasi berdasarkan budaya aplikasi LUIS Anda. Untuk daftar lengkap entitas bawaan yang didukung LUIS, termasuk dukungan berdasarkan budaya, lihat referensi entitas bawaan.
Jika entitas bawaan disertakan dalam aplikasi Anda, prediksinya akan disertakan dalam aplikasi yang diterbitkan. Perilaku entitas bawaan sudah terlatih sebelumnya dan tidak dapat diubah.
Entitas bawaan | Contoh nilai |
---|---|
PersonName | James, Bill, Tom |
DatetimeV2 | 2019-05-02 , , May 2nd 8am on May 2nd 2019 |
Lihat artikel referensi entitas bawaan untuk informasi selengkapnya.
Entitas Pattern.Any
Entitas pattern.Any adalah tempat penampung dengan panjang variabel yang digunakan hanya dalam ucapan templat pola untuk menandai di mana entitas dimulai dan berakhir. Entitas mengikuti aturan atau pola tertentu dan paling baik digunakan untuk kalimat dengan struktur leksikal tetap. Contohnya:
Contoh ucapan | Pola | Entity |
---|---|---|
Dapatkah saya memesan burger? | Can I have a {meal} [please][?] |
burger |
Dapatkah saya memesan pizza? | Can I have a {meal} [please][?] |
pizza |
Di mana saya dapat menemukan The Great Gatsby? | Where can I find {bookName}? |
The Great Gatsby |
Lihat artikel referensi entitas Pattern.Any untuk informasi selengkapnya.
Entitas Azure Machine Learning (ML)
Entitas yang dipelajari mesin menggunakan konteks untuk mengekstrak entitas berdasarkan contoh berlabel. Contoh berlabel ini adalah entitas pilihan untuk membangun aplikasi LUIS. Contoh berlabel ini bergantung pada algoritma pembelajaran mesin dan membutuhkan pelabelan agar berhasil disesuaikan dengan aplikasi Anda. Gunakan entitas ML untuk mengidentifikasi data yang tidak selalu diformat dengan baik tetapi memiliki arti yang sama.
Contoh ucapan | Entitas produk yang diekstrak |
---|---|
Saya ingin membeli buku. | 'buku' |
Dapatkah saya membeli sepatu ini? | 'sepatu' |
Tambahkan celana pendek ini ke keranjang saya. | 'celana pendek' |
Lihat Entitas yang dipelajari mesin untuk mengetahui informasi selengkapnya.
Entitas Azure Machine Learning dengan Struktur
Entitas Azure Machine Learning dapat terdiri dari subentitas yang lebih kecil, yang masing-masing dapat memiliki propertinya sendiri. Misalnya, entitas Alamat dapat memiliki struktur berikut:
- Alamat: 4567 Main Street, NY, 98052, USA
- Nomor Bangunan: 4567
- Nama Jalan: Main Street
- Negara: NY
- Kode Pos: 98052
- Negara: AS
Membangun entitas Azure Machine Learning yang efektif
Untuk membangun entitas pembelajaran mesin secara efektif, ikuti praktik terbaik berikut:
- Jika Anda memiliki entitas pembelajaran mesin dengan subentitas, pastikan bahwa urutan dan varian yang berbeda dari entitas dan subentitas disajikan dalam ucapan berlabel. Contoh ucapan yang diberi label harus mencakup semua bentuk yang valid, dan mencakup entitas yang muncul dan tidak ada serta disusun ulang dalam ucapan.
- Hindari overfitting terhadap entitas ke set tetap. Overfitting terjadi ketika model tidak digeneralisasi dengan baik, dan merupakan masalah umum dalam model pembelajaran mesin. Hal ini berarti bahwa aplikasi tidak akan bekerja pada jenis contoh baru secara memadai. Sebagai gantinya, Anda harus memvariasikan contoh ucapan berlabel sehingga aplikasi dapat menggeneralisasi di luar contoh terbatas yang diberikan.
- Pelabelan Anda harus konsisten di seluruh niat. Ini termasuk ucapan genap yang Anda berikan dalam niat Tidak ada yang menyertakan entitas ini. Jika tidak, model tersebut tidak dapat menentukan urutan secara efektif.
Entitas sebagai fitur
Fungsi penting lainnya dari entitas adalah menggunakannya sebagai fitur atau ciri pembeda untuk niat atau entitas lain sehingga sistem Anda mengamati dan mempelajarinya.
Entitas sebagai fitur untuk niat
Anda dapat menggunakan entitas sebagai sinyal untuk niat. Misalnya, kehadiran entitas tertentu dalam ucapan dapat membedakan niat mana yang termasuk di dalamnya.
Contoh ucapan | Entity | Niat |
---|---|---|
Pesankan saya penerbangan ke New York. | Kota | Memesan Penerbangan |
Pesankan saya ruang konferensi utama. | Ruang | Ruangan yang dipesan |
Entitas sebagai Fitur untuk entitas
Anda juga dapat menggunakan entitas sebagai indikator keberadaan entitas lain. Contoh umum dari hal ini adalah menggunakan entitas bawaan sebagai fitur untuk entitas Azure Machine Learning lain. Jika sedang membuat sistem pemesanan penerbangan dan ungkapan Anda terlihat seperti "Pesankan saya penerbangan dari Kairo ke Seattle", Anda akan memiliki Kota Asal dan Kota Tujuan sebagai entitas ML. Praktik yang baik adalah menggunakan entitas GeographyV2 bawaan sebagai fitur untuk kedua entitas.
Untuk informasi selengkapnya lihat artikel referensi entitas GeographyV2.
Anda juga dapat menggunakan entitas sebagai fitur yang diperlukan untuk entitas lain. Hal ini membantu dalam resolusi dari entitas yang diekstrak. Misalnya,jika Anda membuat aplikasi pemesanan piza dan Anda memiliki entitas ML Ukuran, Anda dapat membuat entitas daftar SizeList dan menggunakan entitas tersebut sebagai fitur yang diperlukan untuk entitas Ukuran. Aplikasi Anda akan menampilkan nilai yang dinormalisasi sebagai entitas yang diekstrak dari ucapan.
Lihat fitur untuk informasi selengkapnya, dan entitas bawaan untuk mempelajari selengkapnya tentang resolusi entitas bawaan yang tersedia di budaya Anda.
Data dari entitas
Sebagian besar aplikasi dan chatbot membutuhkan lebih dari nama niat. Data opsional tambahan ini berasal dari entitas yang ditemukan dalam ungkapan. Setiap jenis entitas menampilkan informasi yang berbeda tentang kecocokan.
Satu kata atau frasa dalam ungkapan bisa cocok dengan lebih dari satu entitas. Dalam hal ini, setiap entitas yang cocok akan ditampilkan dengan skornya.
Semua entitas ditampilkan dalam array entitas respons dari titik akhir
Praktik terbaik untuk entitas
Menggunakan entitas pembelajaran mesin
Entitas yang dipelajari mesin disesuaikan dengan aplikasi Anda dan memerlukan pelabelan agar berhasil. Jika tidak menggunakan entitas yang dipelajari mesin, Anda mungkin menggunakan entitas yang salah.
Entitas yang dipelajari mesin dapat menggunakan entitas lain sebagai fitur. Entitas lain tersebut dapat berupa entitas kustom seperti entitas ekspresi reguler atau entitas daftar, atau Anda dapat menggunakan entitas bawaan sebagai fitur.
Pelajari tentang entitas yang dipelajari mesin efektif.