Bagikan melalui


Komponen entitas

Dalam pemahaman bahasa percakapan, entitas adalah bagian informasi yang relevan yang diekstraksi dari ucapan Anda. Entitas dapat diekstraksi dengan metode yang berbeda. Entitas itu dapat dipelajari melalui konteks, dicocokkan dari daftar, atau terdeteksi oleh entitas yang diakui sebelumnya. Setiap entitas dalam proyek Anda terdiri dari satu metode ini atau lebih, yang didefinisikan sebagai komponen entitas Anda.

Ketika entitas didefinisikan oleh lebih dari satu komponen, prediksinya dapat tumpang tindih. Anda dapat menentukan perilaku prediksi entitas saat komponennya tumpang tindih dengan menggunakan serangkaian opsi tetap dalam opsi entitas.

Jenis komponen

Komponen entitas menentukan cara Anda dapat mengekstrak entitas. Entitas dapat berisi satu komponen, yang menentukan satu-satunya metode yang akan digunakan untuk mengekstrak entitas. Entitas juga dapat berisi beberapa komponen untuk memperluas cara entitas ditentukan dan diekstrak.

Komponen yang dipelajari

Komponen yang dipelajari menggunakan tag entitas yang Anda beri label ucapan Anda untuk melatih model yang dipelajari mesin. Model belajar memprediksi dari mana asal entitas di konteks di dalam ucapan. Label Anda memberikan contoh di mana entitas diharapkan ada dalam ucapan, berdasarkan arti kata-kata di sekitarnya dan sebagai kata-kata yang diberi label.

Komponen ini hanya didefinisikan jika Anda menambahkan label dengan memberikan tag pada ucapan berdasarkan entitasnya. Jika Anda tidak menandai ucapan apa pun dengan entitas, itu tidak memiliki komponen yang dipelajari.

Cuplikan layar yang memperlihatkan contoh komponen yang dipelajari untuk entitas.

Komponen daftar

Komponen daftar mewakili kumpulan kata-kata terkait yang tetap dan tertutup beserta sinonimnya. Komponen melakukan pencocokan teks yang tepat terhadap daftar nilai yang Anda berikan sebagai sinonim. Setiap sinonim milik kunci daftar, yang dapat digunakan sebagai nilai standar yang dinormalisasi untuk sinonim yang kembali dalam output jika komponen daftar cocok. Kunci daftar tidak digunakan untuk pencocokan.

Dalam proyek multibahasa, Anda dapat menentukan serangkaian sinonim yang berbeda untuk setiap bahasa. Saat menggunakan API prediksi, Anda dapat menentukan bahasa dalam permintaan input, yang hanya cocok dengan sinonim yang terkait dengan bahasa tersebut.

Cuplikan layar yang memperlihatkan contoh komponen daftar untuk entitas.

Komponen bawaan

Komponen bawaan memungkinkan Anda untuk memilih dari perpustakaan jenis umum seperti angka, tanggalwaktu, dan nama. Ketika ditambahkan, komponen bawaan secara otomatis terdeteksi. Anda dapat memiliki hingga lima komponen bawaan per entitas. Untuk informasi selengkapnya, lihat daftar komponen bawaan yang didukung.

Cuplikan layar yang memperlihatkan contoh komponen bawaan untuk entitas.

Komponen regex

Komponen regex cocok dengan ekspresi reguler untuk menangkap pola yang konsisten. Saat ditambahkan, teks apa pun yang cocok dengan ekspresi reguler diekstrak. Anda dapat memiliki beberapa ekspresi reguler dalam entitas yang sama, masing-masing dengan pengidentifikasi kunci yang berbeda. Ekspresi yang cocok mengembalikan kunci sebagai bagian dari respons prediksi.

Dalam proyek multibahasa, Anda dapat menentukan ekspresi yang berbeda untuk setiap bahasa. Saat menggunakan API prediksi, Anda dapat menentukan bahasa dalam permintaan input, yang hanya cocok dengan ekspresi reguler yang terkait dengan bahasa tersebut.

Cuplikan layar yang memperlihatkan contoh komponen regex untuk entitas.

Opsi entitas

Ketika beberapa komponen ditentukan untuk suatu entitas, prediksi mereka mungkin tumpang tindih. Saat tumpang tindih terjadi, prediksi akhir masing-masing entitas ditentukan oleh salah satu opsi berikut.

Menggabungkan komponen

Gabungkan komponen sebagai satu entitas saat tumpang tindih dengan mengambil gabungan semua komponen.

Gunakan opsi ini untuk menggabungkan semua komponen saat tumpang tindih. Ketika komponen digabungkan, Anda mendapatkan semua informasi tambahan yang terkait dengan daftar atau komponen bawaan saat ada.

Contoh

Misalkan Anda memiliki entitas yang disebut Perangkat Lunak yang memiliki komponen daftar, yang berisi "OS Proseware" sebagai entri. Dalam data ucapan Anda, Anda memiliki "Saya ingin membeli Proseware OS 9" dengan "Proseware OS 9" ditandai sebagai Perangkat Lunak:

Cuplikan layar yang memperlihatkan entitas yang dipelajari dan daftar tumpang tindih.

Dengan menggunakan komponen gabungan, entitas mengembalikan dengan konteks lengkap sebagai "Proseware OS 9" bersama dengan kunci dari komponen daftar:

Cuplikan layar yang memperlihatkan hasil komponen gabungan.

Misalkan Anda memiliki ucapan yang sama, tetapi hanya "OS 9" yang diprediksi oleh komponen yang dipelajari:

Cuplikan layar yang memperlihatkan ucapan dengan O S 9 yang diprediksi oleh komponen yang dipelajari.

Dengan komponen gabungan, entitas masih menampilkan sebagai "Proseware OS 9" dengan kunci dari komponen daftar:

Cuplikan layar yang memperlihatkan entitas Perangkat Lunak yang dikembalikan.

Jangan gabungkan komponen

Setiap komponen yang tumpang tindih ditampilkan sebagai instans terpisah dari entitas. Terapkan logika Anda sendiri setelah prediksi dengan opsi ini.

Contoh

Misalkan Anda memiliki entitas yang disebut Perangkat Lunak yang memiliki komponen daftar, yang berisi "Proseware Desktop" sebagai entri. Dalam data ucapan Anda, Anda memiliki "Saya ingin membeli Proseware Desktop Pro" dengan "Proseware Desktop Pro" ditandai sebagai Perangkat Lunak:

Cuplikan layar yang memperlihatkan contoh entitas yang dipelajari dan daftar tumpang tindih.

Saat Anda tidak menggabungkan komponen, entitas mengembalikan dua kali:

Cuplikan layar yang menunjukkan entitas yang dikembalikan dua kali.

Komponen yang Diperlukan

Terkadang entitas dapat didefinisikan oleh beberapa komponen tetapi memerlukan satu atau beberapa dari mereka untuk hadir. Setiap komponen dapat diatur sesuai kebutuhan, yang berarti entitas tidak akan dikembalikan jika komponen tersebut tidak ada. Misalnya, jika Anda memiliki entitas dengan komponen daftar dan komponen yang dipelajari yang diperlukan, dijamin bahwa entitas yang dikembalikan menyertakan komponen yang dipelajari. Jika tidak, entitas tidak dikembalikan.

Komponen yang diperlukan paling sering digunakan dengan komponen yang dipelajari karena dapat membatasi jenis komponen lain ke konteks tertentu, yang umumnya terkait dengan peran. Anda juga dapat mengharuskan semua komponen untuk memastikan bahwa setiap komponen ada untuk entitas.

Di Language Studio, setiap komponen dalam entitas memiliki tombol di sampingnya yang memungkinkan Anda mengaturnya sesuai kebutuhan.

Contoh

Misalkan Anda memiliki entitas yang disebut Kuantitas Tiket yang mencoba mengekstrak jumlah tiket yang ingin Anda pesan untuk penerbangan, untuk ucapan seperti "Pesan dua tiket besok ke Kairo."

Biasanya, Anda menambahkan komponen bawaan untuk Quantity.Number yang sudah mengekstrak semua angka. Jika entitas Anda hanya didefinisikan dengan komponen bawaan, entitas tersebut juga mengekstrak nomor lain sebagai bagian dari entitas Kuantitas Tiket, seperti "Pesan dua tiket besok ke Kairo pukul 15.00 ."

Untuk mengatasi skenario ini, Anda memberi label komponen yang dipelajari dalam data pelatihan Anda untuk semua angka yang dimaksudkan sebagai Kuantitas Tiket. Entitas sekarang memiliki dua komponen: komponen bawaan yang mengetahui semua angka, dan yang dipelajari yang memprediksi di mana kuantitas tiket berada dalam kalimat. Jika Anda memerlukan komponen yang dipelajari, Anda memastikan bahwa Kuantitas Tiket hanya kembali saat komponen yang dipelajari memprediksinya dalam konteks yang tepat. Jika Anda juga memerlukan komponen bawaan, Anda kemudian dapat menjamin bahwa entitas Kuantitas Tiket yang dikembalikan adalah angka dan dalam posisi yang benar.

Menggunakan komponen dan opsi

Komponen memberi Anda fleksibilitas untuk menentukan entitas Anda dengan lebih dari satu cara. Saat menggabungkan komponen, Anda memastikan bahwa setiap komponen diwakili dan Anda mengurangi jumlah entitas yang dikembalikan dalam prediksi Anda.

Praktik umumnya adalah memperluas komponen bawaan dengan daftar nilai yang mungkin tidak didukung oleh bawaan. Misalnya, jika Anda memiliki entitas Organisasi , yang memiliki General.Organization komponen bawaan yang ditambahkan ke entitas tersebut, entitas mungkin tidak memprediksi semua organisasi khusus untuk domain Anda. Anda dapat menggunakan komponen daftar untuk memperluas nilai entitas Organisasi dan memperluas komponen bawaan dengan organisasi Anda sendiri.

Di lain waktu, Anda mungkin tertarik untuk mengekstrak entitas melalui konteks, seperti Produk dalam proyek ritel. Anda memberi label komponen produk yang dipelajari untuk mempelajari di mana produk didasarkan pada posisinya dalam kalimat. Anda mungkin juga memiliki daftar produk yang sudah Anda ketahui sebelumnya bahwa Anda ingin selalu mengekstrak. Menggabungkan kedua komponen dalam satu entitas memungkinkan Anda untuk mendapatkan kedua opsi untuk entitas.

Saat Anda tidak menggabungkan komponen, Anda mengizinkan setiap komponen untuk bertindak sebagai ekstraktor entitas independen. Salah satu cara menggunakan opsi ini adalah dengan memisahkan entitas yang diekstrak dari daftar ke yang diekstrak melalui komponen yang dipelajari atau dibangun sebelumnya untuk menangani dan memperlakukannya secara berbeda.

Catatan

Sebelumnya selama pratinjau publik layanan, ada empat opsi yang tersedia: Tumpang tindih terpanjang, Tumpang tindih persis, Union tumpang tindih, dan Kembalikan semua secara terpisah. Tumpang tindih terpanjang dan Tumpang tindih persis tidak digunakan lagi dan hanya didukung untuk proyek yang sebelumnya memiliki opsi tersebut yang dipilih. Tumpang tindih gabungan telah diganti namanya menjadi Komponen gabungan, sementara Kembalikan semua secara terpisah telah diganti namanya menjadi Jangan gabungkan komponen.