Bahasa komputer memahami glosarium kosakata dan konsep umum

Artikel
04/25/2024

Penting

LUIS akan dihentikan pada 1 Oktober 2025 dan mulai 1 April 2023 Anda tidak akan dapat membuat sumber daya LUIS baru. Sebaiknya migrasikan aplikasi LUIS Anda ke pemahaman bahasa percakapan untuk mendapatkan manfaat dari dukungan produk berkelanjutan dan kemampuan multibahasa.

Glosarium Pemahaman Bahasa (LUIS) menjelaskan istilah yang mungkin Anda temui saat Anda bekerja dengan layanan LUIS.

Versi aktif

Versi aktif adalah versi aplikasi yang diperbarui saat Anda membuat perubahan pada model menggunakan portal LUIS. Di portal LUIS, jika Anda ingin membuat perubahan pada versi yang bukan versi aktif, Anda harus terlebih dahulu mengatur versi tersebut sebagai aktif.

Pembelajaran aktif

Pembelajaran aktif adalah teknik pembelajaran mesin tempat model pembelajaran mesin digunakan untuk mengidentifikasi contoh baru yang informatif untuk dilabeli. Dalam LUIS, pembelajaran aktif mengacu pada menambahkan ungkapan dari lalu lintas titik akhir yang prediksinya saat ini tidak jelas untuk meningkatkan model Anda. Pilih "tinjau ucapan titik akhir", untuk melihat ungkapan untuk diberi label.

Lihat juga:

Informasi konseptual
Tutorial meninjau ungkapan titik akhir
Cara meningkatkan aplikasi LUIS dengan meninjau ungkapan titik akhir

Aplikasi (Aplikasi)

Di LUIS, aplikasi, atau aplikasi Anda, adalah kumpulan model yang dipelajari mesin, dibangun pada himpunan data yang sama, yang bekerja sama untuk memprediksi niat dan entitas untuk skenario tertentu. Setiap aplikasi memiliki titik akhir prediksi terpisah.

Jika Anda membangun bot SDM, Anda mungkin memiliki serangkaian niat, seperti "Jadwalkan waktu cuti", "menanyakan tentang manfaat" dan "memperbarui informasi pribadi" dan entitas untuk masing-masing tujuan yang Anda kelompokkan ke dalam satu aplikasi.

Penulisan

Penulisan adalah kemampuan untuk membuat, mengelola, dan menerapkan aplikasi LUIS, baik menggunakan portal LUIS atau API penulis.

Kunci Penulisan

Kunci penulisan digunakan untuk menulis aplikasi. Tidak digunakan untuk kueri titik akhir tingkat produksi. Untuk informasi selengkapnya, lihat batas sumber daya.

Sumber Daya Penulisan

Sumber daya penulisan LUIS Anda adalah item yang dapat dikelola yang tersedia melalui Azure. Sumber daya adalah akses Anda ke kemampuan penulisan, pelatihan, dan penerbitan terkait dari layanan Azure. Sumber daya mencakup informasi autentikasi, otorisasi, dan keamanan yang Anda perlukan untuk mengakses layanan Azure terkait.

Sumber daya penulisan memiliki "jenis" LUIS-Authoring Azure.

Tes batch

Pengujian batch adalah kemampuan untuk memvalidasi model aplikasi LUIS saat ini dengan serangkaian uji ungkapan pengguna yang konsisten dan dikenal. Tes batch didefinisikan dalam file berformat JSON.

Lihat juga:

Konsep
Cara menjalankan tes batch
Tutorial - membuat dan menjalankan tes batch

F-ukuran

Dalam pengujian batch, ukuran akurasi tes.

Negatif palsu (FN)

Dalam pengujian batch, poin data mewakili ungkapan tempat aplikasi Anda salah memprediksi tidak adanya target niat/entitas.

Positif palsu (FP)

Dalam pengujian batch, poin data mewakili ungkapan tempat aplikasi Anda salah memprediksi keberadaan target niat/entitas.

Presisi

Dalam pengujian batch, presisi (juga disebut nilai prediktif positif) adalah sebagian kecil dari ungkapan yang relevan di antara ucapan yang diambil.

Contoh untuk tes batch hewan adalah jumlah domba yang diprediksi dibagi dengan jumlah total hewan (domba dan non-domba).

Tarik Kembali

Dalam pengujian batch, pengenalan (juga dikenal sebagai sensitivitas), adalah kemampuan LUIS untuk generalisasi.

Contoh untuk uji batch hewan adalah jumlah domba yang diprediksi dibagi dengan jumlah domba yang tersedia.

Negatif sejati (TN)

Negatif sejati adalah ketika aplikasi Anda memprediksi tidak ada kecocokan dengan benar. Dalam pengujian batch, negatif sejati terjadi saat aplikasi Anda memprediksi niat atau entitas untuk contoh yang belum diberi label dengan niat atau entitas tersebut.

Benar positif (TP)

Benar positif (TP) Benar positif adalah ketika aplikasi Anda memprediksi kecocokan dengan benar. Dalam pengujian batch, benar positif terjadi saat aplikasi Anda memprediksi niat atau entitas untuk contoh yang telah diberi label dengan niat atau entitas tersebut.

Penggolong

Pengklasifikasi adalah model pembelajaran mesin yang memprediksi kategori atau kelas apa yang cocok dengan input.

Niat adalah contoh pengklasifikasi.

Rekan kerja

Rekan kerja secara konseptual sama dengan kontributor. Rekan kerja diberikan akses saat pemilik menambahkan alamat email rekan kerja ke aplikasi yang tidak dikontrol dengan kontrol akses berbasis peran Azure (Azure RBAC). Jika Masih menggunakan rekan kerja, Anda harus memigrasikan akun LUIS, dan menggunakan sumber daya penulisan LUIS untuk mengelola kontributor dengan Azure RBAC.

Kontributor

Kontributor bukan pemilik aplikasi, tetapi memiliki izin yang sama untuk menambahkan, mengedit, dan menghapus niat, entitas, ucapan. Kontributor menyediakan kontrol akses berbasis peran Azure (Azure RBAC) ke aplikasi LUIS.

Lihat juga:

Cara menambahkan kontributor

Deskriptor

Deskriptor adalah istilah yang sebelumnya digunakan untuk fitur pembelajaran mesin.

Domain

Dalam konteks LUIS, domain adalah area pengetahuan. Domain Anda khusus untuk skenario Anda. Domain yang berbeda menggunakan bahasa komputer dan terminologi tertentu yang memiliki makna dalam konteks domain. Misalnya, jika Anda membangun aplikasi untuk memutar musik, aplikasi Anda akan memiliki istilah dan bahasa komputer khusus untuk musik - kata-kata seperti "lagu, trek, album, lirik, b-side, artis". Untuk contoh domain, lihat domain bawaan.

Titik akhir

Penulisan titik akhir

URL titik akhir penulisan LUIS adalah tempat Anda menulis, melatih, dan menerbitkan aplikasi Anda. URL titik akhir berisi wilayah atau subdomain kustom aplikasi yang diterbitkan serta ID aplikasi.

Pelajari selengkapnya tentang penulisan aplikasi Anda secara terprogram dari referensi Developer

Titik akhir prediksi

URL titik akhir prediksi LUIS adalah tempat Anda mengirimkan kueri LUIS setelah aplikasi LUIS ditulis dan diterbitkan. URL titik akhir berisi wilayah atau subdomain kustom aplikasi yang diterbitkan serta ID aplikasi. Anda dapat menemukan titik akhir di halaman sumber daya Azure aplikasi Anda, atau Anda bisa mendapatkan URL titik akhir dari GET App Info API.

Akses Anda ke titik akhir prediksi diotorisasi dengan kunci prediksi LUIS.

Entity

Entitas adalah kata-kata dalam ungkapan yang menjelaskan informasi yang digunakan untuk memenuhi atau mengidentifikasi niat. Jika entitas Anda rumit dan Anda ingin model mengidentifikasi bagian tertentu, Anda dapat memutus model Anda menjadi subentitas. Misalnya, Anda mungkin ingin model Anda memprediksi alamat, tetapi juga subentitas jalan, kota, negara bagian, dan kode pos. Entitas juga dapat digunakan sebagai fitur untuk model. Respons Anda dari aplikasi LUIS mencakup niat yang diprediksi dan semua entitas.

Ekstraktor entitas

Ekstraktor entitas kadang-kadang hanya dikenal sebagai ekstraktor adalah jenis model yang dipelajari mesin yang digunakan LUIS untuk memprediksi entitas.

Skema entitas

Skema entitas adalah struktur yang Anda tentukan untuk entitas yang dipelajari mesin dengan subentitas. Titik akhir prediksi mengembalikan semua entitas dan subentitas yang diekstrak yang ditentukan dalam skema.

Subentitas entitas

Subentitas adalah entitas anak dari entitas pembelajaran mesin.

Entitas pembelajaran non-mesin

Entitas yang menggunakan pencocokan teks untuk mengekstrak data:

Entitas daftar
Entitas ekspresi reguler

Entitas daftar

Entitas daftar mewakili sekumpulan kata terkait yang tetap dan tertutup bersama dengan sinonimnya. Entitas daftar sangat cocok, tidak seperti entitas yang dipelajari mesin.

Entitas akan diprediksi jika kata dalam entitas daftar disertakan dalam daftar. Misalnya, jika Anda memiliki entitas daftar yang disebut "ukuran" dan Anda memiliki kata -kata "kecil, sedang, besar" dalam daftar, maka entitas ukuran akan diprediksi untuk semua ucapan di mana kata "kecil," "sedang," atau "besar" digunakan terlepas dari konteksnya.

Ekspresi reguler

Entitas ekspresi reguler mewakili ekspresi reguler. Entitas ekspresi reguler sama persis, tidak seperti entitas yang dipelajari dengan mesin.

Entitas bawaan

Lihat Entri model bawaan untuk entitas bawaan.

Fitur

Dalam pembelajaran mesin, fitur adalah karakteristik yang membantu model mengenali konsep tertentu. Ini adalah petunjuk yang dapat digunakan LUIS, tetapi bukan aturan yang sulit.

Istilah ini juga disebut sebagai fitur pembelajaran mesin.

Petunjuk ini digunakan dengan label untuk mempelajari cara memprediksi data baru. LUIS mendukung daftar frasa dan menggunakan model lain sebagai fitur.

Fitur yang diperlukan

Fitur yang diperlukan adalah cara untuk membatasi output model LUIS. Ketika fitur untuk entitas ditandai sebagaimana diperlukan, fitur harus ada dalam contoh agar entitas dapat diprediksi, terlepas dari apa yang diprediksi model yang dipelajari mesin.

Pertimbangkan contoh ketika Anda memiliki fitur angka-prabuilt yang telah Anda tandai sebagaimana diperlukan pada entitas kuantitas untuk bot pemesanan menu. Ketika bot Anda melihatI want a bajillion large pizzas?, bajillion tidak akan diprediksi sebagai kuantitas terlepas dari konteks di mana ia muncul. Bajillion bukan angka yang valid dan tidak akan diprediksi oleh entitas bawaan angka.

Niat

Niat mewakili tugas atau tindakan yang ingin dilakukan pengguna. Ini adalah maksud atau tujuan yang dinyatakan dalam input pengguna, seperti memesan penerbangan, atau membayar tagihan. Di LUIS, ucapan secara keseluruhan diklasifikasikan sebagai niat, tetapi bagian dari ucapan diekstraksi sebagai entitas.

Contoh pelabelan

Pelabelan, atau penandaan, adalah proses mengaitkan contoh positif atau negatif dengan model.

Pelabelan untuk niat

Di LUIS, niat dalam aplikasi saling eksklusif. Ini berarti ketika Anda menambahkan ucapan ke niat, itu dianggap sebagai contoh positif untuk maksud itu dan contoh negatif untuk semua niat lainnya. Contoh negatif tidak boleh dikacaukan dengan niat "Tidak Ada", yang mewakili ucapan yang berada di luar cakupan aplikasi.

Pelabelan untuk entitas

Di LUIS, Andamemberi labelkata atau frasa dalam contoh ucapan niat dengan entitas sebagai contohpositif. Pelabelan menunjukkan niat apa yang harus diprediksi untuk ucapan itu. Ucapan berlabel digunakan untuk melatih niat tersebut.

Aplikasi LUIS

Lihat definisi untuk aplikasi (aplikasi).

Model

Model (machine learned) adalah fungsi yang membuat prediksi pada data input. Di LUIS, kami menyebut pengklasifikasi niat dan ekstraktor entitas secara murah sebagai "model", dan kami merujuk pada koleksi model yang dilatih, diterbitkan, dan dikueri bersama sebagai "aplikasi".

Nilai yang dinormalisasi

Anda menambahkan nilai ke entitas daftarAnda. Masing-masing nilai tersebut dapat memiliki daftar satu atau beberapa sinonim. Hanya nilai yang dinormalkan yang dikembalikan dalam respons.

Overfitting

Overfitting terjadi ketika model diperbaiki pada contoh tertentu dan tidak dapat menggeneralisasi dengan baik.

Pemilik

Setiap aplikasi memiliki satu pemilik yang merupakan orang yang membuat aplikasi. Pemilik mengelola izin ke aplikasi di portal Microsoft Azure.

Daftar frasa

Daftar frasa adalah jenis fitur pembelajaran mesin tertentu yang menyertakan sekelompok nilai (kata atau frasa) yang termasuk dalam kelas yang sama dan harus diperlakukan serupa (misalnya, nama kota atau produk).

Model bawaan

Model bawaan adalah niat, entitas, atau koleksi keduanya, bersama dengan contoh berlabel. Model bawaan umum ini dapat ditambahkan ke aplikasi Anda untuk mengurangi pekerjaan pengembangan model yang diperlukan untuk aplikasi Anda.

Domain bawaan

Domain bawaan adalah aplikasi LUIS yang dikonfigurasi untuk domain tertentu seperti otomatisasi rumah (HomeAutomation) atau reservasi restoran (RestaurantReservation). Niat, ucapan, dan entitas dikonfigurasikan untuk domain ini.

Entitas bawaan

Entitas bawaan adalah entitas yang disediakan LUIS untuk jenis informasi umum seperti nomor, URL, dan email. Ini dibuat berdasarkan data publik. Anda dapat memilih untuk menambahkan entitas bawaan sebagai entitas yang berdiri sendiri, atau sebagai fitur ke entitas.

Niat bawaan

Tujuan bawaan adalah niat LUIS menyediakan jenis informasi umum dan datang dengan contoh label mereka sendiri yang dilabeli.

Prediksi

Prediksi adalah permintaan REST untuk layanan prediksi Azure LUIS yang mengambil data baru (ujaran pengguna), dan menerapkan aplikasi terlatih dan diterbitkan ke data tersebut untuk menentukan niat dan entitas apa yang ditemukan.

Kunci prediksi

Kunci prediksi adalah kunci yang terkait dengan layanan LUIS yang Anda buat di Azure yang mengotorisasi penggunaan titik akhir prediksi Anda.

Kunci ini bukan kunci penulisan. Jika Anda memiliki kunci titik akhir prediksi, itu harus digunakan untuk setiap permintaan titik akhir alih-alih kunci penulisan. Anda dapat melihat kunci prediksi Anda saat ini di dalam URL titik akhir di bagian bawah halaman sumber daya Azure di situs web LUIS. Ini adalah nilai dari pasangan nama/nilai kunci langganan.

Sumber daya prediksi

Sumber daya prediksi LUIS Anda adalah item yang dapat dikelola yang tersedia melalui Azure. Sumber daya adalah akses Anda ke prediksi terkait layanan Azure. Sumber daya termasuk prediksi.

Sumber daya prediksi memiliki "jenis" AzureLUIS.

Skor prediksi

Skoradalah angka dari 0 dan 1 yang merupakan ukuran seberapa yakin sistem adalah bahwa ucapan input tertentu cocok dengan niat tertentu. Skor yang lebih dekat ke 1 berarti sistem sangat yakin tentang outputnya dan skor yang lebih dekat ke 0 berarti sistem yakin bahwa input tidak cocok dengan output tertentu. Skor di tengah berarti sistem sangat tidak yakin tentang bagaimana membuat keputusan.

Misalnya, ambil model yang digunakan untuk mengidentifikasi apakah beberapa teks pelanggan menyertakan pesanan makanan. Ini mungkin memberikan skor 1 untuk "Saya ingin memesan satu kopi" (sistem sangat yakin bahwa ini adalah pesanan) dan skor 0 untuk "tim saya memenangkan pertandingan tadi malam" (sistem sangat yakin bahwa ini BUKAN pesanan). Dan itu mungkin memiliki skor 0,5 untuk "mari kita minum teh" (tidak yakin apakah ini adalah pesanan atau tidak).

Kunci terprogram

Berganti nama menjadi kunci penulisan.

Terbitkan

Penerbitan berarti membuat versi aktif LUIS tersedia di pementasan atau titik akhir produksi.

Kuota

Kuota LUIS adalah batasan tingkat langganan Azure. Kuota LUIS dapat dibatasi oleh kedua permintaan per detik (Status HTTP 429) dan total permintaan dalam sebulan (Status HTTP 403).

Skema

Skema Anda mencakup niat dan entitas Anda bersama dengan subentitas. Skema ini awalnya direncanakan untuk kemudian di-iterasi dari waktu ke waktu. Skema ini tidak menyertakan pengaturan aplikasi, fitur, atau contoh ungkapan.

Analisis Sentimen

Analisis sentimen memberikan nilai positif atau negatif dari ucapan yang diberikan oleh layanan Bahasa.

Penyiapan ucapan

Penyiapan ucapan meningkatkan pengakuan kata dan frasa lisan yang umumnya digunakan dalam skenario Anda dengan Layanan Ucapan. Untuk aplikasi yang diaktifkan penyiapan ucapan, semua contoh berlabel LUIS digunakan untuk meningkatkan akurasi pengenalan ucapan dengan membuat model ucapan yang disesuaikan untuk aplikasi khusus ini. Misalnya, dalam permainan catur Anda ingin memastikan bahwa ketika pengguna mengatakan "Move knight", itu tidak ditafsirkan sebagai "Pindahkan malam". Aplikasi LUIS harus menyertakan contoh tempat "ksatria" dilabeli sebagai entitas.

Kunci pemula

Kunci gratis untuk digunakan saat pertama kali memulai menggunakan LUIS.

Sinonim

Dalam entitas daftarLUIS, Anda dapat membuat nilai yang dinormalisasi, yang masing-masing dapat memiliki daftar sinonim. Misalnya, jika Anda membuat entitas ukuran yang memiliki nilai normal kecil, sedang, besar, dan ekstra besar. Anda dapat membuat sinonim untuk setiap nilai seperti ini:

Nilai berukuran besar	Sinonim
Bentuk dan	si kecil, 8 ons
Medium	reguler, 12 ons
Bentuk dan	besar, 16 ons
Ekstra besar	yang terbesar, 24 ons

Model mengembalikan nilai yang dinormalisasi untuk entitas ketika salah satu sinonim terlihat dalam input.

Uji

Menguji aplikasi LUIS berarti menampilkan prediksi model.

Timezone offset

Titik akhir termasuk timezoneOffset. Ini adalah angka dalam menit yang ingin Anda tambahkan atau hapus dari entitas bawaan datetimeV2. Misalnya, jika ucapan adalah "jam berapa sekarang?", datetimeV2 yang dikembalikan adalah waktu saat ini untuk permintaan klien. Jika permintaan klien Anda berasal dari bot atau aplikasi lain yang tidak sama dengan pengguna bot Anda, Anda harus meneruskan offset antara bot dan pengguna.

Lihat Mengubah zona waktu entitas datetimeV2 bawaan.

Token

Tokenadalah unit teks terkecil yang dapat dikenali LUIS. Ini sedikit berbeda di seluruh bahasa komputer.

Untuk Bahasa Inggris, token adalah rentang berkelanjutan (tanpa spasi atau tanda baca) huruf dan angka. Spasi BUKAN token.

Frasa	Jumlah token	Penjelasan
`Dog`	1	Satu kata tanpa tanda baca atau spasi.
`RMT33W`	1	Nomor pencari rekaman. Ini mungkin memiliki angka dan huruf, tetapi tidak memiliki tanda baca.
`425-555-5555`	5	Nomor telepon. Setiap tanda baca adalah token tunggal sehingga `425-555-5555` akan menjadi 5 token: `425` `-` `555` `-` `5555`
`https://luis.ai`	7	`https` `:` `/` `/` `luis` `.` `ai`

Berlatih

Pelatihan adalah proses mengajar LUIS tentang perubahan apa pun pada versi aktif sejak pelatihan terakhir.

Data pelatihan

Data pelatihan adalah kumpulan informasi yang diperlukan untuk melatih model. Ini termasuk skema, ungkapan berlabel, fitur, dan pengaturan aplikasi.

Kesalahan pelatihan

Kesalahan pelatihan adalah prediksi pada data pelatihan Anda yang tidak cocok dengan labelnya.

Ucapan

Ungkapanadalah input pengguna yang merupakan perwakilan teks pendek dari kalimat dalam percakapan. Ini adalah frasa bahasa alami seperti "pesan 2 tiket ke Seattle Selasa depan". Contoh ucapan ditambahkan untuk melatih model dan model memprediksi ucapan baru saat runtime.

Versi

VersiLUIS contoh spesifik dari aplikasi LUIS yang terkait dengan ID aplikasi LUIS dan titik akhir yang diterbitkan. Setiap aplikasi LUIS memiliki setidaknya satu versi.

Bahasa komputer memahami glosarium kosakata dan konsep umum

Versi aktif

Pembelajaran aktif

Aplikasi (Aplikasi)

Penulisan

Kunci Penulisan

Sumber Daya Penulisan

Tes batch

F-ukuran

Negatif palsu (FN)

Positif palsu (FP)

Presisi

Tarik Kembali

Negatif sejati (TN)

Benar positif (TP)

Penggolong

Rekan kerja

Kontributor

Deskriptor

Domain

Titik akhir

Penulisan titik akhir

Titik akhir prediksi

Entity

Ekstraktor entitas

Skema entitas

Subentitas entitas

Entitas pembelajaran non-mesin

Entitas daftar

Ekspresi reguler

Entitas bawaan

Fitur

Fitur yang diperlukan

Niat

Contoh pelabelan

Pelabelan untuk niat

Pelabelan untuk entitas

Aplikasi LUIS

Model

Nilai yang dinormalisasi

Overfitting

Pemilik

Daftar frasa

Model bawaan

Domain bawaan

Entitas bawaan

Niat bawaan

Prediksi

Kunci prediksi

Sumber daya prediksi

Skor prediksi

Kunci terprogram

Terbitkan

Kuota

Skema

Analisis Sentimen

Penyiapan ucapan

Kunci pemula

Sinonim

Uji

Timezone offset

Token

Berlatih

Data pelatihan

Kesalahan pelatihan

Ucapan

Versi

Sumber Daya Tambahan: