Ekstrak Frasa Kunci dari Teks
Penting
Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.
Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.
- Lihat informasi tentang memindahkan proyek pembelajaran mesin dari ML Studio (klasik) ke Azure Machine Learning.
- Mer informasjon tentang Azure Machine Learning.
ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.
Mengekstrak frasa kunci dari teks yang diberikan
Kategori: Analiză text
Catatan
Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja
Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.
Ringkasan Modul
Artikel ini menjelaskan cara menggunakan modul Ekstrak Frasa Kunci dari Teks di Pembelajaran Mesin Studio (klasik), untuk memproses kolom teks terlebih-besar. Mengingat kolom teks bahasa alami, modul mengekstrak satu atau lebih frasa yang bermakna. Frasa mungkin satu kata, kata benda majemuk, atau pengubah ditambah kata benda.
Modul ini adalah pembungkus untuk API pemrosesan bahasa alami untuk ekstraksi kata kunci. Frasa dianalisis sebagai berpotensi bermakna dalam konteks kalimat karena berbagai alasan:
- Frasa tersebut menangkap topik kalimat.
- Frasa ini berisi kombinasi pengubah dan kata benda yang menunjukkan sentimen.
Misalnya, asumsikan kalimat yang dianalisis adalah: "Itu adalah hotel yang indah untuk menginap, dengan dekorasi unik dan staf yang ramah."
Modul Ekstrak Frasa Kunci dari Teks mungkin mengembalikan frasa kunci ini:
- hotel yang indah
- staf yang ramah
- dekorasi unik
Cara mengonfigurasi Ekstrak Frasa Kunci dari Teks
Untuk mengekstrak frasa kunci, Anda harus menghubungkan himpunan data yang memiliki kolom teks.
Tambahkan ekstrak frase kunci dari modul teks ke eksperimen anda di Pembelajaran Mesin Studio (klasik). Kemudian, hubungkan himpunan data yang memiliki setidaknya satu kolom teks lengkap.
Gunakan Pemilih Kolom untuk memilih kolom jenis string, untuk mengekstrak frasa kunci.
Untuk Bahasa, pilih bahasa yang akan digunakan saat menganalisis frasa. Jika Anda menentukan bahasa, hanya frasa dalam bahasa target yang akan dikeluarkan.
Jika kolom teks berisi frasa dalam beberapa bahasa, pilih opsi, Bahasa yang diidentifikasi dalam kolom. Pemilih kolom baru ditampilkan yang memungkinkan Anda memilih kolom di kumpulan data yang berisi pengenal bahasa. Pengenal bahasa dapat berupa nama bahasa atau pengenal budaya Iso6391. Misalnya, baik "Bahasa Inggris" atau "en" dapat diterima.
Tip
Sebelum menjalankan Ekstrak Frasa Kunci dari Teks, gunakan modul Deteksi Bahasa untuk mengidentifikasi bahasa di setiap baris dan buat pengidentifikasi untuk Anda. Kesalahan muncul jika kolom pengenal bahasa berisi bahasa apa pun yang tidak didukung oleh Ekstrak Frasa Kunci dari Teks.
Hasil
Output modul adalah himpunan data yang berisi kolom frasa kunci yang dipisahkan koma.
Misalnya, contoh hasil berikut adalah untuk himpunan data input yang berisi ulasan dalam beberapa bahasa:
Frasa Kunci |
---|
novel, kapal selam nuklir, buku bagus, cerita petualangan, longsoran peristiwa, karakter yang baik |
primer misterio,personajes,fan,aventura,isla |
Semua frasa keluaran terkandung dalam satu kolom; tidak ada kolom lain yang dilewati, dan pengidentifikasi tidak ditambahkan. Namun, jika Anda ingin menyelaraskan frasa output dengan teks sumber, Anda dapat menggabungkan kembali frasa output dengan input dengan menggunakan modul Tambahkan Kolom .
Output ekstraksi kata kunci tidak menandai bahasa frasa individual.
Jika bahasa disertakan yang tidak didukung oleh modul Ekstrak Frasa Kunci , kesalahan akan muncul (0039). Untuk menghindari kesalahan, pastikan untuk memfilter teks input yang memiliki pengenal bahasa yang tidak kompatibel.
Jika ada sangat sedikit baris bahasa lain, Anda juga dapat menghindari kesalahan dengan menghilangkan pengenal bahasa, dan menganalisis semua teks menggunakan satu pilihan bahasa. Namun, ketika Anda melakukannya, hasilnya sangat buruk, karena seluruh kalimat dalam bahasa lain mungkin dihasilkan sebagai satu frasa kunci.
Contoh
Contoh berikut menunjukkan cara menggunakan modul ini untuk mengekstrak frasa kunci dan kemudian membangun cloud kata dari frasa: Ekstrak Frasa Kunci dan Perlihatkan Word Cloud
Lihat Galeri Azure AI untuk contoh pemrosesan teks lainnya menggunakan Pembelajaran Mesin.
Catatan teknis
Modul ini saat ini mendukung bahasa berikut:
- Belanda
- Inggris
- Prancis
- Jerman
- Italia
- Spanyol
Untuk bahasa tambahan, pertimbangkan untuk menggunakan API Analiză text di Azure Cognitive Services. Untuk informasi selengkapnya, lihat Cara mengekstrak frasa kunci dalam Analiză text
Input yang diharapkan
Nama | Jenis | Deskripsi |
---|---|---|
Himpunan Data | Tabel Data | Tabel yang berisi teks yang akan diproses. |
Parameter modul
Nama | Jenis | Rentang | Opsional | Default | Deskripsi |
---|---|---|---|---|---|
Kolom bahasa budaya | Pilihan Kolom | bahasa:Kolom berisi bahasa | Nama atau indeks berbasis satu kolom yang berisi informasi bahasa budaya | ||
Kolom teks | Pilihan Kolom | Diperlukan | Nama atau indeks satu berbasis kolom teks. | ||
Bahasa | T_Language | Bahasa Inggris, Bahasa Spanyol, Bahasa Prancis, Bahasa Belanda, Bahasa Jerman, Bahasa Italia, Kolom berisi bahasa | Diperlukan | Inggris | Pilih bahasa teks yang akan diproses. |
Output
Nama | Jenis | Deskripsi |
---|---|---|
Kumpulan data hasil | Tabel Data | Frasa kunci yang diekstraksi |
Pengecualian
Pengecualian | Deskripsi |
---|---|
Kesalahan 0003 | Pengecualian terjadi jika satu atau beberapa input null atau kosong. |
Kesalahan 0010 | Pengecualian terjadi jika himpunan data input memiliki nama kolom yang seharusnya cocok tetapi tidak cocok. |
Kesalahan 0016 | Pengecualian terjadi jika input himpunan data yang diteruskan ke modul harus memiliki jenis kolom yang kompatibel tetapi tidak. |
Kesalahan 0008 | Pengecualian terjadi jika parameter tidak dalam jangkauan. |
Untuk daftar kesalahan khusus untuk modul Studio (klasik), lihat Pembelajaran Mesin Kode kesalahan.
Untuk daftar pengecualian API, lihat Pembelajaran Mesin Kode Kesalahan REST API.