Bagikan melalui


Ekstrak Frasa Kunci dari Teks

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Mengekstrak frasa kunci dari teks yang diberikan

Kategori: Analiză text

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.

Ringkasan Modul

Artikel ini menjelaskan cara menggunakan modul Ekstrak Frasa Kunci dari Teks di Pembelajaran Mesin Studio (klasik), untuk memproses kolom teks terlebih-besar. Mengingat kolom teks bahasa alami, modul mengekstrak satu atau lebih frasa yang bermakna. Frasa mungkin satu kata, kata benda majemuk, atau pengubah ditambah kata benda.

Modul ini adalah pembungkus untuk API pemrosesan bahasa alami untuk ekstraksi kata kunci. Frasa dianalisis sebagai berpotensi bermakna dalam konteks kalimat karena berbagai alasan:

  • Frasa tersebut menangkap topik kalimat.
  • Frasa ini berisi kombinasi pengubah dan kata benda yang menunjukkan sentimen.

Misalnya, asumsikan kalimat yang dianalisis adalah: "Itu adalah hotel yang indah untuk menginap, dengan dekorasi unik dan staf yang ramah."

Modul Ekstrak Frasa Kunci dari Teks mungkin mengembalikan frasa kunci ini:

  • hotel yang indah
  • staf yang ramah
  • dekorasi unik

Cara mengonfigurasi Ekstrak Frasa Kunci dari Teks

Untuk mengekstrak frasa kunci, Anda harus menghubungkan himpunan data yang memiliki kolom teks.

  1. Tambahkan ekstrak frase kunci dari modul teks ke eksperimen anda di Pembelajaran Mesin Studio (klasik). Kemudian, hubungkan himpunan data yang memiliki setidaknya satu kolom teks lengkap.

  2. Gunakan Pemilih Kolom untuk memilih kolom jenis string, untuk mengekstrak frasa kunci.

  3. Untuk Bahasa, pilih bahasa yang akan digunakan saat menganalisis frasa. Jika Anda menentukan bahasa, hanya frasa dalam bahasa target yang akan dikeluarkan.

  4. Jika kolom teks berisi frasa dalam beberapa bahasa, pilih opsi, Bahasa yang diidentifikasi dalam kolom. Pemilih kolom baru ditampilkan yang memungkinkan Anda memilih kolom di kumpulan data yang berisi pengenal bahasa. Pengenal bahasa dapat berupa nama bahasa atau pengenal budaya Iso6391. Misalnya, baik "Bahasa Inggris" atau "en" dapat diterima.

    Tip

    Sebelum menjalankan Ekstrak Frasa Kunci dari Teks, gunakan modul Deteksi Bahasa untuk mengidentifikasi bahasa di setiap baris dan buat pengidentifikasi untuk Anda. Kesalahan muncul jika kolom pengenal bahasa berisi bahasa apa pun yang tidak didukung oleh Ekstrak Frasa Kunci dari Teks.

Hasil

Output modul adalah himpunan data yang berisi kolom frasa kunci yang dipisahkan koma.

Misalnya, contoh hasil berikut adalah untuk himpunan data input yang berisi ulasan dalam beberapa bahasa:

Frasa Kunci
novel, kapal selam nuklir, buku bagus, cerita petualangan, longsoran peristiwa, karakter yang baik
primer misterio,personajes,fan,aventura,isla
  • Semua frasa keluaran terkandung dalam satu kolom; tidak ada kolom lain yang dilewati, dan pengidentifikasi tidak ditambahkan. Namun, jika Anda ingin menyelaraskan frasa output dengan teks sumber, Anda dapat menggabungkan kembali frasa output dengan input dengan menggunakan modul Tambahkan Kolom .

  • Output ekstraksi kata kunci tidak menandai bahasa frasa individual.

  • Jika bahasa disertakan yang tidak didukung oleh modul Ekstrak Frasa Kunci , kesalahan akan muncul (0039). Untuk menghindari kesalahan, pastikan untuk memfilter teks input yang memiliki pengenal bahasa yang tidak kompatibel.

    Jika ada sangat sedikit baris bahasa lain, Anda juga dapat menghindari kesalahan dengan menghilangkan pengenal bahasa, dan menganalisis semua teks menggunakan satu pilihan bahasa. Namun, ketika Anda melakukannya, hasilnya sangat buruk, karena seluruh kalimat dalam bahasa lain mungkin dihasilkan sebagai satu frasa kunci.

Contoh

Contoh berikut menunjukkan cara menggunakan modul ini untuk mengekstrak frasa kunci dan kemudian membangun cloud kata dari frasa: Ekstrak Frasa Kunci dan Perlihatkan Word Cloud

Lihat Galeri Azure AI untuk contoh pemrosesan teks lainnya menggunakan Pembelajaran Mesin.

Catatan teknis

Modul ini saat ini mendukung bahasa berikut:

  • Belanda
  • Inggris
  • Prancis
  • Jerman
  • Italia
  • Spanyol

Untuk bahasa tambahan, pertimbangkan untuk menggunakan API Analiză text di Azure Cognitive Services. Untuk informasi selengkapnya, lihat Cara mengekstrak frasa kunci dalam Analiză text

Input yang diharapkan

Nama Jenis Deskripsi
Himpunan Data Tabel Data Tabel yang berisi teks yang akan diproses.

Parameter modul

Nama Jenis Rentang Opsional Default Deskripsi
Kolom bahasa budaya Pilihan Kolom bahasa:Kolom berisi bahasa Nama atau indeks berbasis satu kolom yang berisi informasi bahasa budaya
Kolom teks Pilihan Kolom Diperlukan Nama atau indeks satu berbasis kolom teks.
Bahasa T_Language Bahasa Inggris, Bahasa Spanyol, Bahasa Prancis, Bahasa Belanda, Bahasa Jerman, Bahasa Italia, Kolom berisi bahasa Diperlukan Inggris Pilih bahasa teks yang akan diproses.

Output

Nama Jenis Deskripsi
Kumpulan data hasil Tabel Data Frasa kunci yang diekstraksi

Pengecualian

Pengecualian Deskripsi
Kesalahan 0003 Pengecualian terjadi jika satu atau beberapa input null atau kosong.
Kesalahan 0010 Pengecualian terjadi jika himpunan data input memiliki nama kolom yang seharusnya cocok tetapi tidak cocok.
Kesalahan 0016 Pengecualian terjadi jika input himpunan data yang diteruskan ke modul harus memiliki jenis kolom yang kompatibel tetapi tidak.
Kesalahan 0008 Pengecualian terjadi jika parameter tidak dalam jangkauan.

Untuk daftar kesalahan khusus untuk modul Studio (klasik), lihat Pembelajaran Mesin Kode kesalahan.

Untuk daftar pengecualian API, lihat Pembelajaran Mesin Kode Kesalahan REST API.

Lihat juga

Text Analytics
Daftar Modul A-Z