Bagikan melalui


Text Analytics

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Artikel ini menjelaskan modul analisis teks yang disertakan dalam Pembelajaran Mesin Studio (klasik). Modul-modul ini menyediakan alat komputasi khusus untuk bekerja dengan teks terstruktur dan tidak terstruktur, termasuk:

  • Beberapa opsi untuk praprosesing teks.
  • Deteksi bahasa.
  • Pembuatan fitur dari teks menggunakan kamus n-gram yang dapat disesuaikan.
  • Fitur hashing, untuk menganalisis teks secara efisien tanpa preprocessing atau analisis linguistik lanjutan.
  • Vowpal Wabbit, untuk pembelajaran mesin yang sangat cepat pada teks. Vowpal Wabbit mendukung hashing fitur, pemodelan topik (LDA), dan klasifikasi.
  • Dinamakan pengakuan entitas, untuk mengekstrak nama orang, tempat, dan organisasi dari teks yang tidak terstruktur.

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.

Contoh

Untuk contoh analisis teks menggunakan Pembelajaran Mesin, lihat Galeri AI Azure:

  • Kategorisasi berita: Menggunakan hashing fitur untuk mengklasifikasikan artikel ke dalam daftar kategori yang telah ditentukan.

  • Temukan perusahaan serupa: Menggunakan teks artikel Wikipedia untuk mengkategorikan perusahaan.

  • Klasifikasi teks: Menunjukkan proses end-to-end menggunakan teks dari pesan Twitter dalam analisis sentimen (sampel lima bagian).

Daftar modul

Kategori Analiză text di Pembelajaran Mesin Studio (klasik) mencakup modul-modul berikut:

Lihat juga