Bagikan melalui


Modul Bahasa R

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Artikel ini mencantumkan modul di Pembelajaran Mesin Studio (klasik) yang mendukung menjalankan kode R. Modul-modul ini membuatnya lebih mudah untuk mempublikasikan model R dalam produksi, dan menggunakan pengalaman komunitas bahasa R untuk memecahkan masalah dunia nyata.

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.

Artikel ini juga menjelaskan beberapa persyaratan umum untuk menggunakan R di Machine Language Studio (klasik), dan mencantumkan masalah dan tips yang diketahui.

Daftar modul

Kategori Modul Bahasa R mencakup modul-modul berikut:

  • Jalankan Skrip R: Menjalankan skrip R dari eksperimen Pembelajaran Mesin.
  • Buat Model R: Membuat model R dengan menggunakan sumber daya kustom.

Persyaratan saat menggunakan R

Sebelum menggunakan skrip R di Pembelajaran Mesin Studio (klasik), perhatikan persyaratan berikut:

  • Jika mengimpor data yang menggunakan CSV atau format lain, Anda tidak dapat membaca data secara langsung dalam format CSV dari kode R Anda. Sebagai gantinya, gunakan Konversi ke Himpunan Data untuk menyiapkan data, sebelum menggunakannya sebagai input ke modul R.

  • Saat Anda melampirkan himpunan data Pembelajaran Mesin sebagai input ke modul R, himpunan data secara otomatis dimuat ke ruang kerja R sebagai bingkai data, dengan himpunan data nama variabel.

    Namun, Anda dapat menentukan bingkai data tambahan, atau mengubah nama variabel himpunan data default dalam skrip R Anda.

  • Modul R berjalan di lingkungan yang dilindungi dan terisolasi di dalam ruang kerja pribadi Anda. Di dalam ruang kerja Anda, Anda dapat membuat bingkai data dan variabel untuk digunakan oleh beberapa modul.

    Namun, Anda tidak dapat memuat bingkai data R dari ruang kerja yang berbeda, atau membaca variabel yang dibuat di ruang kerja yang berbeda, meskipun ruang kerja itu terbuka dalam sesi Azure. Selain itu, Anda tidak dapat menggunakan modul yang memiliki dependensi Java, atau yang memerlukan akses jaringan langsung.

Pengoptimalan untuk tugas penilaian R

Implementasi R di lingkungan Pembelajaran Mesin Studio (klasik) dan ruang kerja mencakup dua komponen utama. Satu komponen mengkoordinasikan eksekusi skrip, dan yang lainnya menyediakan akses dan penilaian data berkecepatan tinggi. Komponen penilaian dioptimalkan untuk meningkatkan skalabilitas dan kinerja.

Oleh karena itu, ruang kerja R di Pembelajaran Mesin Studio (klasik) juga mendukung dua jenis tugas penilaian, masing-masing dioptimalkan untuk persyaratan yang berbeda. Anda biasanya menggunakan penilaian berdasarkan file per file saat Anda membangun eksperimen. Anda biasanya menggunakan layanan respons permintaan (RRS) untuk penilaian yang sangat cepat, ketika Anda mencetak gol sebagai bagian dari layanan web.

Paket R dan dukungan versi

Pembelajaran Mesin Studio (klasik) mencakup lebih dari 500 paket R paling populer. Paket R yang dapat Anda pilih bergantung pada versi R yang Anda pilih untuk eksperimen Anda:

  • CRAN R
  • Microsoft R Open (MRO 3.2.2 atau MRO 3.4.4)

Setiap kali Anda membuat eksperimen, Anda harus memilih satu versi R untuk dijalankan, untuk semua modul dalam eksperimen Anda.

Daftar paket per versi

Untuk daftar paket yang saat ini didukung di Pembelajaran Mesin, lihat Paket R Yang Didukung oleh Pembelajaran Mesin.

Anda juga dapat menambahkan kode berikut ke modul Execute R Script dalam eksperimen Anda, dan menjalankannya untuk mendapatkan himpunan data yang berisi nama dan versi paket. Pastikan untuk mengatur versi R di properti modul untuk menghasilkan daftar yang benar untuk lingkungan yang Anda inginkan.

data.set <- data.frame(installed.packages())
maml.mapOutputPort("data.set")

Penting

Paket yang didukung di Machine Language Studio (klasik) sering berubah. Jika Anda memiliki keraguan tentang apakah paket R didukung, gunakan sampel kode R yang disediakan untuk mendapatkan daftar lengkap paket di lingkungan saat ini.

Memperluas eksperimen dengan menggunakan bahasa R

Ada banyak cara untuk memperluas eksperimen dengan menggunakan skrip R khusus atau dengan menambahkan paket R. Berikut adalah beberapa ide untuk Anda mulai:

  • Gunakan kode R untuk melakukan operasi matematika kustom. Misalnya, ada paket R untuk memecahkan persamaan diferensial, menghasilkan angka acak, atau menjalankan simulasi Monte Carlo.

  • Terapkan transformasi kustom untuk data. Misalnya, Anda dapat menggunakan paket R untuk melakukan interpolasi pada data deret waktu, atau melakukan analisis linguistik.

  • Bekerja dengan sumber data yang berbeda. Modul skrip R mendukung satu set input tambahan, yang dapat mencakup file data, dalam format zip. Anda dapat menggunakan file data zip, bersama dengan paket R yang dirancang untuk sumber data tersebut, untuk meratakan data hierarkis menjadi tabel data datar. Anda juga dapat menggunakan ini untuk membaca data dari Excel dan format file lainnya.

  • Gunakan metrik kustom untuk evaluasi. Misalnya, alih-alih menggunakan fungsi yang disediakan dalam Evaluasi, Anda dapat mengimpor paket R, lalu menerapkan metriknya.

Contoh berikut menunjukkan keseluruhan proses untuk bagaimana Anda dapat menginstal paket baru dan menggunakan kode R kustom dalam eksperimen Anda.

Pisahkan kolom dengan menggunakan R

Terkadang data memerlukan manipulasi ekstensif untuk mengekstrak fitur. Misalkan Anda memiliki file teks yang berisi ID diikuti oleh nilai dan catatan, semuanya dipisahkan oleh spasi. Atau misalkan file teks Anda berisi karakter yang tidak didukung oleh Machine Language Studio (klasik).

Ada beberapa paket R yang menyediakan fungsi khusus untuk tugas-tugas tersebut. Paket pustaka splitstackshape berisi beberapa fungsi berguna untuk memisahkan beberapa kolom, bahkan jika setiap kolom memiliki pembatas yang berbeda.

Contoh berikut mengilustrasikan cara menginstal paket yang diperlukan, dan membagi kolom. Anda akan menambahkan kode ini ke modul Execute R Script .

#install dependent packages  
install.packages("src/concat.split.multiple/data.table_1.9.2.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.data.table <- library("data.table", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
install.packages("src/concat.split.multiple/plyr_1.8.1.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.plyr <- library("plyr", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
install.packages("src/concat.split.multiple/Rcpp_0.11.2.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.Rcpp <- library("Rcpp", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
install.packages("src/concat.split.multiple/reshape2_1.4.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.reshape2 <- library("reshape2", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
#install actual packages  
install.packages("src/concat.split.multiple/splitstackshape_1.2.0.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.splitstackshape <- library("splitstackshape", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
#Load installed library  
library(splitstackshape)  
  
#Use library method to split & concat  
data <- concat.split.multiple(maml.mapInputPort(1), c("TermsAcceptedUserClientIPAddress", "EmailAddress"), c(".", "@"))  
  
#Print column names to console  
colnames(data)  
  
#Redirect data to output port  
maml.mapOutputPort("data")  

Sumber Daya Tambahan:

Mulailah dengan tutorial ini yang menjelaskan cara membuat modul R kustom:

Artikel ini membahas perbedaan antara dua mesin penilaian secara rinci, dan menjelaskan bagaimana Anda dapat memilih metode penilaian ketika Anda menyebarkan eksperimen Anda sebagai layanan web:

Eksperimen di Azure AI Gallery ini menunjukkan bagaimana Anda dapat membuat modul R kustom yang melakukan pelatihan, penilaian, dan evaluasi:

Artikel ini, yang diterbitkan di R-Bloggers, menunjukkan bagaimana Anda dapat membuat metode evaluasi Anda sendiri di Pembelajaran Mesin:

Lebih banyak bantuan dengan R

Situs ini menyediakan daftar paket yang dikategorikan yang dapat Anda cari berdasarkan kata kunci:

Untuk sampel kode R tambahan dan bantuan R dan aplikasinya, lihat sumber daya ini:

Lihat juga