Referensi algoritma & komponen untuk perancang Azure Machine Learning
BERLAKU UNTUK: Python SDK azure-ai-ml v2 (saat ini)
Catatan
Perancang mendukung dua jenis komponen, komponen bawaan klasik, dan komponen kustom. Kedua jenis komponen ini tidak kompatibel.
Komponen bawaan klasik menyediakan komponen bawaan sebagian besar untuk pemrosesan data dan tugas pembelajaran mesin tradisional seperti regresi dan klasifikasi. Jenis komponen ini terus didukung tetapi tidak akan ada komponen baru yang ditambahkan.
Komponen kustom memungkinkan Anda menyediakan kode Anda sendiri sebagai komponen. Komponen ini mendukung berbagi di seluruh ruang kerja dan penulisan tanpa hambatan di seluruh antarmuka Studio, CLI, dan SDK.
Artikel ini berlaku untuk komponen bawaan klasik.
Konten referensi ini menyediakan latar belakang teknis pada setiap komponen bawaan klasik yang tersedia di perancang Azure Pembelajaran Mesin.
Setiap komponen mewakili satu kumpulan kode yang dapat berjalan secara independen dan melakukan tugas pembelajaran mesin, dengan input yang diperlukan. Komponen mungkin berisi algoritma tertentu, atau melakukan tugas yang penting dalam pembelajaran mesin, seperti penggantian nilai yang hilang, atau analisis statistik.
Untuk bantuan dalam memilih algoritma, lihat
Tip
Dalam alur apa pun di perancang, Anda bisa mendapatkan informasi tentang komponen tertentu. Pilih tautan Pelajari selengkapnya di kartu komponen saat mengarahkan ke komponen di daftar komponen, atau di panel kanan komponen.
Komponen penyiapan data
Fungsionalitas | Deskripsi | komponen |
---|---|---|
Input dan output data | Pindahkan data dari sumber cloud ke alur Anda. Tulis hasil atau data perantara Anda ke Azure Storage, atau Database SQL, saat menjalankan alur, atau gunakan penyimpanan cloud untuk bertukar data antar alur. | Memasukkan Data Secara Manual Mengekspor data Impor Data |
Transformasi Data | Operasi pada data yang unik untuk pembelajaran komputer, seperti menormalkan atau mengikat data, pengurangan dimensi, dan mengonversi data di antara berbagai format file. | Menambahkan kolom Menambahkan Baris Menerapkan Operasi Matematika Terapkan Transformasi SQL Membersihkan Data Yang Hilang Nilai Klip Mengonversi ke CSV Mengonversi ke Himpunan Data Mengonversi ke Nilai Indikator Mengedit Metadata Mengelompokkan Data ke dalam Bin Data Gabungan Menormalkan Data Partisi dan Sampel Menghapus Baris Duplikat SMOTE Memilih Transformasi Kolom Memilih Kolom di Himpunan Data Memisahkan Data |
Pemilihan Fitur | Pilih subset fitur yang relevan dan berguna untuk digunakan untuk membangun model analitik. | Pilihan Fitur Berbasis Filter Pentingnya Fitur Permutasi |
Fungsi statistik | Menyediakan berbagai metode statistik yang terkait dengan ilmu data. | Meringkas Data |
Algoritma pembelajaran mesin
Fungsionalitas | Deskripsi | komponen |
---|---|---|
Regresi | Memprediksi nilai. | Regresi Pohon Keputusan yang Ditingkatkan Regresi Hutan Keputusan Regresi Kuantil Hutan Cepat Regresi Linear Regresi Jaringan Saraf Regresi Poisson |
Pengklusteran | Mengelompokkan data bersama-sama. | Pengklusteran K-Means |
Klasifikasi | Memprediksi kelas. Pilih dari algoritma biner (dua kelas) atau multi kelas. | Pohon Keputusan yang Didorong Multikelas Hutan Keputusan Multikelas Regresi Logistik Multi kelas Jaringan Neural Multi kelas Satu vs. Semua Multi kelas Satu vs. Satu Multikelas Perceptron Rata-Rata Dua Kelas Pohon Keputusan yang Didorong Dua Kelas Hutan Keputusan Dua Kelas Regresi Logistik Dua Kelas Jaringan Neural Dua Kelas Komputer Vektor Dukungan Dua Kelas |
Komponen untuk membangun dan mengevaluasi model
Layanan web
Pelajari komponen layanan web, yang diperlukan untuk inferensi waktu nyata di desainer Azure Machine Learning.
Pesan kesalahan
Pelajari pesan kesalahan dan kode pengecualian yang mungkin Anda temui saat menggunakan komponen di perancang Azure Machine Learning.
Lingkungan komponen
Semua komponen bawaan dalam perancang akan dijalankan pada lingkungan tetap yang disediakan oleh Microsoft.
Sebelumnya, lingkungan ini didasarkan pada Python 3.6, dan kini telah ditingkatkan ke Python 3.8. Peningkatan ini transparan karena komponen akan berjalan secara otomatis pada lingkungan Python 3.8 dan tidak memerlukan tindakan dari pengguna. Pembaruan lingkungan dapat memengaruhi output komponen dan menyebarkan titik akhir real-time dari inferensi real-time, lihat bagian berikut untuk mempelajari lebih lanjut.
Output komponen berbeda dari hasil sebelumnya
Setelah versi Python ditingkatkan dari 3.6 ke 3.8, dependensi komponen bawaan juga dapat ditingkatkan. Oleh karena itu, Anda mungkin menemukan beberapa output komponen berbeda dari hasil sebelumnya.
Jika Anda menggunakan komponen Jalankan Skrip Python dan sebelumnya telah menginstal paket yang terkait dengan Python 3.6, Anda mungkin mengalami kesalahan seperti:
- "Tidak dapat menemukan versi yang memenuhi persyaratan."
- "Tidak ditemukan distribusi yang cocok." Kemudian Anda harus menentukan versi paket yang disesuaikan dengan Python 3.8, dan menjalankan alur Anda lagi.
Menyebarkan titik akhir real time dari masalah alur inferensi real-time
Jika Anda langsung menyebarkan titik akhir real-time dari alur inferensi real-time yang diselesaikan sebelumnya, itu mungkin mengalami kesalahan.
Rekomendasi: kloning alur inferensi dan kirimkan lagi, lalu sebarkan ke titik akhir real time.