Apa itu perancang Azure Pembelajaran Mesin (v1)?

Perancang Azure Machine Learning adalah antarmuka seret dan letakkan yang digunakan untuk melatih dan menyebarkan model dalam Azure Machine Learning. Artikel ini menjelaskan tugas yang dapat Anda lakukan di perancang.

Catatan

Perancang mendukung dua jenis komponen, komponen bawaan klasik (v1) dan komponen kustom (v2). Kedua jenis komponen ini TIDAK kompatibel.

Komponen bawaan klasik menyediakan komponen bawaan sebagian besar untuk pemrosesan data dan tugas pembelajaran mesin tradisional seperti regresi dan klasifikasi. Jenis komponen ini terus didukung tetapi tidak akan ada komponen baru yang ditambahkan.

Komponen kustom memungkinkan Anda membungkus kode Anda sendiri sebagai komponen. Ini mendukung berbagi komponen di seluruh ruang kerja dan penulisan tanpa hambatan di seluruh antarmuka Studio, CLI v2, dan SDK v2.

Untuk proyek baru, kami sangat menyarankan Anda menggunakan komponen kustom, yang kompatibel dengan AzureML V2 dan akan terus menerima pembaruan baru.

Artikel ini berlaku untuk komponen bawaan klasik dan tidak kompatibel dengan CLI v2 dan SDK v2.

GIF of a building a pipeline in the designer.

Perancang menggunakan ruang kerja Azure Machine Learning untuk mengatur sumber daya bersama seperti:

Pelatihan dan penyebaran model

Gunakan kanvas visual untuk membangun alur kerja pembelajaran mesin ujung ke ujung. Latih, uji, dan sebarkan semua model di perancang:

  • Seret dan letakkan aset dan komponen data ke kanvas.
  • Menyambungkan k untuk membuat alur draf.
  • Kirimkan eksekusi alur menggunakan sumber daya komputasi di ruang kerja Azure Machine Learning Anda.
  • Konversikan alur pelatihan menjadi alur inferensi.
  • Terbitkan alur Anda ke titik akhir alur REST untuk mengirimkan alur baru yang berjalan dengan parameter dan aset data yang berbeda.
    • Terbitkan alur pelatihan untuk menggunakan kembali satu alur untuk melatih beberapa model sambil mengubah parameter dan aset data.
    • Terbitkan alur inferensi batch untuk membuat prediksi tentang data yang baru dengan menggunakan model terlatih.
  • Menyebarkanalur inferensi real time ke titik akhir online untuk membuat prediksi pada data baru secara real time.

Workflow diagram for training, batch inference, and real-time inference in the designer.

Alur

Alur terdiri dari aset data dan komponen analitik, yang Anda sambungkan. Alur memiliki banyak kegunaan: Anda dapat membuat alur yang melatih satu model, atau yang melatih beberapa model. Anda dapat membuat alur yang membuat prediksi secara real time atau batch, atau membuat alur yang hanya membersihkan data. Dengan alur, Anda dapat menggunakan kembali pekerjaan Anda dan mengatur proyek.

Draf alur

Saat mengedit alur di perancang, progres Anda akan disimpan sebagai draf alur. Anda bisa mengedit draf alur di titik mana pun dengan menambahkan atau menghapus komponen, mengonfigurasi target komputasi, membuat parameter, dan sebagainya.

Alur yang valid memiliki karakteristik ini:

  • Aset data hanya dapat terhubung ke komponen.
  • komponen hanya dapat terhubung ke aset data atau komponen lainnya.
  • Semua port input untuk komponen harus memiliki beberapa koneksi ke aliran data.
  • Semua parameter yang diperlukan untuk setiap komponen harus ditetapkan.

Saat Anda siap untuk menjalankan draf alur, Anda mengirimkan pekerjaan alur.

Pekerjaan alur

Setiap kali Anda menjalankan alur, konfigurasi alur dan hasilnya disimpan di ruang kerja Anda sebagai pekerjaan alur. Anda dapat kembali ke pekerjaan alur apa pun untuk memeriksanya untuk pemecahan masalah atau audit. Kloning pekerjaan alur untuk membuat draf alur baru untuk Anda edit.

Pekerjaan alur dikelompokkan ke dalam eksperimen untuk mengatur riwayat pekerjaan. Anda dapat mengatur eksperimen untuk setiap pekerjaan alur.

Data

Aset data pembelajaran mesin memudahkan untuk mengakses dan bekerja dengan data Anda. Beberapa contoh aset data disertakan dalam perancang untuk Anda eksperimen. Anda dapat mendaftarkan lebih banyak aset data saat Anda membutuhkannya.

Komponen

Komponen adalah algoritma yang dapat Anda terapkan pada data Anda. Perancang ini memiliki beberapa komponen, mulai dari fungsi ingress data, hingga proses pelatihan, penilaian, dan validasi.

Komponen mungkin memiliki serangkaian parameter yang dapat Anda gunakan untuk mengonfigurasi algoritma internal komponen. Saat Anda memilih komponen di kanvas, parameter komponen ditampilkan di panel Properti di sebelah kanan kanvas. Anda dapat mengubah parameter di panel tersebut untuk menyesuaikan model Anda. Anda dapat mengatur sumber daya komputasi untuk komponen individu di perancang.

Screenshot showing the component properties.

Untuk bantuan dalam menavigasi melalui pustaka algoritma pembelajaran mesin yang tersedia, lihat Ikhtisar referensi algoritma & komponen. Untuk bantuan dalam memilih algoritma, lihat Referensi Cepat Algoritma Azure Machine Learning.

Sumber daya komputasi

Gunakan sumber daya komputasi dari ruang kerja Anda untuk menjalankan alur dan menghosting model yang Anda terapkan sebagai titik akhir online atau titik akhir alur (untuk inferensi batch). Target komputasi yang didukung adalah:

Target komputasi Pelatihan Penyebaran
Komputasi Azure Machine Learning
Azure Kubernetes Service

Target komputasi dilampirkan ke ruang kerja Azure Machine Learning Anda. Anda akan mengelola target komputasi di ruang kerja di studio Azure Machine Learning.

Menyebarkan

Untuk melakukan inferensi real time, Anda harus menyebarkan alur sebagai titik akhir online. Titik akhir online membuat antarmuka antara aplikasi eksternal dan model penilaian Anda. Panggilan ke titik akhir online menampilkan hasil prediksi ke aplikasi secara real time. Untuk melakukan panggilan ke titik akhir online, Anda akan meneruskan kunci API yang dibuat saat menyebarkan titik akhir. Titik akhir didasarkan pada REST, pilihan arsitektur populer untuk proyek pemrograman web.

Titik akhir online harus disebarkan ke kluster Azure Kubernetes Service.

Untuk mempelajari cara menyebarkan model Anda, lihat Tutorial: Menyebarkan model pembelajaran mesin dengan perancang.

Terbitkan

Anda juga dapat menerbitkan alur ke titik akhir alur. Mirip dengan titik akhir online, titik akhir alur memungkinkan Anda mengirimkan pekerjaan alur baru dari aplikasi eksternal menggunakan panggilan REST. Namun, Anda tidak dapat mengirim atau menerima data secara real time menggunakan titik akhir alur.

Alur yang diterbitkan bersifat fleksibel, dapat digunakan untuk melatih atau melatih kembali model, melakukan inferensi batch, memproses data baru, dan masih banyak lagi. Anda dapat menerbitkan beberapa alur ke satu titik akhir alur dan menentukan versi alur mana yang akan dijalankan.

Alur yang diterbitkan akan berjalan pada sumber daya komputasi yang Anda tentukan dalam draf alur untuk setiap komponen.

Perancang membuat objek PublishedPipeline yang sama dengan SDK.

Langkah berikutnya