Sumber Daya Pelatihan Azure Pembuat Model

Berikut ini adalah panduan untuk membantu Anda mempelajari selengkapnya tentang sumber daya yang digunakan untuk melatih model di Azure dengan Model Builder.

Apa itu eksperimen Azure Pembelajaran Mesin?

Eksperimen Azure Pembelajaran Mesin adalah sumber daya yang perlu dibuat sebelum menjalankan pelatihan Model Builder di Azure.

Eksperimen ini merangkum konfigurasi dan hasil untuk satu atau beberapa eksekusi pelatihan pembelajaran mesin. Eksperimen milik ruang kerja tertentu. Pertama kali eksperimen dibuat, namanya terdaftar di ruang kerja. Setiap eksekusi berikutnya - jika nama eksperimen yang sama digunakan - dicatat sebagai bagian dari eksperimen yang sama. Jika tidak, eksperimen baru dibuat.

Apa itu ruang kerja Azure Machine Learning?

Ruang kerja adalah sumber daya Azure Pembelajaran Mesin yang menyediakan tempat terpusat untuk semua sumber daya dan artefak Pembelajaran Mesin Azure yang dibuat sebagai bagian dari pelatihan yang dijalankan.

Untuk membuat ruang kerja Azure Pembelajaran Mesin, berikut ini diperlukan:

  • Nama: Nama untuk ruang kerja Anda antara 3-33 karakter. Nama hanya boleh berisi karakter alfanumerik dan tanda hubung.
  • Wilayah: Lokasi geografis pusat data tempat ruang kerja dan sumber daya Anda disebarkan. Disarankan agar Anda memilih lokasi yang dekat dengan tempat Anda atau pelanggan Anda berada.
  • Grup sumber daya: Kontainer yang berisi semua sumber daya terkait untuk solusi Azure.

Apa itu komputasi Azure Pembelajaran Mesin?

Komputasi Azure Pembelajaran Mesin adalah VM Linux berbasis cloud yang digunakan untuk pelatihan.

Untuk membuat komputasi Azure Pembelajaran Mesin, berikut ini diperlukan:

  • Nama: Nama untuk komputasi Anda antara 2-16 karakter. Nama hanya boleh berisi karakter alfanumerik dan tanda hubung.

  • Ukuran komputasi

    Model Builder dapat menggunakan salah satu jenis komputasi yang dioptimalkan GPU berikut:

    Ukuran vCPU Memori: GiB Penyimpanan sementara (SSD) GiB GPU Memori GPU: GiB Disk data maksimal NIC Maksimum
    Standar_NC12 12 112 680 2 24 48 2
    Standard_NC24 24 224 1440 4 48 64 4

    Kunjungi dokumentasi VM Linux seri NC untuk detail selengkapnya tentang jenis komputasi yang dioptimalkan GPU.

  • Prioritas komputasi

    • Prioritas rendah: Cocok untuk tugas dengan waktu eksekusi yang lebih pendek. Dapat dipengaruhi oleh gangguan dan kurangnya ketersediaan. Biasanya biaya lebih murah karena memanfaatkan kapasitas surplus di Azure.
    • Khusus: Cocok untuk tugas dalam durasi apa pun, tetapi terutama pekerjaan yang berjalan lama. Tidak terpengaruh oleh gangguan atau kurangnya ketersediaan. Biasanya lebih mahal karena mencadangkan sekumpulan sumber daya komputasi khusus di Azure untuk tugas Anda.

Pelatihan

Pelatihan di Azure hanya tersedia untuk skenario klasifikasi gambar Model Builder. Algoritma yang digunakan untuk melatih model ini adalah Jaringan Neural Dalam berdasarkan arsitektur ResNet50. Proses pelatihan membutuhkan waktu dan jumlah waktu dapat bervariasi tergantung pada ukuran komputasi yang dipilih serta jumlah data. Anda dapat melacak kemajuan eksekusi Anda dengan memilih tautan "Pantau eksekusi saat ini di portal Azure" di Visual Studio.

Hasil

Setelah pelatihan selesai, dua proyek ditambahkan ke solusi Anda dengan akhiran berikut:

  • ConsoleApp: Aplikasi konsol C# yang menyediakan kode pemula untuk membangun alur prediksi dan membuat prediksi.

  • Model: Aplikasi C# .NET Standard yang berisi model data yang menentukan skema data model input dan output serta aset berikut:

    • bestModel.onnx: Versi model berseri dalam format Open Neural Network Exchange (ONNX). ONNX adalah format sumber terbuka untuk model AI yang mendukung interoperabilitas antara kerangka kerja seperti ML.NET, PyTorch, dan TensorFlow.
    • bestModelMap.json: Daftar kategori yang digunakan saat membuat prediksi untuk memetakan output model ke kategori teks.
    • MLModel.zip: Versi serial alur prediksi ML.NET yang menggunakan versi serial model bestModel.onnx untuk membuat prediksi dan memetakan output menggunakan bestModelMap.json file.

Menggunakan model pembelajaran mesin

Kelas ModelInput dan ModelOutput dalam proyek Model menentukan skema input dan output model yang diharapkan masing-masing.

Dalam skenario klasifikasi gambar, ModelInput berisi dua kolom:

  • ImageSource: Jalur string lokasi gambar.
  • Label: Kategori aktual milik gambar. Label hanya digunakan sebagai input saat pelatihan dan tidak perlu disediakan saat membuat prediksi.

ModelOutput berisi dua kolom:

  • Prediction: Kategori gambar yang diprediksi.
  • Score: Daftar probabilitas untuk semua kategori (yang tertinggi milik Prediction).

Pemecahan Masalah

Tidak dapat membuat komputasi

Jika terjadi kesalahan selama pembuatan komputasi Azure Pembelajaran Mesin, sumber daya komputasi mungkin masih ada, dalam keadaan kesalahan. Jika Anda mencoba membuat ulang sumber daya komputasi dengan nama yang sama, operasi gagal. Untuk memperbaiki kesalahan ini, baik:

  • Membuat komputasi baru dengan nama yang berbeda
  • Buka portal Azure, dan hapus sumber daya komputasi asli