Tutorial: Melatih model klasifikasi gambar dengan menggunakan ekstensi Visual Studio Code Azure Machine Learning (pratinjau)

BERLAKU UNTUK: Ekstensi ml Azure CLI v2 (saat ini)

Artikel ini menjelaskan cara melatih model klasifikasi gambar untuk mengenali angka tulisan tangan dengan menggunakan TensorFlow dan ekstensi Visual Studio Code Azure Machine Learning.

Penting

Fitur ini masih dalam pratinjau umum. Versi pratinjau ini disediakan tanpa perjanjian tingkat layanan, dan tidak disarankan untuk beban kerja produksi. Fitur tertentu mungkin tidak didukung atau mungkin memiliki kemampuan terbatas.

Untuk mengetahui informasi selengkapnya, lihat Ketentuan Penggunaan Tambahan untuk Pratinjau Microsoft Azure.

Dalam tutorial ini, Anda akan mempelajari tugas-tugas berikut:

  • Memahami kode
  • Membuat ruang kerja
  • Latih sebuah model

Prasyarat

Memahami kode

Kode untuk tutorial ini menggunakan TensorFlow untuk melatih model pembelajaran mesin klasifikasi gambar yang mengategorikan digit tulisan tangan dari 0-9. Hal ini dilakukan dengan membuat jaringan neural yang mengambil nilai piksel gambar 28x28 piksel sebagai input, dan kemudian menghasilkan daftar 10 probabilitas, satu untuk setiap digit yang diklasifikasikan. Contoh berikut menunjukkan seperti apa data tersebut.

Cuplikan layar yang memperlihatkan sampel digit MNIST.

Membuat ruang kerja

Untuk membangun aplikasi di Azure Machine Learning, Anda harus terlebih dahulu membuat ruang kerja. Ruang kerja berisi sumber daya untuk melatih model dan juga model terlatih itu sendiri. Untuk informasi selengkapnya, lihat Apa itu ruang kerja Azure Machine Learning?

  1. Di Visual Studio Code, buka direktori azureml-examples/cli/jobs/single-step/tensorflow/mnist dari repositori contoh.

  2. Pada bilah aktivitas Visual Studio Code, pilih ikon Azure untuk membuka tampilan Azure Machine Learning.

  3. Di bawah Pembelajaran Mesin, klik kanan simpul langganan Anda dan pilih Buat ruang kerja.

    Cuplikan layar yang memperlihatkan opsi untuk membuat ruang kerja.

  4. File spesifikasi muncul. Konfigurasikan file spesifikasi dengan opsi berikut lalu simpan.

    $schema: https://azuremlschemas.azureedge.net/latest/workspace.schema.json
    name: TeamWorkspace
    location: WestUS2
    display_name: team-ml-workspace
    description: A workspace for training machine learning models
    tags:
      purpose: training
      team: ml-team
    

    File spesifikasi membuat ruang kerja yang disebut TeamWorkspace di wilayah WestUS2 tersebut. Opsi lain yang ditentukan dalam file spesifikasi menyediakan penamaan, deskripsi, dan tag yang ramah untuk ruang kerja.

  5. Klik kanan file spesifikasi dan pilih AzureML: Jalankan YAML. Membuat sumber daya menggunakan opsi konfigurasi yang ditentukan dalam file spesifikasi YAML dan mengirimkan pekerjaan dengan menggunakan CLI (v2). Pada titik ini, ekstensi membuat permintaan ke Azure untuk membuat ruang kerja baru dan sumber daya dependen di akun Anda. Setelah beberapa menit, ruang kerja baru muncul di simpul langganan Anda.

  6. Atur TeamWorkspace sebagai ruang kerja default Anda. Dengan mengatur ruang kerja ini sebagai default, Anda menempatkan sumber daya dan pekerjaan yang Anda buat di ruang kerja secara default. Pilih tombol Atur Ruang Kerja Azure Pembelajaran Mesin pada bilah status Visual Studio Code dan ikuti perintah untuk diatur TeamWorkspace sebagai ruang kerja default Anda.

Untuk informasi selengkapnya tentang ruang kerja, lihat Mengelola sumber daya Azure Machine Learning dengan ekstensi Visual Studio Code.

Melatih model

Selama proses pelatihan, model TensorFlow dilatih dengan memproses data pelatihan dan pola pembelajaran yang tertanam di dalamnya untuk masing-masing digit yang diklasifikasikan.

Seperti ruang kerja dan target komputasi, pekerjaan pelatihan didefinisikan menggunakan templat sumber daya. Untuk sampel ini, spesifikasi ditentukan dalam file job.yml, yang terletak di folder azureml-examples/cli/jobs/single-step/tensorflow/mnist dalam contoh repositori.

$schema: https://azuremlschemas.azureedge.net/latest/commandJob.schema.json
code: src
command: >
    python train.py
environment: azureml:AzureML-tensorflow-2.12-cuda11@latest
compute: azureml:gpu-cluster
experiment_name: tensorflow-mnist-example
description: Train a basic neural network with TensorFlow on the MNIST dataset.

File spesifikasi ini mengirimkan pekerjaan pelatihan yang dipanggil tensorflow-mnist-example ke gpu-cluster target komputasi yang menjalankan kode dalam skrip train.py Python. Lingkungan yang digunakan adalah salah satu lingkungan yang dikumpulkan yang disediakan oleh Azure Machine Learning, yang berisi TensorFlow dan dependensi perangkat lunak lainnya yang diperlukan untuk menjalankan skrip pelatihan. Untuk informasi selengkapnya tentang lingkungan yang dikuratori, lihat lingkungan yang dikuratori Azure Machine Learning.

Untuk mengirimkan pekerjaan pelatihan:

  1. Buka file job.yml.
  2. Klik kanan file di editor teks dan pilih AzureML: Jalankan YAML.

Pada titik ini, permintaan dikirim ke Azure untuk menjalankan eksperimen Anda pada target komputasi yang dipilih di ruang kerja Anda. Proses ini memakan waktu beberapa menit. Jumlah waktu untuk menjalankan pekerjaan pelatihan terdampak oleh beberapa faktor seperti jenis komputasi dan ukuran data pelatihan. Untuk melacak kemajuan eksperimen Anda, klik kanan node yang dijalankan saat ini dan pilih Lihat Pekerjaan di portal Azure.

Saat dialog yang meminta untuk membuka situs web eksternal muncul, pilih Buka.

Cuplikan layar yang memperlihatkan kemajuan pekerjaan.

Ketika model selesai dilatih, label status di sebelah simpul pelaksanaan diperbarui menjadi Selesai.