CLI ile hiper parametre ayarlama işi çalıştırma (v2)

Tamamlandı

CLI (v2) ile bir süpürme işi göndererek Azure Machine Learning çalışma alanıyla hiper parametre ayarlaması yapın.

Müşteri değişim sıklığı modelini oluşturan veri bilimcisi modelin daha da doğru olup olmadığını merak ediyor. Model kişisel bir bilgisayarda eğitildiğinden, veri bilimcisinin çeşitli model parametre değerleriyle birden çok modeli eğitecek zamanı veya işlem gücü yoktu. Artık işlem kümesi kullanarak müşteri değişim sıklığı modelini eğitebildiğinize göre, hiper parametre değerleri arasında hızla yineleme yapmak için model eğitimini paralelleştirebilirsiniz.

Azure Machine Learning CLI (v2) ile python betiği kullanarak hiper parametreleri ayarlayacaksınız.

Hiperparametreleri ayarlama

CLI (v2) aracılığıyla bir hiper parametre ayarlama işi yapılandırmak ve göndermek için süpürme işi kullanın.

Veri bilimcisi en iyi modeli bulmak için birden çok model eğitmektedir. Hiper parametre ayarlama , veri bilimcisinin aynı algoritmayı ve eğitim verilerini ama farklı hiper parametre değerlerini kullanarak birden çok modeli eğitmesini sağlar. Her yineleme için performans ölçümlerinin hangi yapılandırmanın en iyi modelle sonuçlandığı değerlendirilecek şekilde izlenmesi gerekir.

Temel bir Python eğitim işine benzer şekilde, süpürme işinin yapılandırması bir YAML dosyasında sweep-job.ymldepolanır:

$schema: https://azuremlschemas.azureedge.net/latest/sweepJob.schema.json
type: sweep
sampling_algorithm: grid
trial:
  code: 
    local_path: src
  command: >-
    python main.py
    --learning-rate ${{search_space.learning_rate}}
  environment: azureml:basic-env-scikit:1
inputs:
    diabetes:
      data: azureml:diabetes-data:1
compute: azureml:aml-cluster
search_space:
  learning_rate:
    type: choice
    values: [0.01, 0.1, 1.0]
objective:
  primary_metric: training_roc_auc_score
  goal: maximize
limits:
  max_total_trials: 6
  max_concurrent_trials: 3
  timeout: 3600
experiment_name: customer-churn-sweep-example
description: Run a hyperparameter sweep job for classification on customer churn dataset.

Süpürme işi oluşturmak için aşağıdaki parametreleri ekleyin:

  • type: Bu durumda olan iş türü.sweep_job
  • algorithm: Arama alanından değerleri seçmek için kullanılan örnekleme yöntemi. , gridveya randomolabilirbayesian.
  • search_space: Hiper parametre ayarlaması sırasında denenen değer kümesi. Her hiper parametre için arama alanı türünü (choice) ve değerleri (0.01, 0.1, 1.0) yapılandırabilirsiniz.
  • objective: Hangi modelin en iyi olduğuna (primary_metric) karar vermek için kullanılan günlüğe kaydedilen ölçümün adı. Bu ölçümün ekranı kapladığında veya simge durumuna küçültüldüğünde (goal) en iyi olup olmadığı.
  • max_total_trials: Toplamda eğitecek model sayısı için sabit bir durak.
  • max_concurrent_trials: İşlem kümesi kullandığınızda modelleri paralel olarak eğitebilirsiniz. Eşzamanlı deneme sayısı üst sınırı, işlem kümesi için sağlanan düğüm sayısından yüksek olamaz.

İşi göndermek ve Studio'da açmak için komutunu kullanın:

az ml job create -f job-sweep.yml --web 

Hyperdrive deneme çalıştırmasını ve ayrıntılarını göstermek için Studio açılır. Eğitilen her bir modelin ayrıntılarını ve ölçümlerini keşfetmek için Alt çalıştırmalar sekmesini genişletin.

Bahşiş

Resmi belgelerde modelleri eğitmek için CLI'yi (v2) kullanma hakkında daha fazla bilgi edinin. Github'da CLI(v2) ile eğitim modelleri hakkında daha fazla örnek bulabilirsiniz.