Aracılığıyla paylaş


Azure Databricks AutoML Python API'siyle ML modellerini eğitin

Bu makalede, AutoML Python API'sini kullanarak Azure Databricks AutoML ile bir modeli eğitmek gösterilmektedir. Diğer ayrıntılar için bkz . Azure Databricks AutoML Python API başvurusu .

API sınıflandırma, regresyon ve AutoML çalıştırmalarını tahmin etmeye yönelik işlevler sağlar. Her işlev çağrısı bir model kümesi eğitir ve her model için bir deneme not defteri oluşturur.

Bkz . AutoML denemeleri için gereksinimler .

AutoML API'sini kullanarak deneme ayarlama

Aşağıdaki adımlarda genel olarak API kullanılarak bir AutoML denemesinin nasıl ayarlanacağı açıklanmaktadır:

  1. Bir not defteri oluşturun ve Databricks Runtime ML çalıştıran bir kümeye ekleyin.

  2. Mevcut veri kaynağınızdan kullanmak istediğiniz tabloyu belirleyin veya DBFS'ye veri dosyası yükleyip bir tablo oluşturun.

  3. AutoML çalıştırmasını başlatmak için veya automl.classify() işlevini kullanın automl.regress() ve diğer eğitim parametreleriyle birlikte tabloyu geçirin. Tüm işlevleri ve parametreleri görmek için bkz . Azure Databricks AutoML Python API başvurusu.

    Örneğin:

    summary = automl.regress(dataset=train_pdf, target_col="col_to_predict")
    
  4. AutoML çalıştırması başladığında, konsolunda bir MLflow deneme URL'si görüntülenir. Çalıştırmanın ilerleme durumunu izlemek için bu URL'yi kullanın. Denemeler tamamlandıktan sonra görmek için MLflow denemesini yenileyin.

  5. AutoML çalıştırması tamamlandıktan sonra:

  • En iyi sonuçları oluşturan MLflow denemesine veya not defterine gitmek için çıkış özetindeki bağlantıları kullanın.
  • AutoML'ye geçirilen veriler hakkında içgörüler elde etmek için veri araştırma not defterinin bağlantısını kullanın. Ayrıca bu not defterini aynı kümeye ekleyebilir ve sonuçları yeniden oluşturmak veya ek veri çözümlemesi yapmak için yeniden çalıştırabilirsiniz.
  • Denemeler hakkında daha fazla ayrıntı keşfetmek veya belirli bir deneme sürümü tarafından eğitilen bir modeli yüklemek için AutoML çağrısından döndürülen özet nesnesini kullanın. AutoMLSummary nesnesi hakkında daha fazla bilgi edinin.
  • Denemelerden oluşturulan tüm not defterlerini kopyalayın ve sonuçları yeniden oluşturmak için aynı kümeye ekleyerek yeniden çalıştırın. Ayrıca gerekli düzenlemeleri yapabilir, ek modelleri eğitmek ve aynı denemede günlüğe kaydetmek için bunları yeniden çalıştırabilirsiniz.

Not defterini içeri aktarma

MLflow yapıtı olarak kaydedilmiş bir not defterini içeri aktarmak için Python API'sini databricks.automl.import_notebook kullanın. Daha fazla bilgi için bkz. Not defterini içeri aktarma

Modeli kaydetme ve dağıtma

AutoML tarafından eğitilen modelinizi MLflow model kayıt defterindeki herhangi bir kayıtlı model gibi kaydedebilir ve dağıtabilirsiniz; Bkz. MLflow modellerini günlüğe kaydetme, yükleme, kaydetme ve dağıtma.

Adlı modül yok pandas.core.indexes.numeric

Model Sunma ile AutoML kullanılarak oluşturulmuş bir modele hizmet ederken şu hatayı alabilirsiniz: No module named 'pandas.core.indexes.numeric.

Bunun nedeni AutoML ile uç nokta ortamı sunan model arasındaki uyumsuz pandas bir sürümdür. add-pandas-dependency.py betiğini çalıştırarak bu hatayı çözebilirsiniz. Betik, günlüğe kaydedilen modelinizin uygun pandas bağımlılık sürümünü içerecek şekilde ve conda.yaml dosyasını düzenlerrequirements.txt: pandas==1.5.3.

  1. Betiği modelinizin günlüğe kaydedildiği MLflow çalıştırmasını içerecek run_id şekilde değiştirin.
  2. Modeli MLflow model kayıt defterine yeniden kaydetme.
  3. MLflow modelinin yeni sürümünü sunma işlemini deneyin.

Not defteri örnekleri

AutoML'yi kullanmaya başlamak için bu not defterlerini gözden geçirin.

Aşağıdaki not defteri AutoML ile sınıflandırmanın nasıl yapılacağını gösterir.

AutoML sınıflandırma örneği not defteri

Not defterini alma

Aşağıdaki not defteri AutoML ile regresyonun nasıl yapılacağını gösterir.

AutoML regresyon örneği not defteri

Not defterini alma

Aşağıdaki not defterinde AutoML ile tahmin gerçekleştirme işlemi gösterilmektedir.

AutoML tahmin örneği not defteri

Not defterini alma

Sonraki adımlar

Azure Databricks AutoML Python API başvurusu.