Azure Databricks AutoML Python API'siyle ML modellerini eğitin
Bu makalede, AutoML Python API'sini kullanarak Azure Databricks AutoML ile bir modeli eğitmek gösterilmektedir. Diğer ayrıntılar için bkz . Azure Databricks AutoML Python API başvurusu .
API sınıflandırma, regresyon ve AutoML çalıştırmalarını tahmin etmeye yönelik işlevler sağlar. Her işlev çağrısı bir model kümesi eğitir ve her model için bir deneme not defteri oluşturur.
Bkz . AutoML denemeleri için gereksinimler .
AutoML API'sini kullanarak deneme ayarlama
Aşağıdaki adımlarda genel olarak API kullanılarak bir AutoML denemesinin nasıl ayarlanacağı açıklanmaktadır:
Bir not defteri oluşturun ve Databricks Runtime ML çalıştıran bir kümeye ekleyin.
Mevcut veri kaynağınızdan kullanmak istediğiniz tabloyu belirleyin veya DBFS'ye veri dosyası yükleyip bir tablo oluşturun.
AutoML çalıştırmasını başlatmak için veya
automl.classify()
işlevini kullanınautoml.regress()
ve diğer eğitim parametreleriyle birlikte tabloyu geçirin. Tüm işlevleri ve parametreleri görmek için bkz . Azure Databricks AutoML Python API başvurusu.Örneğin:
summary = automl.regress(dataset=train_pdf, target_col="col_to_predict")
AutoML çalıştırması başladığında, konsolunda bir MLflow deneme URL'si görüntülenir. Çalıştırmanın ilerleme durumunu izlemek için bu URL'yi kullanın. Denemeler tamamlandıktan sonra görmek için MLflow denemesini yenileyin.
AutoML çalıştırması tamamlandıktan sonra:
- En iyi sonuçları oluşturan MLflow denemesine veya not defterine gitmek için çıkış özetindeki bağlantıları kullanın.
- AutoML'ye geçirilen veriler hakkında içgörüler elde etmek için veri araştırma not defterinin bağlantısını kullanın. Ayrıca bu not defterini aynı kümeye ekleyebilir ve sonuçları yeniden oluşturmak veya ek veri çözümlemesi yapmak için yeniden çalıştırabilirsiniz.
- Denemeler hakkında daha fazla ayrıntı keşfetmek veya belirli bir deneme sürümü tarafından eğitilen bir modeli yüklemek için AutoML çağrısından döndürülen özet nesnesini kullanın. AutoMLSummary nesnesi hakkında daha fazla bilgi edinin.
- Denemelerden oluşturulan tüm not defterlerini kopyalayın ve sonuçları yeniden oluşturmak için aynı kümeye ekleyerek yeniden çalıştırın. Ayrıca gerekli düzenlemeleri yapabilir, ek modelleri eğitmek ve aynı denemede günlüğe kaydetmek için bunları yeniden çalıştırabilirsiniz.
Not defterini içeri aktarma
MLflow yapıtı olarak kaydedilmiş bir not defterini içeri aktarmak için Python API'sini databricks.automl.import_notebook
kullanın. Daha fazla bilgi için bkz. Not defterini içeri aktarma
Modeli kaydetme ve dağıtma
AutoML tarafından eğitilen modelinizi MLflow model kayıt defterindeki herhangi bir kayıtlı model gibi kaydedebilir ve dağıtabilirsiniz; Bkz. MLflow modellerini günlüğe kaydetme, yükleme, kaydetme ve dağıtma.
Adlı modül yok pandas.core.indexes.numeric
Model Sunma ile AutoML kullanılarak oluşturulmuş bir modele hizmet ederken şu hatayı alabilirsiniz: No module named 'pandas.core.indexes.numeric
.
Bunun nedeni AutoML ile uç nokta ortamı sunan model arasındaki uyumsuz pandas
bir sürümdür. add-pandas-dependency.py betiğini çalıştırarak bu hatayı çözebilirsiniz. Betik, günlüğe kaydedilen modelinizin uygun pandas
bağımlılık sürümünü içerecek şekilde ve conda.yaml
dosyasını düzenlerrequirements.txt
: pandas==1.5.3
.
- Betiği modelinizin günlüğe kaydedildiği MLflow çalıştırmasını içerecek
run_id
şekilde değiştirin. - Modeli MLflow model kayıt defterine yeniden kaydetme.
- MLflow modelinin yeni sürümünü sunma işlemini deneyin.
Not defteri örnekleri
AutoML'yi kullanmaya başlamak için bu not defterlerini gözden geçirin.
Aşağıdaki not defteri AutoML ile sınıflandırmanın nasıl yapılacağını gösterir.
AutoML sınıflandırma örneği not defteri
Aşağıdaki not defteri AutoML ile regresyonun nasıl yapılacağını gösterir.
AutoML regresyon örneği not defteri
Aşağıdaki not defterinde AutoML ile tahmin gerçekleştirme işlemi gösterilmektedir.
AutoML tahmin örneği not defteri
Sonraki adımlar
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin