Aracılığıyla paylaş


AutoML ile sınıflandırma

Belirli bir girişin etiketini veya kategorisini tahmin etmek üzere en iyi sınıflandırma algoritmasını ve hiper parametre yapılandırmasını otomatik olarak bulmak için AutoML'yi kullanın.

Kullanıcı arabirimiyle sınıflandırma denemesini ayarlama

Aşağıdaki adımlarla AutoML kullanıcı arabirimini kullanarak bir sınıflandırma sorunu ayarlayabilirsiniz:

  1. Kenar çubuğunda Denemeleröğesini seçin.

  2. Sınıflandırma kartında EğitimiBaşlat seçin.

    AutoML denemesini yapılandır sayfası görüntülenir. Bu sayfada AutoML işlemini yapılandırarak veri kümesini, tahmine yönelik sorun türünü, hedef veya etiket sütununu, deneme çalıştırmalarını değerlendirmek ve puanlamak için kullanılacak ölçümü ve durdurma koşullarını belirtirsiniz.

  3. İşlem alanında Databricks Runtime ML çalıştıran bir küme seçin.

  4. Veri Kümesialtında Gözatseçeneğini seçin.

  5. Kullanmak istediğiniz tabloya gidin ve seç'e tıklayın. Tablo şeması görüntülenir.

    • Databricks Runtime 10.3 ML ve üzerinde, AutoML'nin eğitimiçin hangi sütunları kullanması gerektiğini belirtebilirsiniz. Tahmin hedefi olarak seçilen sütunu veya verileri bölmek için zaman sütununu kaldıramazsınız.
    • Databricks Runtime 10.4 LTS ML ve üzerinde, açılan Açma/Kapatma arasından seçim yaparak null değerlerin nasıl engelleneceğini belirtebilirsiniz. Varsayılan olarak, AutoML sütun türüne ve içeriğe göre bir imputation yöntemi seçer.

    Not

    Varsayılan olmayan bir imputation yöntemi belirtirseniz, AutoML anlamsal tür algılaması gerçekleştirmez.

  6. Tahmin hedefi alanına tıklayın. Şemada gösterilen sütunları listeleyen bir açılan menü görüntülenir. Modelin tahmin etmelerini istediğiniz sütunu seçin.

  7. Deneme adı alanında varsayılan ad gösterilir. Bunu değiştirmek için alana yeni adı yazın.

Aşağıdakileri de yapabilirsiniz:

  • Ek yapılandırma seçeneklerini belirtin.
  • özgün giriş veri kümesini artırmak için Özellik Deposu'ndaki mevcut özellik tablolarını kullanın.

Gelişmiş yapılandırmalar

Bu parametrelere erişmek için Gelişmiş Yapılandırma (isteğe bağlı) bölümünü açın.

  • Değerlendirme ölçümü, çalıştırmaları puanlarken kullanılan birincil ölçümdür .
  • Databricks Runtime 10.4 LTS ML ve üzerinde eğitim çerçevelerini dikkate alınmadan hariç tutabilirsiniz. Varsayılan olarak, AutoML, AutoML algoritmaları altında listelenen çerçeveleri kullanarak modelleri eğiter.
  • Durdurma koşullarını düzenleyebilirsiniz. Varsayılan durdurma koşulları şunlardır:
    • Tahmin denemeleri için 120 dakika sonra durdurun.
    • Databricks Runtime 10.4 LTS ML ve altında sınıflandırma ve regresyon denemeleri için 60 dakika sonra veya 200 deneme tamamlandıktan sonra (hangisi önce gerçekleşirse) durduruluyor. Databricks Runtime 11.0 ML ve üzeri sürümlerde deneme sayısı durdurma koşulu olarak kullanılmaz.
    • Databricks Runtime 10.4 LTS ML ve üzeri sürümlerde, sınıflandırma ve regresyon denemeleri için AutoML erken durdurmayı içerir; doğrulama ölçümü artık geliştirilmemişse modelleri eğitip ayarlamayı durdurur.
  • Databricks Runtime 10.4 LTS ML ve üzerinde, eğitim, doğrulama ve test verilerini kronolojik sırayla bölmek için bir time column seçebilirsiniz (yalnızca sınıflandırma ve regresyoniçin geçerlidir).
  • Databricks , Veri dizini alanını boş bırakmanızı önerir. Bu alanın doldurulmaması, veri kümesini bir MLflow yapıtı olarak güvenli bir şekilde depolamanın varsayılan davranışını tetikler. DBFS yolu belirtilebilir, ancak bu durumda veri kümesi AutoML denemesinin erişim izinlerini devralmıyor.

Denemeyi çalıştırma ve sonuçları izleme

AutoML denemesini başlatmak için AutoML'yi Başlat'a tıklayın. Deneme çalışmaya başlar ve AutoML eğitim sayfası görüntülenir. Çalıştırmalar tablosunu yenilemek için Yenile düğmesinetıklayın.

Deneme ilerleme durumunu görüntüleme

Bu sayfadan şunları yapabilirsiniz:

  • Denemeyi istediğiniz zaman durdurun.
  • Veri araştırma not defterini açın.
  • İzleme çalıştırmaları.
  • Herhangi bir çalıştırma için çalıştırma sayfasına gidin.

Databricks Runtime 10.1 ML ve üzeri sürümleriyle AutoML, desteklenmeyen sütun türleri veya yüksek kardinalite sütunları gibi veri kümesiyle ilgili olası sorunlar için uyarılar görüntüler.

Not

Databricks, olası hataları veya sorunları belirtmek için en iyisini yapar. Ancak, bu kapsamlı olmayabilir ve aradığınız sorunları veya hataları yakalamayabilir.

Veri kümesiyle ilgili uyarıları görmek için, deneme tamamlandıktan sonra eğitim sayfasındaki Uyarılar sekmesine veya deneme sayfasına tıklayın.

AutoML uyarıları

Sonuçları görüntüleme

Deneme tamamlandığında şunları yapabilirsiniz:

  • MLflow ile modellerden birini kaydedin ve dağıtın .
  • En iyi modeli oluşturan not defterini gözden geçirmek ve düzenlemek için Not defterini görüntüle'yi seçin ve en iyi model'i inceleyin.
  • Veri araştırma not defteri'i görüntüleyi seçerek veri araştırma not defterini açın.
  • Çalıştırmalar tablosundaki çalıştırmaları arayın, filtreleyin ve sıralayın.
  • Herhangi bir çalıştırmanın ayrıntılarına bakın:
    • Deneme çalıştırması için kaynak kodu içeren oluşturulan not defteri, MLflow çalıştırmasına tıklanarak bulunabilir. Not defteri, çalıştırma sayfasının Yapıtlar bölümüne kaydedilir. Yapıtları indirme çalışma alanı yöneticileriniz tarafından etkinleştirildiyse, bu not defterini indirebilir ve çalışma alanına aktarabilirsiniz.
    • Çalıştırma sonuçlarını görüntülemek için Modelleri sütununa veya Başlangıç Saati sütununa tıklayın. Çalıştırma sayfası görüntülenir ve deneme çalıştırması hakkındaki bilgileri (parametreler, ölçümler ve etiketler gibi) ve model de dahil olmak üzere çalıştırma tarafından oluşturulan yapıtları gösterir. Bu sayfa ayrıca modelle tahminlerde bulunmak için kullanabileceğiniz kod parçacıkları içerir.

Daha sonra bu AutoML denemesine dönmek için,Denemeler sayfasındaki tabloda bulabilirsiniz. Veri keşfi ve eğitim not defterleri de dahil olmak üzere her AutoML denemesinin sonuçları, denemeyi çalıştıran kullanıcının giriş klasöründeki bir databricks_automl klasörde depolanır.

Modeli kaydetme ve dağıtma

AutoML kullanıcı arabirimini kullanarak modelinizi kaydedin ve dağıtın. Bir çalıştırma tamamlandığında, en üst satır birincil ölçümü temel alan en iyi modeli gösterir.

  1. Kaydetmek istediğiniz modelin Modeller sütunundaki bağlantıyı seçin.
  2. Unity Kataloğu'na veya Model Kayıt Defteri'ne kaydetmek için modeli kaydet düğmesini seçin.

    Not

    Databricks, en son özellikler için modelleri Unity Kataloğu'na kaydetmenizi önerir.

  3. Kayıt işleminden sonra modeli özel bir model sunma uç noktasına dağıtabilirsiniz.

'pandas.core.indexes.numeric' adında bir modül bulunamadı.

Model Sunma ile AutoML kullanılarak oluşturulmuş bir modele hizmet ederken şu hatayı alabilirsiniz: No module named 'pandas.core.indexes.numeric.

Bunun nedeni AutoML ile uç nokta ortamı sunan model arasındaki uyumsuz pandas bir sürümdür. add-pandas-dependency.py betiğini çalıştırarak bu hatayı çözebilirsiniz. Betik, günlüğe requirements.txt kaydedilen modelinizin uygun conda.yaml bağımlılık sürümünü içermesi için ve pandas dosyasını düzenler:pandas==1.5.3

  1. Betiği, modelinizin MLflow çalıştırmasına kaydedildiği yer olan run_id'ı içerecek şekilde değiştirin.
  2. Modeli Unity Kataloğu'na veya model kayıt defterine yeniden kaydedin.
  3. MLflow modelinin yeni sürümünü sunma işlemini deneyin.

Sonraki adımlar