RegressionJob Sınıf
AutoML Regresyon İşi yapılandırması.
Yeni bir AutoML Regresyonu görevi başlatın.
- Devralma
-
azure.ai.ml.entities._job.automl.tabular.automl_tabular.AutoMLTabularRegressionJob
Oluşturucu
RegressionJob(*, primary_metric: str | None = None, **kwargs)
Parametreler
Yöntemler
dump |
İş içeriğini YAML biçiminde bir dosyaya dökümünü alır. |
set_data |
Veri yapılandırmasını tanımlama. |
set_featurization |
Özellik mühendisliği yapılandırmasını tanımlama. |
set_limits |
İş için sınırlar ayarlayın. |
set_training |
Eğitimle ilgili ayarları yapılandırma yöntemi. |
dump
İş içeriğini YAML biçiminde bir dosyaya dökümünü alır.
dump(dest: str | PathLike | IO, **kwargs) -> None
Parametreler
YAML içeriğinin yazılabileceği yerel yol veya dosya akışı. Dest bir dosya yoluysa yeni bir dosya oluşturulur. Dest açık bir dosyaysa, dosya doğrudan öğesine yazılır.
- kwargs
- dict
YAML seri hale getiricisine geçirmek için ek bağımsız değişkenler.
Özel durumlar
Dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.
Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.
set_data
Veri yapılandırmasını tanımlama.
set_data(*, training_data: Input, target_column_name: str, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None) -> None
Parametreler
- training_data
- Input
Eğitim verileri.
- target_column_name
- str
Hedef sütunun sütun adı.
n_cross_validations, varsayılan olarak Yok'a ayarlanır
Özel durumlar
Dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.
Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.
set_featurization
Özellik mühendisliği yapılandırmasını tanımlama.
set_featurization(*, blocked_transformers: List[BlockedTransformers | str] | None = None, column_name_and_types: Dict[str, str] | None = None, dataset_language: str | None = None, transformer_params: Dict[str, List[ColumnTransformer]] | None = None, mode: str | None = None, enable_dnn_featurization: bool | None = None) -> None
Parametreler
- blocked_transformers
- Optional[List[Union[BlockedTransformers, str]]]
Özellik geliştirme sırasında engellenecek transformatör adlarının listesi, varsayılan olarak Yok olarak ayarlanır
Sütun amacını güncelleştirmek için kullanılan sütun adlarının ve özellik türlerinin sözlüğü, varsayılan olarak Yok olarak ayarlanır
Veri kümesinde yer alan diller için üç karakterli ISO 639-3 kodu. İngilizce dışındaki diller yalnızca GPU özellikli işlem kullanıyorsanız desteklenir. Veri kümesi birden çok dil içeriyorsa 'mul' language_code kullanılmalıdır. Farklı diller için ISO 639-3 kodlarını bulmak için lütfen adresine bakın https://en.wikipedia.org/wiki/List_of_ISO_639-3_codes, varsayılan olarak Yok
- transformer_params
- Optional[Dict[str, List[ColumnTransformer]]]
Transformatör sözlüğü ve karşılık gelen özelleştirme parametreleri, varsayılan olarak Yok olarak ayarlanır
DNN tabanlı özellik mühendisliği yöntemlerinin dahil edilip edilmeyeceği, varsayılan olarak Yok olarak ayarlanır
Özel durumlar
Dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.
Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.
set_limits
İş için sınırlar ayarlayın.
set_limits(*, enable_early_termination: bool | None = None, exit_score: float | None = None, max_concurrent_trials: int | None = None, max_cores_per_trial: int | None = None, max_nodes: int | None = None, max_trials: int | None = None, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None
Parametreler
Kısa vadede puan geliştirilmiyorsa erken sonlandırmanın etkinleştirilip etkinleştirilmeyileceği varsayılan olarak Yok olur.
Erken durdurma mantığı:
İlk 20 yineleme (yer işaretleri) için erken durdurma yok.
Erken durdurma penceresi 21. yinelemede başlar ve early_stopping_n_iters yinelemeleri arar
(şu anda 10 olarak ayarlanmıştır). Bu, durdurmanın gerçekleşebileceği ilk yinelemenin 31. yineleme olduğu anlamına gelir.
AutoML, erken durdurmadan sonra hala 2 grup yinelemesi zamanlar ve bu da daha yüksek puanlara neden olabilir.
En iyi puanın hesaplanmış mutlak değeri geçmiş için aynıysa erken durdurma tetikleniyor
Yinelemeleri early_stopping_n_iters, yani early_stopping_n_iters yinelemeler için puanda bir gelişme yoksa.
Deneme için hedef puan. Bu puana ulaşıldıktan sonra deneme sonlandırılır. Belirtilmezse (ölçüt yoksa), birincil ölçümde başka bir ilerleme kaydedilmeden deneme çalıştırılır. Çıkış ölçütleri hakkında daha fazla bilgi için bu makaleye bakın. Varsayılan olarak Yok
Bu, paralel olarak yürütülecek en fazla yineleme sayısıdır. Varsayılan değer 1’dir.
- AmlCompute kümeleri düğüm başına çalışan bir yinelemeyi destekler.
Tek bir AmlCompute kümesinde paralel olarak yürütülen birden çok AutoML denemesi üst çalıştırması için, tüm denemelerin değerlerinin max_concurrent_trials
toplamı en fazla düğüm sayısına eşit veya bundan küçük olmalıdır. Aksi takdirde, düğümler kullanılabilir olana kadar çalıştırmalar kuyruğa alınır.
- DSVM düğüm başına birden çok yinelemeyi destekler.
max_concurrent_trials
Gerekir
DSVM'de çekirdek sayısından küçük veya buna eşit olmalıdır. Birden çok denemenin tek bir DSVM üzerinde paralel olarak çalıştırılması için, tüm denemelerin değerlerinin max_concurrent_trials
toplamı en fazla düğüm sayısından küçük veya buna eşit olmalıdır.
- Databricks -
max_concurrent_trials
şu sayıdan küçük veya buna eşit olmalıdır:
Databricks'te çalışan düğümleri.
max_concurrent_trials
yerel çalıştırmalar için geçerli değildir. Daha önce bu parametre olarak adlandırılmıştı concurrent_iterations
.
Belirli bir eğitim yinelemesi için kullanılacak en fazla iş parçacığı sayısı. Kabul edilebilir değerler:
1'den büyük ve işlem hedefi üzerindeki maksimum çekirdek sayısından küçük veya buna eşit.
-1'e eşittir, bu da alt çalıştırma başına yineleme başına tüm olası çekirdekleri kullanmak anlamına gelir.
Varsayılan değer olan 1'e eşittir.
[Deneysel] Dağıtılmış eğitim için kullanılacak en fazla düğüm sayısı.
Tahmin için her model max(2, int(max_nodes / max_concurrent_trials)) düğümleri kullanılarak eğitilir.
Sınıflandırma/regresyon için her model max_nodes düğümler kullanılarak eğitilir.
Not- Bu parametre genel önizleme aşamasındadır ve gelecekte değişebilir.
Otomatik ml denemesi sırasında test edilmesi gereken farklı algoritma ve parametre birleşimlerinin toplam sayısı. Belirtilmezse, varsayılan değer 1000 yinelemedir.
Deneme sonlandırilmeden önce tüm yinelemelerin birleştirildiği dakika cinsinden en uzun süre. Belirtilmezse, varsayılan deneme zaman aşımı 6 gündür. 1 saatten küçük veya buna eşit bir zaman aşımı belirtmek için veri kümenizin boyutunun 10.000.000'den (satır çarpı sütunu) büyük olmadığından veya hata sonuçlarında varsayılan değer Yok olduğundan emin olun
Her yinelemenin sonlandırılabilmesi için çalıştırabileceği en uzun süre (dakika cinsinden). Belirtilmezse, 1 aylık veya 43200 dakikalık bir değer kullanılır ve varsayılan değer Yok olur
Özel durumlar
Dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.
Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.
set_training
Eğitimle ilgili ayarları yapılandırma yöntemi.
set_training(*, enable_onnx_compatible_models: bool | None = None, enable_dnn_training: bool | None = None, enable_model_explainability: bool | None = None, enable_stack_ensemble: bool | None = None, enable_vote_ensemble: bool | None = None, stack_ensemble_settings: StackEnsembleSettings | None = None, ensemble_model_download_timeout: int | None = None, allowed_training_algorithms: List[str] | None = None, blocked_training_algorithms: List[str] | None = None, training_mode: str | TrainingMode | None = None) -> None
Parametreler
ONNX uyumlu modelleri zorunlu tutmanın etkinleştirilip etkinleştirilmeyileceği veya devre dışı bırakılıp bırakılmaymayacağı. Varsayılan değer False'tur. Açık Sinir Ağı Değişimi (ONNX) ve Azure Machine Learning hakkında daha fazla bilgi için bu makaleye bakın.
Model seçimi sırasında DNN tabanlı modellerin dahil edilip edilmeyeceği. Ancak, DNN NLP görevleri için varsayılan değer True, diğer tüm AutoML görevleri için ise False'tur.
Tüm AutoML eğitim yinelemelerinin sonunda en iyi AutoML modelinin açıklanmasının etkinleştirilip etkinleştirilmeyeceğini. Daha fazla bilgi için bkz. Yorumlanabilirlik: otomatik makine öğrenmesinde model açıklamaları. , varsayılan olarak Yok'u kullanır
StackEnsemble yinelemesini etkinleştirme/devre dışı bırakma. enable_onnx_compatible_models bayrağı ayarlanıyorsa StackEnsemble yinelemesi devre dışı bırakılır. Benzer şekilde, Timeseries görevleri için StackEnsemble yinelemesi, meta öğrenciyi sığdırmak için kullanılan küçük eğitim kümesi nedeniyle fazla uygunluk risklerini önlemek için varsayılan olarak devre dışı bırakılır. Topluluklar hakkında daha fazla bilgi için bkz. Grup yapılandırması , varsayılan olarak Yok
VotingEnsemble yinelemesini etkinleştirme/devre dışı bırakma. Topluluklar hakkında daha fazla bilgi için bkz. Grup yapılandırması , varsayılan olarak Yok
- stack_ensemble_settings
- Optional[StackEnsembleSettings]
StackEnsemble yinelemesi ayarları, varsayılan olarak Yok
VotingEnsemble ve StackEnsemble model oluşturma sırasında, önceki alt çalıştırmalardan gelen birden çok uydurılmış model indirilir. Bu parametreyi 300 saniyeden daha yüksek bir değerle yapılandırın, daha fazla zaman gerekiyorsa varsayılan olarak Yok olur
Bir deneme için aranacak model adlarının listesi. Belirtilmezse, görev için desteklenen tüm modeller, TensorFlow modellerinde blocked_training_algorithms
belirtilen veya kullanım dışı bırakılan modellerden çıkarıldığında varsayılan olarak Yok olarak kullanılır
Deneme için yoksayılan algoritmaların listesi, varsayılan olarak Yok
- training_mode
- Optional[Union[str, TabularTrainingMode]]
[Deneysel] Kullanılacak eğitim modu. Olası değerler şunlardır:
distributed- desteklenen algoritmalar için dağıtılmış eğitimi etkinleştirir.
non_distributed- dağıtılmış eğitimi devre dışı bırakır.
auto- Şu anda non_distributed ile aynıdır. Gelecekte bu durum değişebilir.
Not: Bu parametre genel önizleme aşamasındadır ve gelecekte değişebilir.
Özel durumlar
Dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.
Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.
Öznitelikler
base_path
creation_context
Kaynağın oluşturma bağlamı.
Döndürülenler
Kaynağın oluşturma meta verileri.
Dönüş türü
featurization
AutoML işi için tablosal özellik oluşturma ayarlarını alın.
Döndürülenler
AutoML işi için tablosal özellik geliştirme ayarları
Dönüş türü
id
Kaynak kimliği.
Döndürülenler
Kaynağın genel kimliği, Azure Resource Manager (ARM) kimliği.
Dönüş türü
inputs
limits
AutoML işi için tablosal sınırları alın.
Döndürülenler
AutoML işi için tablosal sınırlar
Dönüş türü
log_files
İş çıkış dosyaları.
Döndürülenler
Günlük adlarının ve URL'lerin sözlüğü.
Dönüş türü
log_verbosity
AutoML işi için günlük ayrıntı düzeyini alın.
Döndürülenler
AutoML işi için günlük ayrıntı düzeyi
Dönüş türü
outputs
primary_metric
status
İşin durumu.
Döndürülen yaygın değerler şunlardır: "Çalışıyor", "Tamamlandı" ve "Başarısız". Tüm olası değerler şunlardır:
NotStarted - Bu, istemci tarafı Çalıştırma nesnelerinin bulut göndermeden önce içinde olduğu geçici bir durumdur.
Başlatılıyor - Çalıştırma bulutta işlenmeye başladı. Çağıranın bu noktada bir çalıştırma kimliği vardır.
Sağlama - Belirli bir iş gönderimi için isteğe bağlı işlem oluşturuluyor.
Hazırlanıyor - Çalıştırma ortamı hazırlanıyor ve iki aşamadan birinde:
Docker görüntü derlemesi
conda ortamı kurulumu
Kuyruğa alındı - İş işlem hedefinde kuyruğa alındı. Örneğin, BatchAI'de iş kuyruğa alınmış durumdadır
tüm istenen düğümlerin hazır olmasını beklerken.
Çalışıyor - İş işlem hedefinde çalışmaya başladı.
Son haline getirme - Kullanıcı kodu yürütmesi tamamlandı ve çalıştırma işlem sonrası aşamalarda.
CancelRequested - İş için iptal istendi.
Tamamlandı - Çalıştırma başarıyla tamamlandı. Buna hem kullanıcı kodu yürütme hem de çalıştırma dahildir
işlem sonrası aşamalar.
Başarısız - Çalıştırma başarısız oldu. Genellikle bir çalıştırmadaki Error özelliği nedenine ilişkin ayrıntıları sağlar.
İptal edildi - bir iptal isteği izler ve çalıştırmanın başarıyla iptal edildi olduğunu gösterir.
NotResponding - Sinyallerin etkinleştirildiği çalıştırmalar için yakın zamanda sinyal gönderilmedi.
Döndürülenler
İşin durumu.
Dönüş türü
studio_url
Azure ML studio uç noktası.
Döndürülenler
İş ayrıntıları sayfasının URL'si.
Dönüş türü
task_type
Görev türünü alma.
Döndürülenler
Çalıştırılacak görevin türü. Olası değerler şunlardır: "sınıflandırma", "regresyon", "tahmin".
Dönüş türü
test_data
training
training_data
type
validation_data
Azure SDK for Python
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin