Share via


ClassificationJob Sınıf

AutoML Sınıflandırma İşi yapılandırması.

Yeni bir AutoML Sınıflandırma görevi başlatın.

Devralma
azure.ai.ml.entities._job.automl.tabular.automl_tabular.AutoMLTabular
ClassificationJob

Oluşturucu

ClassificationJob(*, primary_metric: str | None = None, positive_label: str | None = None, **kwargs)

Parametreler

primary_metric
Optional[str]

İyileştirme için kullanılacak birincil ölçüm varsayılan olarak Yok'tur

positive_label
Optional[str]

İkili ölçüm hesaplaması için pozitif etiket, varsayılan değer Yok

featurization
Optional[TabularFeaturizationSettings]

Özellik geliştirme ayarları. Varsayılan değer Yok'tur.

limits
Optional[TabularLimitSettings]

Ayarları sınırlar. Varsayılan değer Yok'tur.

training
Optional[TrainingSettings]

Eğitim ayarları. Varsayılan değer Yok'tur.

primary_metric
Optional[str]

İyileştirme için kullanılacak birincil ölçüm varsayılan olarak Yok'tur

positive_label
Optional[str]

İkili ölçüm hesaplaması için pozitif etiket, varsayılan değer Yok

featurization
Optional[TabularFeaturizationSettings]

özellik geliştirme ayarları. Varsayılan değer Yok'tur.

limits
Optional[TabularLimitSettings]

ayarları sınırlar. Varsayılan değer Yok'tur.

training
Optional[TrainingSettings]

eğitim ayarlarına bakın. Varsayılan değer Yok'tur.

Yöntemler

dump

İş içeriğini YAML biçiminde bir dosyaya dökümünü alır.

set_data

Veri yapılandırmasını tanımlama.

set_featurization

Özellik mühendisliği yapılandırmasını tanımlama.

set_limits

İş için sınırlar ayarlayın.

set_training

Eğitimle ilgili ayarları yapılandırma yöntemi.

dump

İş içeriğini YAML biçiminde bir dosyaya dökümünü alır.

dump(dest: str | PathLike | IO, **kwargs) -> None

Parametreler

dest
Union[<xref:PathLike>, str, IO[AnyStr]]
Gerekli

YAML içeriğinin yazılabileceği yerel yol veya dosya akışı. Dest bir dosya yoluysa, yeni bir dosya oluşturulur. Dest açık bir dosyaysa, dosya doğrudan öğesine yazılır.

kwargs
dict

YAML seri hale getiricisine geçirecek ek bağımsız değişkenler.

Özel durumlar

dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

set_data

Veri yapılandırmasını tanımlama.

set_data(*, training_data: Input, target_column_name: str, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None) -> None

Parametreler

training_data
Input

Eğitim verileri.

target_column_name
str

Hedef sütunun sütun adı.

weight_column_name
Optional[str]

Ağırlık sütun adı, varsayılan olarak Yok

validation_data
Optional[Input]

Doğrulama verileri, varsayılan olarak Yok olarak belirlenir

validation_data_size
Optional[float]

Doğrulama veri boyutu, varsayılan olarak Yok

n_cross_validations
Optional[Union[str, int]]

n_cross_validations, varsayılan olarak Yok'u kullanır

cv_split_column_names
Optional[List[str]]

cv_split_column_names, varsayılan olarak Yok'u kullanır

test_data
Optional[Input]

Test verileri, varsayılan olarak Yok

test_data_size
Optional[float]

Test verisi boyutu, varsayılan olarak Yok

Özel durumlar

dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

set_featurization

Özellik mühendisliği yapılandırmasını tanımlama.

set_featurization(*, blocked_transformers: List[BlockedTransformers | str] | None = None, column_name_and_types: Dict[str, str] | None = None, dataset_language: str | None = None, transformer_params: Dict[str, List[ColumnTransformer]] | None = None, mode: str | None = None, enable_dnn_featurization: bool | None = None) -> None

Parametreler

blocked_transformers
Optional[List[Union[BlockedTransformers, str]]]

Özellik geliştirme sırasında engellenecek transformatör adlarının listesi, varsayılan olarak Yok olur

column_name_and_types
Optional[Dict[str, str]]

Sütun amacını güncelleştirmek için kullanılan sütun adlarının ve özellik türlerinin sözlüğü varsayılan olarak Yok'tur

dataset_language
Optional[str]

Veri kümesinde yer alan diller için üç karakterli ISO 639-3 kodu. İngilizce dışındaki diller yalnızca GPU özellikli işlem kullanıyorsanız desteklenir. Veri kümesi birden çok dil içeriyorsa "mul" language_code kullanılmalıdır. Farklı diller için ISO 639-3 kodlarını bulmak için lütfen adresine bakın https://en.wikipedia.org/wiki/List_of_ISO_639-3_codes, varsayılan olarak Yok

transformer_params
Optional[Dict[str, List[ColumnTransformer]]]

Transformatör sözlüğü ve karşılık gelen özelleştirme parametreleri, varsayılan olarak Yok olarak ayarlı

mode
Optional[str]

"off", "auto", defaults to "auto", defaults to None

enable_dnn_featurization
Optional[bool]

DNN tabanlı özellik mühendisliği yöntemlerinin dahil edilip edilmeyeceği, varsayılan olarak Yok olur

Özel durumlar

dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

set_limits

İş için sınırlar ayarlayın.

set_limits(*, enable_early_termination: bool | None = None, exit_score: float | None = None, max_concurrent_trials: int | None = None, max_cores_per_trial: int | None = None, max_nodes: int | None = None, max_trials: int | None = None, timeout_minutes: int | None = None, trial_timeout_minutes: int | None = None) -> None

Parametreler

enable_early_termination
Optional[bool]

Puan kısa vadede geliştirilmiyorsa erken sonlandırmanın etkinleştirilip etkinleştirilmeyileceği varsayılan olarak Yok olur.

Erken durdurma mantığı:

  • İlk 20 yineleme (yer işaretleri) için erken durdurma yoktur.

  • Erken durdurma penceresi 21. yinelemede başlar ve early_stopping_n_iters yinelemeleri arar

    (şu anda 10 olarak ayarlanmıştır). Bu, durdurmanın gerçekleşebileceği ilk yinelemenin 31. yineleme olduğu anlamına gelir.

  • AutoML hala erken durdurmadan sonra 2 grup yinelemesi zamanlar ve bu da daha yüksek puanlara neden olabilir.

  • En iyi puanın hesaplanmış mutlak değeri geçmiş için aynıysa erken durdurma tetikleniyor

    early_stopping_n_iters yinelemeler, yani early_stopping_n_iters yinelemeler için puanda bir gelişme yoksa.

exit_score
Optional[float]

Deneme için hedef puan. Bu puana ulaşıldıktan sonra deneme sonlandırılır. Belirtilmezse (ölçüt yoksa), birincil ölçümde başka bir ilerleme kaydedilmeden deneme çalıştırılır. Çıkış ölçütleri hakkında daha fazla bilgi için bu makaleye bakın, varsayılan olarak Yok'u kullanır

max_concurrent_trials
Optional[int]

Bu, paralel olarak yürütülecek en fazla yineleme sayısıdır. Varsayılan değer 1’dir.

  • AmlCompute kümeleri düğüm başına çalışan bir yinelemeyi destekler.

Tek bir AmlCompute kümesinde paralel olarak yürütülen birden çok AutoML denemesi üst çalıştırması için, tüm denemelerin değerlerinin max_concurrent_trials toplamı en fazla düğüm sayısına eşit veya bundan küçük olmalıdır. Aksi takdirde, düğümler kullanılabilir olana kadar çalıştırmalar kuyruğa alınır.

  • DSVM düğüm başına birden çok yinelemeyi destekler. max_concurrent_trials Gerekir

DSVM'de çekirdek sayısından küçük veya buna eşit olmalıdır. Birden çok denemenin tek bir DSVM üzerinde paralel olarak çalıştırılması için, tüm denemelerin değerlerinin max_concurrent_trials toplamı en fazla düğüm sayısından küçük veya buna eşit olmalıdır.

  • Databricks - max_concurrent_trials şu sayıdan küçük veya buna eşit olmalıdır:

Databricks'te çalışan düğümleri.

max_concurrent_trials yerel çalıştırmalar için geçerli değildir. Daha önce bu parametre olarak adlandırılmıştı concurrent_iterations.

max_cores_per_trial
Optional[int]

Belirli bir eğitim yinelemesi için kullanılacak en fazla iş parçacığı sayısı. Kabul edilebilir değerler:

  • 1'den büyük ve işlem hedefi üzerindeki maksimum çekirdek sayısından küçük veya buna eşit.

  • -1'e eşittir, bu da alt çalıştırma başına yineleme başına tüm olası çekirdekleri kullanmak anlamına gelir.

  • Varsayılan değer olan 1'e eşittir.

max_nodes
Optional[int]

[Deneysel] Dağıtılmış eğitim için kullanılacak en fazla düğüm sayısı.

  • Tahmin için her model max(2, int(max_nodes / max_concurrent_trials)) düğümleri kullanılarak eğitilir.

  • Sınıflandırma/regresyon için her model max_nodes düğümler kullanılarak eğitilir.

Not- Bu parametre genel önizleme aşamasındadır ve gelecekte değişebilir.

max_trials
Optional[int]

Otomatik ml denemesi sırasında test edilmesi gereken farklı algoritma ve parametre birleşimlerinin toplam sayısı. Belirtilmezse, varsayılan değer 1000 yinelemedir.

timeout_minutes
Optional[int]

Deneme sonlandırilmeden önce tüm yinelemelerin birleştirildiği dakika cinsinden en uzun süre. Belirtilmezse, varsayılan deneme zaman aşımı 6 gündür. 1 saatten küçük veya buna eşit bir zaman aşımı belirtmek için veri kümenizin boyutunun 10.000.000'den (satır çarpı sütunu) büyük olmadığından veya hata sonuçlarında varsayılan değer Yok olduğundan emin olun

trial_timeout_minutes
Optional[int]

Her yinelemenin sonlandırılabilmesi için çalıştırabileceği en uzun süre (dakika cinsinden). Belirtilmezse, 1 aylık veya 43200 dakikalık bir değer kullanılır ve varsayılan değer Yok olur

Özel durumlar

dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

set_training

Eğitimle ilgili ayarları yapılandırma yöntemi.

set_training(*, enable_onnx_compatible_models: bool | None = None, enable_dnn_training: bool | None = None, enable_model_explainability: bool | None = None, enable_stack_ensemble: bool | None = None, enable_vote_ensemble: bool | None = None, stack_ensemble_settings: StackEnsembleSettings | None = None, ensemble_model_download_timeout: int | None = None, allowed_training_algorithms: List[str] | None = None, blocked_training_algorithms: List[str] | None = None, training_mode: str | TrainingMode | None = None) -> None

Parametreler

enable_onnx_compatible_models
Optional[bool]

ONNX uyumlu modelleri zorunlu tutmanın etkinleştirilip etkinleştirilmeyileceği veya devre dışı bırakılıp bırakılmaymayacağı. Varsayılan değer False'tur. Açık Sinir Ağı Değişimi (ONNX) ve Azure Machine Learning hakkında daha fazla bilgi için bu makaleye bakın.

enable_dnn_training
Optional[bool]

Model seçimi sırasında DNN tabanlı modellerin dahil edilip edilmeyeceği. Ancak, DNN NLP görevleri için varsayılan değer True, diğer tüm AutoML görevleri için ise False'tur.

enable_model_explainability
Optional[bool]

Tüm AutoML eğitim yinelemelerinin sonunda en iyi AutoML modelinin açıklanmasının etkinleştirilip etkinleştirilmeyeceğini. Daha fazla bilgi için bkz. Yorumlanabilirlik: otomatik makine öğrenmesinde model açıklamaları. , varsayılan olarak Yok'u kullanır

enable_stack_ensemble
Optional[bool]

StackEnsemble yinelemesini etkinleştirme/devre dışı bırakma. enable_onnx_compatible_models bayrağı ayarlanıyorsa StackEnsemble yinelemesi devre dışı bırakılır. Benzer şekilde, Timeseries görevleri için StackEnsemble yinelemesi, meta öğrenciyi sığdırmak için kullanılan küçük eğitim kümesi nedeniyle fazla uygunluk risklerini önlemek için varsayılan olarak devre dışı bırakılır. Topluluklar hakkında daha fazla bilgi için bkz. Grup yapılandırması , varsayılan olarak Yok

enable_vote_ensemble
Optional[bool]

VotingEnsemble yinelemesini etkinleştirme/devre dışı bırakma. Topluluklar hakkında daha fazla bilgi için bkz. Grup yapılandırması , varsayılan olarak Yok

stack_ensemble_settings
Optional[StackEnsembleSettings]

StackEnsemble yinelemesi ayarları, varsayılan olarak Yok

ensemble_model_download_timeout
Optional[int]

VotingEnsemble ve StackEnsemble model oluşturma sırasında, önceki alt çalıştırmalardan gelen birden çok uydurılmış model indirilir. Bu parametreyi 300 saniyeden daha yüksek bir değerle yapılandırın, daha fazla zaman gerekiyorsa varsayılan olarak Yok olur

allowed_training_algorithms
Optional[List[str]]

Bir deneme için aranacak model adlarının listesi. Belirtilmezse, görev için desteklenen tüm modeller, TensorFlow modellerinde blocked_training_algorithms belirtilen veya kullanım dışı bırakılan modellerden çıkarıldığında varsayılan olarak Yok olarak kullanılır

blocked_training_algorithms
Optional[List[str]]

Deneme için yoksayılan algoritmaların listesi, varsayılan olarak Yok

training_mode
Optional[Union[str, TabularTrainingMode]]

[Deneysel] Kullanılacak eğitim modu. Olası değerler şunlardır:

  • distributed- desteklenen algoritmalar için dağıtılmış eğitimi etkinleştirir.

  • non_distributed- dağıtılmış eğitimi devre dışı bırakır.

  • auto- Şu anda non_distributed ile aynıdır. Gelecekte bu durum değişebilir.

Not: Bu parametre genel önizleme aşamasındadır ve gelecekte değişebilir.

Özel durumlar

dest bir dosya yoluysa ve dosya zaten varsa oluşturulur.

Dest açık bir dosyaysa ve dosya yazılabilir değilse oluşturulur.

Öznitelikler

base_path

Kaynağın temel yolu.

Döndürülenler

Kaynağın temel yolu.

Dönüş türü

str

creation_context

Kaynağın oluşturma bağlamı.

Döndürülenler

Kaynağın oluşturma meta verileri.

Dönüş türü

featurization

AutoML işi için tablo özellik kazandırma ayarlarını alın.

Döndürülenler

AutoML işi için tablosal özellik geliştirme ayarları

Dönüş türü

id

Kaynak kimliği.

Döndürülenler

Kaynağın genel kimliği, azure Resource Manager (ARM) kimliği.

Dönüş türü

inputs

limits

AutoML işi için tablosal sınırları alma.

Döndürülenler

AutoML işi için tablosal sınırlar

Dönüş türü

log_files

İş çıktı dosyaları.

Döndürülenler

Günlük adlarının ve URL'lerin sözlüğü.

Dönüş türü

log_verbosity

AutoML işi için günlük ayrıntı düzeyini alın.

Döndürülenler

AutoML işi için günlük ayrıntı düzeyi

Dönüş türü

<xref:LogVerbosity>

outputs

primary_metric

İyileştirme için kullanılacak birincil ölçüm.

Döndürülenler

İyileştirme için kullanılacak birincil ölçüm.

Dönüş türü

status

İşin durumu.

Döndürülen yaygın değerler şunlardır: "Çalışıyor", "Tamamlandı" ve "Başarısız". Tüm olası değerler şunlardır:

  • NotStarted - Bu, istemci tarafı Run nesnelerinin bulut göndermeden önce içinde olduğu geçici bir durumdur.

  • Başlatılıyor - Çalıştırma bulutta işlenmeye başladı. Çağıranın bu noktada bir çalıştırma kimliği vardır.

  • Sağlama - Belirli bir iş gönderimi için isteğe bağlı işlem oluşturuluyor.

  • Hazırlanıyor - Çalıştırma ortamı hazırlanıyor ve iki aşamadan birinde:

    • Docker görüntü derlemesi

    • conda ortamı kurulumu

  • Kuyruğa alındı - İş, işlem hedefinde kuyruğa alınır. Örneğin BatchAI'de iş kuyruğa alınmış durumdadır

    tüm istenen düğümlerin hazır olmasını beklerken.

  • Çalışıyor - İş işlem hedefinde çalışmaya başladı.

  • Sonlandırma - Kullanıcı kodu yürütmesi tamamlandı ve çalıştırma işlem sonrası aşamalarda.

  • CancelRequested - İş için iptal istendi.

  • Tamamlandı - Çalıştırma başarıyla tamamlandı. Buna hem kullanıcı kodu yürütme hem de çalıştırma dahildir

    işlem sonrası aşamalar.

  • Başarısız - Çalıştırma başarısız oldu. Genellikle bir çalıştırmadaki Error özelliği nedenine ilişkin ayrıntıları sağlar.

  • İptal edildi - İptal isteğini izler ve çalıştırmanın artık başarıyla iptal edilmiş olduğunu gösterir.

  • NotResponding - Sinyallerin etkinleştirildiği çalıştırmalar için yakın zamanda sinyal gönderilmedi.

Döndürülenler

İşin durumu.

Dönüş türü

studio_url

Azure ML studio uç noktası.

Döndürülenler

İş ayrıntıları sayfasının URL'si.

Dönüş türü

task_type

Görev türünü alma.

Döndürülenler

Çalıştırılacak görevin türü. Olası değerler şunlardır: "sınıflandırma", "regresyon", "tahmin".

Dönüş türü

str

test_data

Test verilerini alın.

Döndürülenler

Veri girişini test edin

Dönüş türü

training

AutoML Sınıflandırma İşi için Eğitim Ayarları.

Döndürülenler

AutoML Sınıflandırma İşi için kullanılan eğitim ayarları.

Dönüş türü

<xref:ClassificationTrainingSettings>

training_data

Eğitim verilerini alın.

Döndürülenler

Eğitim verileri girişi

Dönüş türü

type

İşin türü.

Döndürülenler

İşin türü.

Dönüş türü

validation_data

Doğrulama verilerini alma.

Döndürülenler

Doğrulama veri girişi

Dönüş türü