Freigeben über


DataDriftDetector Klasse

Definiert eine Datendriftüberwachung, die zum Ausführen von Datendriftaufträgen in Azure Machine Learning verwendet werden kann.

Mit der DataDriftDetector-Klasse können Sie eine Drift zwischen einer bestimmten Baseline und dem Zieldataset identifizieren. Ein DataDriftDetector-Objekt wird in einem Arbeitsbereich durch direkte Angabe der Baseline und der Zieldatasets erstellt. Weitere Informationen finden Sie unter https://aka.ms/datadrift.

Datadriftdetector-Konstruktor.

Der DataDriftDetector-Konstruktor wird verwendet, um eine Clouddarstellung eines DataDriftDetector-Objekts abzurufen, das dem bereitgestellten Arbeitsbereich zugeordnet ist.

Vererbung
builtins.object
DataDriftDetector

Konstruktor

DataDriftDetector(workspace, name=None, baseline_dataset=None, target_dataset=None, compute_target=None, frequency=None, feature_list=None, alert_config=None, drift_threshold=None, latency=None)

Parameter

Name Beschreibung
workspace
Erforderlich

Der Arbeitsbereich, in dem das DataDriftDetector-Objekt erstellt werden soll.

name
str

Ein eindeutiger Name für das DataDriftDetector-Objekt.

Standardwert: None
baseline_dataset

Das Dataset, mit dem das Zieldataset verglichen werden soll.

Standardwert: None
target_dataset

Das Dataset, für das Ad-hoc- oder geplante DataDrift-Aufträge ausgeführt werden sollen. Muss eine Zeitreihe sein.

Standardwert: None
compute_target

Optionales Azure Machine Learning-Computeziel oder Name des Computeziels. Der DataDriftDetector erstellt ein Computeziel, wenn keines angegeben wird.

Standardwert: None
frequency
str

Eine optionale Häufigkeit, die angibt, wie oft die Pipeline ausgeführt wird. Die unterstützten Werte sind „Day“, „Week“ und „Month“.

Standardwert: None
feature_list

Optionale Features auf der Positivliste, für die die Datendrifterkennung ausgeführt werden soll. Wenn keine feature_list angegeben ist, werden DataDriftDetector-Aufträge für alle Features ausgeführt. Die Featureliste kann Zeichen, Zahlen, Bindestriche und Leerzeichen enthalten. Die Liste darf nicht mehr als 200 Elemente enthalten.

Standardwert: None
alert_config

Ein optionales Configuration-Objekt für DataDriftDetector-Warnungen.

Standardwert: None
drift_threshold

Ein optionaler Schwellenwert für das Aktivieren von DataDriftDetector-Warnungen. Der Wert muss zwischen 0 und 1 liegen. Wenn „None“ angegeben wird (Standardwert), wird 0,2 als Wert verwendet.

Standardwert: None
latency
int

Die Verzögerung in Stunden, bevor Daten im Dataset eingefügt werden.

Standardwert: None
workspace
Erforderlich

Der Arbeitsbereich, in dem das DataDriftDetector-Objekt erstellt werden soll.

name
Erforderlich
str

Ein eindeutiger Name für das DataDriftDetector-Objekt.

baseline_dataset
Erforderlich

Das Dataset, mit dem das Zieldataset verglichen werden soll.

target_dataset
Erforderlich

Das Dataset, für das Ad-hoc- oder geplante DataDrift-Aufträge ausgeführt werden sollen. Muss eine Zeitreihe sein.

compute_target
Erforderlich

Optionales Azure Machine Learning-Computeziel oder Name des Computeziels. Der DataDriftDetector erstellt ein Computeziel, wenn keines angegeben wird.

frequency
Erforderlich
str

Eine optionale Häufigkeit, die angibt, wie oft die Pipeline ausgeführt wird. Die unterstützten Werte sind „Day“, „Week“ und „Month“.

feature_list
Erforderlich

Optionale Features auf der Positivliste, für die die Datendrifterkennung ausgeführt werden soll. Wenn keine feature_list angegeben ist, werden DataDriftDetector-Aufträge für alle Features ausgeführt. Die Featureliste kann Zeichen, Zahlen, Bindestriche und Leerzeichen enthalten. Die Liste darf nicht mehr als 200 Elemente enthalten.

alert_config
Erforderlich

Ein optionales Configuration-Objekt für DataDriftDetector-Warnungen.

drift_threshold
Erforderlich

Ein optionaler Schwellenwert für das Aktivieren von DataDriftDetector-Warnungen. Der Wert muss zwischen 0 und 1 liegen. Wenn „None“ angegeben wird (Standardwert), wird 0,2 als Wert verwendet.

latency
Erforderlich
int

Verzögerung in Stunden, bevor Daten im Dataset eingefügt werden.

Hinweise

Ein DataDriftDetector-Objekt stellt eine Auftragsdefinition für die Datendrift dar, die zum Ausführen von drei Auftragsausführungstypen verwendet werden kann:

  • Eine Ad-hoc-Ausführung zum Analysieren der Daten eines bestimmten Tags. Weitere Informationen finden Sie im Abschnitt zur run-Methode.

  • Eine geplante Ausführung in einer Pipeline. Weitere Informationen finden Sie im Abschnitt zur enable_schedule-Methode.

  • eine Abgleichsausführung zum anzeigen, wie sich Daten im Lauf der Zeit ändern. Weitere Informationen finden Sie unter der backfill-Methode.

Das typische Muster zum Erstellen eines DataDriftDetector-Objekts ist:

  • Verwenden Sie create_from_datasets, um ein datasetbasiertes DataDriftDetector-Objekt zu erstellen.

Im folgenden Beispiel wird gezeigt, wie Sie ein datasetbasiertes DataDriftDetector-Objekt erstellen.


   from azureml.datadrift import DataDriftDetector, AlertConfiguration

   alert_config = AlertConfiguration(['user@contoso.com']) # replace with your email to recieve alerts from the scheduled pipeline after enabling

   monitor = DataDriftDetector.create_from_datasets(ws, 'weather-monitor', baseline, target,
                                                         compute_target='cpu-cluster',         # compute target for scheduled pipeline and backfills
                                                         frequency='Week',                     # how often to analyze target data
                                                         feature_list=None,                    # list of features to detect drift on
                                                         drift_threshold=None,                 # threshold from 0 to 1 for email alerting
                                                         latency=0,                            # SLA in hours for target data to arrive in the dataset
                                                         alert_config=alert_config)            # email addresses to send alert

Das vollständige Beispiel finden Sie unter https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/work-with-data/datadrift-tutorial/datadrift-tutorial.ipynb.

Der DataDriftDetector-Konstruktor ruft ein vorhandenes Datendriftobjekt ab, das dem Arbeitsbereich zugeordnet ist.

Methoden

backfill

Ausführen eines Abgleichsauftrags mit einem angegebenen Start- und Enddatum.

Weitere Informationen zu Datendrift-Abgleichsausführungen finden Sie unter https://aka.ms/datadrift.

HINWEIS: Ein Abgleich wird nur für datasetbasierte DataDriftDetector-Objekte unterstützt.

create_from_datasets

Erstellt ein neues DataDriftDetector-Objekt aus einem tabellarischen Baselinedataset und einem Zeitreihen-Zieldataset.

delete

Löschen des Zeitplans für das DataDriftDetector-Objekt.

disable_schedule

Deaktivieren des Zeitplans für das DataDriftDetector-Objekt.

enable_schedule

Erstellt einen Zeitplan zum Ausführen eines datasetbasierten DataDriftDetector-Auftrags.

get_by_name

Abrufen eines eindeutigen DataDriftDetector-Objekts für einen bestimmten Arbeitsbereich und Namen.

get_output

Abrufen eines Tupels mit den Driftergebnissen und Metriken für einen bestimmten DataDriftDetector in einem bestimmten Zeitfenster.

list

Ruft eine Liste der DataDriftDetector-Objekte für den angegebenen Arbeitsbereich und das optionale Dataset ab.

HINWEIS: Wenn nur der Parameter workspace übergeben wird, werden alle Im Arbeitsbereich definierten DataDriftDetector-Objekte zurückgegeben.

run

Ausführen einer Datendriftanalyse für einen einzelnen Zeitpunkt.

show

Anzeigen des Datendrifttrends in einem bestimmten Zeitbereich.

Standardmäßig zeigt diese Methode die letzten 10 Zyklen an. Wenn als Häufigkeit beispielsweise „Day“ (Tag) festgelegt wurde, sind dies die letzten 10 Tage. Wenn als Häufigkeit „Week“ (Woche) festgelegt wurde, sind dies die letzten 10 Wochen.

update

Aktualisieren des Zeitplans, der dem DataDriftDetector-Objekt zugeordnet ist.

Optionale Parameterwerte können auf None festgelegt werden, andernfalls werden standardmäßig ihre vorhandenen Werte verwendet.

backfill

Ausführen eines Abgleichsauftrags mit einem angegebenen Start- und Enddatum.

Weitere Informationen zu Datendrift-Abgleichsausführungen finden Sie unter https://aka.ms/datadrift.

HINWEIS: Ein Abgleich wird nur für datasetbasierte DataDriftDetector-Objekte unterstützt.

backfill(start_date, end_date, compute_target=None, create_compute_target=False)

Parameter

Name Beschreibung
start_date
Erforderlich

Das Startdatum des Abgleichsauftrags.

end_date
Erforderlich

Das Enddatum des Abgleichsauftrags (einschließlich).

compute_target

Optionales Azure Machine Learning-Computeziel oder Name des Computeziels. Der DataDriftDetector erstellt ein Computeziel, wenn keines angegeben wird.

Standardwert: None
create_compute_target

Gibt an, ob automatisch ein Azure Machine Learning-Computeziel erstellt wird.

Standardwert: False

Gibt zurück

Typ Beschreibung
Run

Eine DataDriftDetector-Ausführung.

create_from_datasets

Erstellt ein neues DataDriftDetector-Objekt aus einem tabellarischen Baselinedataset und einem Zeitreihen-Zieldataset.

static create_from_datasets(workspace, name, baseline_dataset, target_dataset, compute_target=None, frequency=None, feature_list=None, alert_config=None, drift_threshold=None, latency=None)

Parameter

Name Beschreibung
workspace
Erforderlich

Der Arbeitsbereich, in dem der DataDriftDetector erstellt werden soll.

name
Erforderlich
str

Ein eindeutiger Name für das DataDriftDetector-Objekt.

baseline_dataset
Erforderlich

Das Dataset, mit dem das Zieldataset verglichen werden soll.

target_dataset
Erforderlich

Das Dataset, für das Ad-hoc- oder geplante DataDrift-Aufträge ausgeführt werden sollen. Muss eine Zeitreihe sein.

compute_target

Optionales Azure Machine Learning-Computeziel oder Name des Computeziels. Der DataDriftDetector erstellt ein Computeziel, wenn keines angegeben wird.

Standardwert: None
frequency
str

Eine optionale Häufigkeit, die angibt, wie oft die Pipeline ausgeführt wird. Die unterstützten Werte sind „Day“, „Week“ und „Month“.

Standardwert: None
feature_list

Optionale Features auf der Positivliste, für die die Datendrifterkennung ausgeführt werden soll. Wenn keine feature_list angegeben ist, werden DataDriftDetector-Aufträge für alle Features ausgeführt. Die Featureliste kann Zeichen, Zahlen, Bindestriche und Leerzeichen enthalten. Die Liste darf nicht mehr als 200 Elemente enthalten.

Standardwert: None
alert_config

Ein optionales Configuration-Objekt für DataDriftDetector-Warnungen.

Standardwert: None
drift_threshold

Ein optionaler Schwellenwert für das Aktivieren von DataDriftDetector-Warnungen. Der Wert muss zwischen 0 und 1 liegen. Wenn „None“ angegeben wird (Standardwert), wird 0,2 als Wert verwendet.

Standardwert: None
latency
int

Die Verzögerung in Stunden, bevor Daten im Dataset eingefügt werden.

Standardwert: None

Gibt zurück

Typ Beschreibung

Ein DataDriftDetector-Objekt.

Ausnahmen

Typ Beschreibung
<xref:KeyError>, <xref:TypeError>, <xref:ValueError>

Hinweise

Mit datasetbasierten DataDriftDetectors können Sie die Datendrift zwischen einem Baselinedataset (muss ein TabularDataset sein) und einem Zieldataset (muss ein Zeitreihendataset sein) berechnen. Ein Zeitreihendataset ist lediglich ein TabularDataset mit der „fine_grain_timestamp“-Eigenschaft. Der DataDriftDetector kann dann Ad-hoc- oder geplante Aufträge ausführen, um zu ermitteln, ob das Zieldataset vom Baselinedataset abweicht.


   from azureml.core import Workspace, Dataset
   from azureml.datadrift import DataDriftDetector

   ws = Workspace.from_config()
   baseline = Dataset.get_by_name(ws, 'my_baseline_dataset')
   target = Dataset.get_by_name(ws, 'my_target_dataset')

   detector = DataDriftDetector.create_from_datasets(workspace=ws,
                                                     name="my_unique_detector_name",
                                                     baseline_dataset=baseline,
                                                     target_dataset=target,
                                                     compute_target_name='my_compute_target',
                                                     frequency="Day",
                                                     feature_list=['my_feature_1', 'my_feature_2'],
                                                     alert_config=AlertConfiguration(email_addresses=['user@contoso.com']),
                                                     drift_threshold=0.3,
                                                     latency=1)

delete

Löschen des Zeitplans für das DataDriftDetector-Objekt.

delete(wait_for_completion=True)

Parameter

Name Beschreibung
wait_for_completion

Gibt an, ob auf den Abschluss des Löschvorgangs gewartet werden soll.

Standardwert: True

disable_schedule

Deaktivieren des Zeitplans für das DataDriftDetector-Objekt.

disable_schedule(wait_for_completion=True)

Parameter

Name Beschreibung
wait_for_completion

Gibt an, ob auf den Abschluss des Deaktivierungsvorgangs gewartet werden soll.

Standardwert: True

enable_schedule

Erstellt einen Zeitplan zum Ausführen eines datasetbasierten DataDriftDetector-Auftrags.

enable_schedule(create_compute_target=False, wait_for_completion=True)

Parameter

Name Beschreibung
create_compute_target

Gibt an, ob automatisch ein Azure Machine Learning-Computeziel erstellt wird.

Standardwert: False
wait_for_completion

Gibt an, ob auf den Abschluss des Aktivierungsvorgangs gewartet werden soll.

Standardwert: True

get_by_name

Abrufen eines eindeutigen DataDriftDetector-Objekts für einen bestimmten Arbeitsbereich und Namen.

static get_by_name(workspace, name)

Parameter

Name Beschreibung
workspace
Erforderlich

Der Arbeitsbereich, in dem der DataDriftDetector erstellt wurde.

name
Erforderlich
str

Der Name des DataDriftDetector-Objekts, das zurückgegeben werden soll.

Gibt zurück

Typ Beschreibung

Ein DataDriftDetector-Objekt.

get_output

Abrufen eines Tupels mit den Driftergebnissen und Metriken für einen bestimmten DataDriftDetector in einem bestimmten Zeitfenster.

get_output(start_time=None, end_time=None, run_id=None)

Parameter

Name Beschreibung
start_time
datetime, <xref:optional>

Die Startzeit des Ergebnisfensters in UTC. Wenn „None“ (Standardwert) angegeben wird, werden die letzten Ergebnisse des zehnten Zyklus als Startzeit verwendet. Wenn die Häufigkeit des Datendriftzeitplans beispielsweise „Day“ (Tag) lautet, ist start_time 10 Tage. Wenn die Häufigkeit „Week“ (Woche) lautet, ist start_time 10 Wochen.

Standardwert: None
end_time
datetime, <xref:optional>

Die Endzeit des Ergebnisfensters in UTC. Wenn „None“ (Standardwert) angegeben ist, wird als Endzeit der aktuelle Tag in UTC verwendet.

Standardwert: None
run_id
int, <xref:optional>

Eine bestimmte Ausführungs-ID.

Standardwert: None

Gibt zurück

Typ Beschreibung

Ein Tupel mit einer Liste von Driftergebnissen und einer Liste einzelner Datasets und spaltenbasierter Metriken.

Hinweise

Diese Methode gibt je nach Ausführungstyp (Ad-hoc-Ausführung, geplante Ausführung und Abgleichsausführung) ein Tupel mit Driftergebnissen und Metriken für ein Zeitfenster oder eine Ausführungs-ID zurück.

  • Es gibt nur eine Möglichkeit, die Ergebnisse einer Ad-hoc-Ausführung abzurufen: run_id muss eine gültige GUID sein.

  • Das Abrufen der Ergebnisse geplanter Ausführungen und Abgleichsausführungen ist auf zwei Arten möglich: entweder durch Zuweisen einer gültigen GUID zu run_id oder durch Zuweisen einer bestimmten start_time und/oder end_time (einschließlich) und Beibehalten der run_id als „None“.

  • Wenn run_id, start_time und end_time im gleichen Methodenaufruf nicht „None“ sind, wird eine Parametervalidierungsausnahme ausgelöst.

HINWEIS: Geben Sie entweder die Parameter start_time und end_time oder den Parameter run_id an, aber nicht beide.

Mehrere Ergebnisse für dasselbe Zieldatum sind nicht möglich (Zieldatum bedeutet das Startdatum des Zieldatasets bei einer datasetbasierten Drift). Daher ist es erforderlich, doppelte Ergebnisse zu ermitteln und zu verarbeiten. Wenn bei einer datasetbasierten Drift Ergebnisse für dasselbe Zieldatum vorliegen, sind dies doppelte Ergebnisse. Die get_output-Methode dedupliziert alle doppelten Ergebnisse mit einer Regel: Es werden immer die zuletzt generierten Ergebnisse ausgewählt.

Mit der get_output-Methode können Sie alle Ausgaben oder Teilausgaben geplanter Ausführungen in einem bestimmten Zeitbereich zwischen start_time und end_time (Grenzwerte eingeschlossen) abrufen. Sie können auch die Ergebnisse einer einzelnen Ad-hoc-Ausführung einschränken, indem Sie run_id angeben.

Verwenden Sie die folgenden Richtlinien, um die von der get_output-Methode zurückgegebenen Ergebnisse zu interpretieren:

  • Das Prinzip der Filterung ist „überlappend“: Solange es eine Überschneidung zwischen der tatsächlichen Ergebniszeit (datasetbasiert: Zieldataset [Startdatum, Enddatum]) und dem angegebenen Wert [start_time, end_time] gibt, wird das Ergebnis verwendet.

  • Wenn es mehrere Ausgaben für ein Zieldatum gibt, da die Driftberechnung mehrmals für diesen Tag ausgeführt wurde, wird standardmäßig nur die neueste Ausgabe ausgewählt.

  • Da es mehrere Typen einer Datendriftinstanz gibt, können die Inhalte der Ergebnisse unterschiedlich sein.

Für datasetbasierte Ergebnisse sieht die Ausgabe wie folgt aus:


   results : [{'drift_type': 'DatasetBased',
               'result':[{'has_drift': True, 'drift_threshold': 0.3,
                          'start_date': '2019-04-03', 'end_date': '2019-04-04',
                          'base_dataset_id': '4ac144ef-c86d-4c81-b7e5-ea6bbcd2dc7d',
                          'target_dataset_id': '13445141-aaaa-bbbb-cccc-ea23542bcaf9'}]}]
   metrics : [{'drift_type': 'DatasetBased',
               'metrics': [{'schema_version': '0.1',
                            'start_date': '2019-04-03', 'end_date': '2019-04-04',
                            'baseline_dataset_id': '4ac144ef-c86d-4c81-b7e5-ea6bbcd2dc7d',
                            'target_dataset_id': '13445141-aaaa-bbbb-cccc-ea23542bcaf9'
                            'dataset_metrics': [{'name': 'datadrift_coefficient', 'value': 0.53459}],
                            'column_metrics': [{'feature1': [{'name': 'datadrift_contribution',
                                                              'value': 288.0},
                                                             {'name': 'wasserstein_distance',
                                                              'value': 4.858040000000001},
                                                             {'name': 'energy_distance',
                                                              'value': 2.7204799576545313}]}]}]}]

list

Ruft eine Liste der DataDriftDetector-Objekte für den angegebenen Arbeitsbereich und das optionale Dataset ab.

HINWEIS: Wenn nur der Parameter workspace übergeben wird, werden alle Im Arbeitsbereich definierten DataDriftDetector-Objekte zurückgegeben.

static list(workspace, baseline_dataset=None, target_dataset=None)

Parameter

Name Beschreibung
workspace
Erforderlich

Der Arbeitsbereich, in dem die DataDriftDetector-Objekte erstellt wurden.

baseline_dataset

Baselinedataset zum Filtern der Rückgabeliste.

Standardwert: None
target_dataset

Das Zieldataset zum Filtern der Rückgabeliste.

Standardwert: None

Gibt zurück

Typ Beschreibung

Eine Liste der DataDriftDetector-Objekte.

run

Ausführen einer Datendriftanalyse für einen einzelnen Zeitpunkt.

run(target_date, compute_target=None, create_compute_target=False, feature_list=None, drift_threshold=None)

Parameter

Name Beschreibung
target_date
Erforderlich

Das Zieldatum der Bewertungsdaten in UTC.

compute_target

Optionales Azure Machine Learning-Computeziel oder Name des Computeziels. Wenn kein Wert angegeben wird, wird automatisch ein Computeziel erstellt.

Standardwert: None
create_compute_target

Gibt an, ob automatisch ein Azure Machine Learning-Computeziel erstellt wird.

Standardwert: False
feature_list

Optionale Features auf der Positivliste, für die die Datendrifterkennung ausgeführt werden soll.

Standardwert: None
drift_threshold

Ein optionaler Schwellenwert für das Aktivieren von DataDriftDetector-Warnungen.

Standardwert: None

Gibt zurück

Typ Beschreibung
Run

Eine DataDriftDetector-Ausführung.

show

Anzeigen des Datendrifttrends in einem bestimmten Zeitbereich.

Standardmäßig zeigt diese Methode die letzten 10 Zyklen an. Wenn als Häufigkeit beispielsweise „Day“ (Tag) festgelegt wurde, sind dies die letzten 10 Tage. Wenn als Häufigkeit „Week“ (Woche) festgelegt wurde, sind dies die letzten 10 Wochen.

show(start_time=None, end_time=None)

Parameter

Name Beschreibung
start_time
datetime, <xref:optional>

Der Anfang des Präsentationszeitfensters in UTC. Wenn „None“ (Standardwert) angegeben wird, werden die letzten Ergebnisse des zehnten Zyklus verwendet.

Standardwert: None
end_time
datetime, <xref:optional>

Das Ende des Zeitfensters für Präsentationsdaten in UTC. Beim Standardwert „None“ wird das aktuelle Datum verwendet.

Standardwert: None

Gibt zurück

Typ Beschreibung
dict()

Ein Wörterbuch aller Werte. Der Schlüssel ist „service_name“.

update

Aktualisieren des Zeitplans, der dem DataDriftDetector-Objekt zugeordnet ist.

Optionale Parameterwerte können auf None festgelegt werden, andernfalls werden standardmäßig ihre vorhandenen Werte verwendet.

update(compute_target=Ellipsis, feature_list=Ellipsis, schedule_start=Ellipsis, alert_config=Ellipsis, drift_threshold=Ellipsis, wait_for_completion=True)

Parameter

Name Beschreibung
compute_target

Optionales Azure Machine Learning-Computeziel oder Name des Computeziels. Wenn dieser Parameter nicht angegeben wird, erstellt der DataDriftDetector ein Computeziel.

Standardwert: Ellipsis
feature_list

Features auf der Positivliste, für die die Datendrifterkennung ausgeführt werden soll.

Standardwert: Ellipsis
schedule_start

Die Startzeit des Datendriftzeitplans in UTC.

Standardwert: Ellipsis
alert_config

Ein optionales Configuration-Objekt für DataDriftDetector-Warnungen.

Standardwert: Ellipsis
drift_threshold

Der Schwellenwert für das Aktivieren von DataDriftDetector-Warnungen.

Standardwert: Ellipsis
wait_for_completion

Gibt an, ob auf den Abschluss der Vorgänge zum Aktivieren, Deaktivieren oder Löschen gewartet werden soll.

Standardwert: True

Gibt zurück

Typ Beschreibung

self

Attribute

alert_config

Abrufen der Warnungskonfiguration des DataDriftDetector-Objekts.

Gibt zurück

Typ Beschreibung

Ein AlertConfiguration-Objekt.

baseline_dataset

Ruft das Baselinedataset ab, das dem DataDriftDetector-Objekt zugeordnet ist.

Gibt zurück

Typ Beschreibung

Der Datasettyp des Baselinedatasets.

compute_target

Abrufen des Computeziels, das an das DataDriftDetector-Objekt angefügt ist.

Gibt zurück

Typ Beschreibung

Das Computeziel.

drift_threshold

Abrufen des Driftschwellenwerts des DataDriftDetector-Objekts.

Gibt zurück

Typ Beschreibung

Der Driftschwellenwert.

drift_type

Ruft den Typ von DataDriftDetector ab. Derzeit wird nur der Wert „DatasetBased“ unterstützt.

Gibt zurück

Typ Beschreibung
str

Der Typ des DataDriftDetector-Objekts.

enabled

Abrufen des booleschen Werts, der angibt, ob das DataDriftDetector-Objekt aktiviert ist.

Gibt zurück

Typ Beschreibung

Ein boolescher Wert. TRUE für aktiviert.

feature_list

Abrufen der Liste der Features auf der Positivliste für das DataDriftDetector-Objekt.

Gibt zurück

Typ Beschreibung

Eine Liste der Featurenamen

frequency

Abrufen der Häufigkeit des DataDriftDetector-Zeitplans.

Gibt zurück

Typ Beschreibung
str

Eine Zeichenfolge, entweder „Day“, „Week“ oder „Month“.

interval

Abrufen des Intervalls des DataDriftDetector-Zeitplans.

Gibt zurück

Typ Beschreibung
int

Ein ganzzahliger Wert in der Zeiteinheit.

latency

Ruft die Latenz von Aufträgen im DataDriftDetector-Zeitplan (in Stunden) ab.

Gibt zurück

Typ Beschreibung
int

Die Anzahl von Stunden, die die Latenz darstellen.

name

Abrufen des Namens des DataDriftDetector-Objekts.

Gibt zurück

Typ Beschreibung
str

Der DataDriftDetector-Name.

schedule_start

Ruft die Startzeit des Zeitplans ab.

Gibt zurück

Typ Beschreibung

Ein datetime-Objekt der geplanten Startzeit in UTC.

state

Gibt den Status des DataDriftDetector-Zeitplans an.

Gibt zurück

Typ Beschreibung
str

Mögliche Werte: „Disabled“, „Enabled“, „Deleted“, „Disabling“, „Enabling“, „Deleting“, „Failed“, „DisableFailed“, „EnableFailed“, „DeleteFailed“.

target_dataset

Ruft das Zieldataset ab, das dem DataDriftDetector-Objekt zugeordnet ist.

Gibt zurück

Typ Beschreibung

Der Datasettyp des Baselinedatasets.

workspace

Abrufen des Arbeitsbereichs des DataDriftDetector-Objekts.

Gibt zurück

Typ Beschreibung

Der Arbeitsbereich, in dem das DataDriftDetector-Objekt erstellt wurde.