DataDriftDetector Klasse

Referenz

Definiert eine Datendriftüberwachung, die zum Ausführen von Datendriftaufträgen in Azure Machine Learning verwendet werden kann.

Mit der DataDriftDetector-Klasse können Sie eine Drift zwischen einer bestimmten Baseline und dem Zieldataset identifizieren. Ein DataDriftDetector-Objekt wird in einem Arbeitsbereich durch direkte Angabe der Baseline und der Zieldatasets erstellt. Weitere Informationen finden Sie unter https://aka.ms/datadrift.

Datadriftdetector-Konstruktor.

Der DataDriftDetector-Konstruktor wird verwendet, um eine Clouddarstellung eines DataDriftDetector-Objekts abzurufen, das dem bereitgestellten Arbeitsbereich zugeordnet ist.

Vererbung: builtins.object

DataDriftDetector

Konstruktor

DataDriftDetector(workspace, name=None, baseline_dataset=None, target_dataset=None, compute_target=None, frequency=None, feature_list=None, alert_config=None, drift_threshold=None, latency=None)

Parameter

Name	Beschreibung
workspace Erforderlich	Workspace Der Arbeitsbereich, in dem das DataDriftDetector-Objekt erstellt werden soll.
name	str Ein eindeutiger Name für das DataDriftDetector-Objekt. Standardwert: None
baseline_dataset	TabularDataset Das Dataset, mit dem das Zieldataset verglichen werden soll. Standardwert: None
target_dataset	TabularDataset Das Dataset, für das Ad-hoc- oder geplante DataDrift-Aufträge ausgeführt werden sollen. Muss eine Zeitreihe sein. Standardwert: None
compute_target	ComputeTarget oder str Optionales Azure Machine Learning-Computeziel oder Name des Computeziels. Der DataDriftDetector erstellt ein Computeziel, wenn keines angegeben wird. Standardwert: None
frequency	str Eine optionale Häufigkeit, die angibt, wie oft die Pipeline ausgeführt wird. Die unterstützten Werte sind „Day“, „Week“ und „Month“. Standardwert: None
feature_list	list[str] Optionale Features auf der Positivliste, für die die Datendrifterkennung ausgeführt werden soll. Wenn keine `feature_list` angegeben ist, werden DataDriftDetector-Aufträge für alle Features ausgeführt. Die Featureliste kann Zeichen, Zahlen, Bindestriche und Leerzeichen enthalten. Die Liste darf nicht mehr als 200 Elemente enthalten. Standardwert: None
alert_config	AlertConfiguration Ein optionales Configuration-Objekt für DataDriftDetector-Warnungen. Standardwert: None
drift_threshold	float Ein optionaler Schwellenwert für das Aktivieren von DataDriftDetector-Warnungen. Der Wert muss zwischen 0 und 1 liegen. Wenn „None“ angegeben wird (Standardwert), wird 0,2 als Wert verwendet. Standardwert: None
latency	int Die Verzögerung in Stunden, bevor Daten im Dataset eingefügt werden. Standardwert: None
workspace Erforderlich	Workspace Der Arbeitsbereich, in dem das DataDriftDetector-Objekt erstellt werden soll.
name Erforderlich	str Ein eindeutiger Name für das DataDriftDetector-Objekt.
baseline_dataset Erforderlich	TabularDataset Das Dataset, mit dem das Zieldataset verglichen werden soll.
target_dataset Erforderlich	TabularDataset Das Dataset, für das Ad-hoc- oder geplante DataDrift-Aufträge ausgeführt werden sollen. Muss eine Zeitreihe sein.
compute_target Erforderlich	ComputeTarget oder str Optionales Azure Machine Learning-Computeziel oder Name des Computeziels. Der DataDriftDetector erstellt ein Computeziel, wenn keines angegeben wird.
frequency Erforderlich	str Eine optionale Häufigkeit, die angibt, wie oft die Pipeline ausgeführt wird. Die unterstützten Werte sind „Day“, „Week“ und „Month“.
feature_list Erforderlich	list[str] Optionale Features auf der Positivliste, für die die Datendrifterkennung ausgeführt werden soll. Wenn keine `feature_list` angegeben ist, werden DataDriftDetector-Aufträge für alle Features ausgeführt. Die Featureliste kann Zeichen, Zahlen, Bindestriche und Leerzeichen enthalten. Die Liste darf nicht mehr als 200 Elemente enthalten.
alert_config Erforderlich	AlertConfiguration Ein optionales Configuration-Objekt für DataDriftDetector-Warnungen.
drift_threshold Erforderlich	float Ein optionaler Schwellenwert für das Aktivieren von DataDriftDetector-Warnungen. Der Wert muss zwischen 0 und 1 liegen. Wenn „None“ angegeben wird (Standardwert), wird 0,2 als Wert verwendet.
latency Erforderlich	int Verzögerung in Stunden, bevor Daten im Dataset eingefügt werden.

Hinweise

Ein DataDriftDetector-Objekt stellt eine Auftragsdefinition für die Datendrift dar, die zum Ausführen von drei Auftragsausführungstypen verwendet werden kann:

Eine Ad-hoc-Ausführung zum Analysieren der Daten eines bestimmten Tags. Weitere Informationen finden Sie im Abschnitt zur run-Methode.
Eine geplante Ausführung in einer Pipeline. Weitere Informationen finden Sie im Abschnitt zur enable_schedule-Methode.
eine Abgleichsausführung zum anzeigen, wie sich Daten im Lauf der Zeit ändern. Weitere Informationen finden Sie unter der backfill-Methode.

Das typische Muster zum Erstellen eines DataDriftDetector-Objekts ist:

Verwenden Sie create_from_datasets, um ein datasetbasiertes DataDriftDetector-Objekt zu erstellen.

Im folgenden Beispiel wird gezeigt, wie Sie ein datasetbasiertes DataDriftDetector-Objekt erstellen.


   from azureml.datadrift import DataDriftDetector, AlertConfiguration

   alert_config = AlertConfiguration(['user@contoso.com']) # replace with your email to recieve alerts from the scheduled pipeline after enabling

   monitor = DataDriftDetector.create_from_datasets(ws, 'weather-monitor', baseline, target,
                                                         compute_target='cpu-cluster',         # compute target for scheduled pipeline and backfills
                                                         frequency='Week',                     # how often to analyze target data
                                                         feature_list=None,                    # list of features to detect drift on
                                                         drift_threshold=None,                 # threshold from 0 to 1 for email alerting
                                                         latency=0,                            # SLA in hours for target data to arrive in the dataset
                                                         alert_config=alert_config)            # email addresses to send alert

Das vollständige Beispiel finden Sie unter https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/work-with-data/datadrift-tutorial/datadrift-tutorial.ipynb.

Der DataDriftDetector-Konstruktor ruft ein vorhandenes Datendriftobjekt ab, das dem Arbeitsbereich zugeordnet ist.

Methoden

backfill	Ausführen eines Abgleichsauftrags mit einem angegebenen Start- und Enddatum. Weitere Informationen zu Datendrift-Abgleichsausführungen finden Sie unter https://aka.ms/datadrift. HINWEIS: Ein Abgleich wird nur für datasetbasierte DataDriftDetector-Objekte unterstützt.
create_from_datasets	Erstellt ein neues DataDriftDetector-Objekt aus einem tabellarischen Baselinedataset und einem Zeitreihen-Zieldataset.
delete	Löschen des Zeitplans für das DataDriftDetector-Objekt.
disable_schedule	Deaktivieren des Zeitplans für das DataDriftDetector-Objekt.
enable_schedule	Erstellt einen Zeitplan zum Ausführen eines datasetbasierten DataDriftDetector-Auftrags.
get_by_name	Abrufen eines eindeutigen DataDriftDetector-Objekts für einen bestimmten Arbeitsbereich und Namen.
get_output	Abrufen eines Tupels mit den Driftergebnissen und Metriken für einen bestimmten DataDriftDetector in einem bestimmten Zeitfenster.
list	Ruft eine Liste der DataDriftDetector-Objekte für den angegebenen Arbeitsbereich und das optionale Dataset ab. HINWEIS: Wenn nur der Parameter `workspace` übergeben wird, werden alle Im Arbeitsbereich definierten DataDriftDetector-Objekte zurückgegeben.
run	Ausführen einer Datendriftanalyse für einen einzelnen Zeitpunkt.
show	Anzeigen des Datendrifttrends in einem bestimmten Zeitbereich. Standardmäßig zeigt diese Methode die letzten 10 Zyklen an. Wenn als Häufigkeit beispielsweise „Day“ (Tag) festgelegt wurde, sind dies die letzten 10 Tage. Wenn als Häufigkeit „Week“ (Woche) festgelegt wurde, sind dies die letzten 10 Wochen.
update	Aktualisieren des Zeitplans, der dem DataDriftDetector-Objekt zugeordnet ist. Optionale Parameterwerte können auf `None` festgelegt werden, andernfalls werden standardmäßig ihre vorhandenen Werte verwendet.

backfill

Ausführen eines Abgleichsauftrags mit einem angegebenen Start- und Enddatum.

Weitere Informationen zu Datendrift-Abgleichsausführungen finden Sie unter https://aka.ms/datadrift.

HINWEIS: Ein Abgleich wird nur für datasetbasierte DataDriftDetector-Objekte unterstützt.

backfill(start_date, end_date, compute_target=None, create_compute_target=False)

Parameter

Name	Beschreibung
start_date Erforderlich	datetime Das Startdatum des Abgleichsauftrags.
end_date Erforderlich	datetime Das Enddatum des Abgleichsauftrags (einschließlich).
compute_target	ComputeTarget oder str Optionales Azure Machine Learning-Computeziel oder Name des Computeziels. Der DataDriftDetector erstellt ein Computeziel, wenn keines angegeben wird. Standardwert: None
create_compute_target	bool Gibt an, ob automatisch ein Azure Machine Learning-Computeziel erstellt wird. Standardwert: False

Gibt zurück

Typ	Beschreibung
Run	Eine DataDriftDetector-Ausführung.

create_from_datasets

Erstellt ein neues DataDriftDetector-Objekt aus einem tabellarischen Baselinedataset und einem Zeitreihen-Zieldataset.

static create_from_datasets(workspace, name, baseline_dataset, target_dataset, compute_target=None, frequency=None, feature_list=None, alert_config=None, drift_threshold=None, latency=None)

Parameter

Name	Beschreibung
workspace Erforderlich	Workspace Der Arbeitsbereich, in dem der DataDriftDetector erstellt werden soll.
name Erforderlich	str Ein eindeutiger Name für das DataDriftDetector-Objekt.
baseline_dataset Erforderlich	TabularDataset Das Dataset, mit dem das Zieldataset verglichen werden soll.
target_dataset Erforderlich	TabularDataset Das Dataset, für das Ad-hoc- oder geplante DataDrift-Aufträge ausgeführt werden sollen. Muss eine Zeitreihe sein.
compute_target	ComputeTarget oder str Optionales Azure Machine Learning-Computeziel oder Name des Computeziels. Der DataDriftDetector erstellt ein Computeziel, wenn keines angegeben wird. Standardwert: None
frequency	str Eine optionale Häufigkeit, die angibt, wie oft die Pipeline ausgeführt wird. Die unterstützten Werte sind „Day“, „Week“ und „Month“. Standardwert: None
feature_list	list[str] Optionale Features auf der Positivliste, für die die Datendrifterkennung ausgeführt werden soll. Wenn keine `feature_list` angegeben ist, werden DataDriftDetector-Aufträge für alle Features ausgeführt. Die Featureliste kann Zeichen, Zahlen, Bindestriche und Leerzeichen enthalten. Die Liste darf nicht mehr als 200 Elemente enthalten. Standardwert: None
alert_config	AlertConfiguration Ein optionales Configuration-Objekt für DataDriftDetector-Warnungen. Standardwert: None
drift_threshold	float Ein optionaler Schwellenwert für das Aktivieren von DataDriftDetector-Warnungen. Der Wert muss zwischen 0 und 1 liegen. Wenn „None“ angegeben wird (Standardwert), wird 0,2 als Wert verwendet. Standardwert: None
latency	int Die Verzögerung in Stunden, bevor Daten im Dataset eingefügt werden. Standardwert: None

Gibt zurück

Typ	Beschreibung
DataDriftDetector	Ein DataDriftDetector-Objekt.

Ausnahmen

Typ	Beschreibung
<xref:KeyError>, <xref:TypeError>, <xref:ValueError>

Hinweise

Mit datasetbasierten DataDriftDetectors können Sie die Datendrift zwischen einem Baselinedataset (muss ein TabularDataset sein) und einem Zieldataset (muss ein Zeitreihendataset sein) berechnen. Ein Zeitreihendataset ist lediglich ein TabularDataset mit der „fine_grain_timestamp“-Eigenschaft. Der DataDriftDetector kann dann Ad-hoc- oder geplante Aufträge ausführen, um zu ermitteln, ob das Zieldataset vom Baselinedataset abweicht.


   from azureml.core import Workspace, Dataset
   from azureml.datadrift import DataDriftDetector

   ws = Workspace.from_config()
   baseline = Dataset.get_by_name(ws, 'my_baseline_dataset')
   target = Dataset.get_by_name(ws, 'my_target_dataset')

   detector = DataDriftDetector.create_from_datasets(workspace=ws,
                                                     name="my_unique_detector_name",
                                                     baseline_dataset=baseline,
                                                     target_dataset=target,
                                                     compute_target_name='my_compute_target',
                                                     frequency="Day",
                                                     feature_list=['my_feature_1', 'my_feature_2'],
                                                     alert_config=AlertConfiguration(email_addresses=['user@contoso.com']),
                                                     drift_threshold=0.3,
                                                     latency=1)

delete

Löschen des Zeitplans für das DataDriftDetector-Objekt.

delete(wait_for_completion=True)

Parameter

Name	Beschreibung
wait_for_completion	bool Gibt an, ob auf den Abschluss des Löschvorgangs gewartet werden soll. Standardwert: True

disable_schedule

Deaktivieren des Zeitplans für das DataDriftDetector-Objekt.

disable_schedule(wait_for_completion=True)

Parameter

Name	Beschreibung
wait_for_completion	bool Gibt an, ob auf den Abschluss des Deaktivierungsvorgangs gewartet werden soll. Standardwert: True

enable_schedule

Erstellt einen Zeitplan zum Ausführen eines datasetbasierten DataDriftDetector-Auftrags.

enable_schedule(create_compute_target=False, wait_for_completion=True)

Parameter

Name	Beschreibung
create_compute_target	bool Gibt an, ob automatisch ein Azure Machine Learning-Computeziel erstellt wird. Standardwert: False
wait_for_completion	bool Gibt an, ob auf den Abschluss des Aktivierungsvorgangs gewartet werden soll. Standardwert: True

get_by_name

Abrufen eines eindeutigen DataDriftDetector-Objekts für einen bestimmten Arbeitsbereich und Namen.

static get_by_name(workspace, name)

Parameter

Name	Beschreibung
workspace Erforderlich	Workspace Der Arbeitsbereich, in dem der DataDriftDetector erstellt wurde.
name Erforderlich	str Der Name des DataDriftDetector-Objekts, das zurückgegeben werden soll.

Gibt zurück

Typ	Beschreibung
DataDriftDetector	Ein DataDriftDetector-Objekt.

get_output

Abrufen eines Tupels mit den Driftergebnissen und Metriken für einen bestimmten DataDriftDetector in einem bestimmten Zeitfenster.

get_output(start_time=None, end_time=None, run_id=None)

Parameter

Name	Beschreibung
start_time	datetime, <xref:optional> Die Startzeit des Ergebnisfensters in UTC. Wenn „None“ (Standardwert) angegeben wird, werden die letzten Ergebnisse des zehnten Zyklus als Startzeit verwendet. Wenn die Häufigkeit des Datendriftzeitplans beispielsweise „Day“ (Tag) lautet, ist `start_time` 10 Tage. Wenn die Häufigkeit „Week“ (Woche) lautet, ist `start_time` 10 Wochen. Standardwert: None
end_time	datetime, <xref:optional> Die Endzeit des Ergebnisfensters in UTC. Wenn „None“ (Standardwert) angegeben ist, wird als Endzeit der aktuelle Tag in UTC verwendet. Standardwert: None
run_id	int, <xref:optional> Eine bestimmte Ausführungs-ID. Standardwert: None

Gibt zurück

Typ	Beschreibung
tuple(list, list)	Ein Tupel mit einer Liste von Driftergebnissen und einer Liste einzelner Datasets und spaltenbasierter Metriken.

Hinweise

Diese Methode gibt je nach Ausführungstyp (Ad-hoc-Ausführung, geplante Ausführung und Abgleichsausführung) ein Tupel mit Driftergebnissen und Metriken für ein Zeitfenster oder eine Ausführungs-ID zurück.

Es gibt nur eine Möglichkeit, die Ergebnisse einer Ad-hoc-Ausführung abzurufen: run_id muss eine gültige GUID sein.
Das Abrufen der Ergebnisse geplanter Ausführungen und Abgleichsausführungen ist auf zwei Arten möglich: entweder durch Zuweisen einer gültigen GUID zu run_id oder durch Zuweisen einer bestimmten start_time und/oder end_time (einschließlich) und Beibehalten der run_id als „None“.
Wenn run_id, start_time und end_time im gleichen Methodenaufruf nicht „None“ sind, wird eine Parametervalidierungsausnahme ausgelöst.

HINWEIS: Geben Sie entweder die Parameter start_time und end_time oder den Parameter run_id an, aber nicht beide.

Mehrere Ergebnisse für dasselbe Zieldatum sind nicht möglich (Zieldatum bedeutet das Startdatum des Zieldatasets bei einer datasetbasierten Drift). Daher ist es erforderlich, doppelte Ergebnisse zu ermitteln und zu verarbeiten. Wenn bei einer datasetbasierten Drift Ergebnisse für dasselbe Zieldatum vorliegen, sind dies doppelte Ergebnisse. Die get_output-Methode dedupliziert alle doppelten Ergebnisse mit einer Regel: Es werden immer die zuletzt generierten Ergebnisse ausgewählt.

Mit der get_output-Methode können Sie alle Ausgaben oder Teilausgaben geplanter Ausführungen in einem bestimmten Zeitbereich zwischen start_time und end_time (Grenzwerte eingeschlossen) abrufen. Sie können auch die Ergebnisse einer einzelnen Ad-hoc-Ausführung einschränken, indem Sie run_id angeben.

Verwenden Sie die folgenden Richtlinien, um die von der get_output-Methode zurückgegebenen Ergebnisse zu interpretieren:

Das Prinzip der Filterung ist „überlappend“: Solange es eine Überschneidung zwischen der tatsächlichen Ergebniszeit (datasetbasiert: Zieldataset [Startdatum, Enddatum]) und dem angegebenen Wert [start_time, end_time] gibt, wird das Ergebnis verwendet.
Wenn es mehrere Ausgaben für ein Zieldatum gibt, da die Driftberechnung mehrmals für diesen Tag ausgeführt wurde, wird standardmäßig nur die neueste Ausgabe ausgewählt.
Da es mehrere Typen einer Datendriftinstanz gibt, können die Inhalte der Ergebnisse unterschiedlich sein.

Für datasetbasierte Ergebnisse sieht die Ausgabe wie folgt aus:


   results : [{'drift_type': 'DatasetBased',
               'result':[{'has_drift': True, 'drift_threshold': 0.3,
                          'start_date': '2019-04-03', 'end_date': '2019-04-04',
                          'base_dataset_id': '4ac144ef-c86d-4c81-b7e5-ea6bbcd2dc7d',
                          'target_dataset_id': '13445141-aaaa-bbbb-cccc-ea23542bcaf9'}]}]
   metrics : [{'drift_type': 'DatasetBased',
               'metrics': [{'schema_version': '0.1',
                            'start_date': '2019-04-03', 'end_date': '2019-04-04',
                            'baseline_dataset_id': '4ac144ef-c86d-4c81-b7e5-ea6bbcd2dc7d',
                            'target_dataset_id': '13445141-aaaa-bbbb-cccc-ea23542bcaf9'
                            'dataset_metrics': [{'name': 'datadrift_coefficient', 'value': 0.53459}],
                            'column_metrics': [{'feature1': [{'name': 'datadrift_contribution',
                                                              'value': 288.0},
                                                             {'name': 'wasserstein_distance',
                                                              'value': 4.858040000000001},
                                                             {'name': 'energy_distance',
                                                              'value': 2.7204799576545313}]}]}]}]

list

Ruft eine Liste der DataDriftDetector-Objekte für den angegebenen Arbeitsbereich und das optionale Dataset ab.

HINWEIS: Wenn nur der Parameter workspace übergeben wird, werden alle Im Arbeitsbereich definierten DataDriftDetector-Objekte zurückgegeben.

static list(workspace, baseline_dataset=None, target_dataset=None)

Parameter

Name	Beschreibung
workspace Erforderlich	Workspace Der Arbeitsbereich, in dem die DataDriftDetector-Objekte erstellt wurden.
baseline_dataset	TabularDataset Baselinedataset zum Filtern der Rückgabeliste. Standardwert: None
target_dataset	TabularDataset Das Zieldataset zum Filtern der Rückgabeliste. Standardwert: None

Gibt zurück

Typ	Beschreibung
list[DataDriftDetector]	Eine Liste der DataDriftDetector-Objekte.

run

Ausführen einer Datendriftanalyse für einen einzelnen Zeitpunkt.

run(target_date, compute_target=None, create_compute_target=False, feature_list=None, drift_threshold=None)

Parameter

Name	Beschreibung
target_date Erforderlich	datetime Das Zieldatum der Bewertungsdaten in UTC.
compute_target	ComputeTarget oder str Optionales Azure Machine Learning-Computeziel oder Name des Computeziels. Wenn kein Wert angegeben wird, wird automatisch ein Computeziel erstellt. Standardwert: None
create_compute_target	bool Gibt an, ob automatisch ein Azure Machine Learning-Computeziel erstellt wird. Standardwert: False
feature_list	list[str] Optionale Features auf der Positivliste, für die die Datendrifterkennung ausgeführt werden soll. Standardwert: None
drift_threshold	float Ein optionaler Schwellenwert für das Aktivieren von DataDriftDetector-Warnungen. Standardwert: None

Gibt zurück

Typ	Beschreibung
Run	Eine DataDriftDetector-Ausführung.

show

Anzeigen des Datendrifttrends in einem bestimmten Zeitbereich.

Standardmäßig zeigt diese Methode die letzten 10 Zyklen an. Wenn als Häufigkeit beispielsweise „Day“ (Tag) festgelegt wurde, sind dies die letzten 10 Tage. Wenn als Häufigkeit „Week“ (Woche) festgelegt wurde, sind dies die letzten 10 Wochen.

show(start_time=None, end_time=None)

Parameter

Name	Beschreibung
start_time	datetime, <xref:optional> Der Anfang des Präsentationszeitfensters in UTC. Wenn „None“ (Standardwert) angegeben wird, werden die letzten Ergebnisse des zehnten Zyklus verwendet. Standardwert: None
end_time	datetime, <xref:optional> Das Ende des Zeitfensters für Präsentationsdaten in UTC. Beim Standardwert „None“ wird das aktuelle Datum verwendet. Standardwert: None

Gibt zurück

Typ	Beschreibung
dict()	Ein Wörterbuch aller Werte. Der Schlüssel ist „service_name“.

update

Aktualisieren des Zeitplans, der dem DataDriftDetector-Objekt zugeordnet ist.

Optionale Parameterwerte können auf None festgelegt werden, andernfalls werden standardmäßig ihre vorhandenen Werte verwendet.

update(compute_target=Ellipsis, feature_list=Ellipsis, schedule_start=Ellipsis, alert_config=Ellipsis, drift_threshold=Ellipsis, wait_for_completion=True)

Parameter

Name	Beschreibung
compute_target	ComputeTarget oder str Optionales Azure Machine Learning-Computeziel oder Name des Computeziels. Wenn dieser Parameter nicht angegeben wird, erstellt der DataDriftDetector ein Computeziel. Standardwert: Ellipsis
feature_list	list[str] Features auf der Positivliste, für die die Datendrifterkennung ausgeführt werden soll. Standardwert: Ellipsis
schedule_start	datetime Die Startzeit des Datendriftzeitplans in UTC. Standardwert: Ellipsis
alert_config	AlertConfiguration Ein optionales Configuration-Objekt für DataDriftDetector-Warnungen. Standardwert: Ellipsis
drift_threshold	float Der Schwellenwert für das Aktivieren von DataDriftDetector-Warnungen. Standardwert: Ellipsis
wait_for_completion	bool Gibt an, ob auf den Abschluss der Vorgänge zum Aktivieren, Deaktivieren oder Löschen gewartet werden soll. Standardwert: True

Gibt zurück

Typ	Beschreibung
DataDriftDetector	self

Attribute

alert_config

Abrufen der Warnungskonfiguration des DataDriftDetector-Objekts.

Gibt zurück

Typ	Beschreibung
AlertConfiguration	Ein AlertConfiguration-Objekt.

baseline_dataset

Ruft das Baselinedataset ab, das dem DataDriftDetector-Objekt zugeordnet ist.

Gibt zurück

Typ	Beschreibung
TabularDataset	Der Datasettyp des Baselinedatasets.

compute_target

Abrufen des Computeziels, das an das DataDriftDetector-Objekt angefügt ist.

Gibt zurück

Typ	Beschreibung
ComputeTarget	Das Computeziel.

drift_threshold

Abrufen des Driftschwellenwerts des DataDriftDetector-Objekts.

Gibt zurück

Typ	Beschreibung
float	Der Driftschwellenwert.

drift_type

Ruft den Typ von DataDriftDetector ab. Derzeit wird nur der Wert „DatasetBased“ unterstützt.

Gibt zurück

Typ	Beschreibung
str	Der Typ des DataDriftDetector-Objekts.

enabled

Abrufen des booleschen Werts, der angibt, ob das DataDriftDetector-Objekt aktiviert ist.

Gibt zurück

Typ	Beschreibung
bool	Ein boolescher Wert. TRUE für aktiviert.

feature_list

Abrufen der Liste der Features auf der Positivliste für das DataDriftDetector-Objekt.

Gibt zurück

Typ	Beschreibung
list[str]	Eine Liste der Featurenamen

frequency

Abrufen der Häufigkeit des DataDriftDetector-Zeitplans.

Gibt zurück

Typ	Beschreibung
str	Eine Zeichenfolge, entweder „Day“, „Week“ oder „Month“.

interval

Abrufen des Intervalls des DataDriftDetector-Zeitplans.

Gibt zurück

Typ	Beschreibung
int	Ein ganzzahliger Wert in der Zeiteinheit.

latency

Ruft die Latenz von Aufträgen im DataDriftDetector-Zeitplan (in Stunden) ab.

Gibt zurück

Typ	Beschreibung
int	Die Anzahl von Stunden, die die Latenz darstellen.

name

Abrufen des Namens des DataDriftDetector-Objekts.

Gibt zurück

Typ	Beschreibung
str	Der DataDriftDetector-Name.

schedule_start

Ruft die Startzeit des Zeitplans ab.

Gibt zurück

Typ	Beschreibung
datetime	Ein datetime-Objekt der geplanten Startzeit in UTC.

state

Gibt den Status des DataDriftDetector-Zeitplans an.

Gibt zurück

Typ	Beschreibung
str	Mögliche Werte: „Disabled“, „Enabled“, „Deleted“, „Disabling“, „Enabling“, „Deleting“, „Failed“, „DisableFailed“, „EnableFailed“, „DeleteFailed“.

target_dataset

Ruft das Zieldataset ab, das dem DataDriftDetector-Objekt zugeordnet ist.

Gibt zurück

Typ	Beschreibung
TabularDataset	Der Datasettyp des Baselinedatasets.

workspace

Abrufen des Arbeitsbereichs des DataDriftDetector-Objekts.

Gibt zurück

Typ	Beschreibung
Workspace	Der Arbeitsbereich, in dem das DataDriftDetector-Objekt erstellt wurde.

Freigeben über

DataDriftDetector Klasse

Konstruktor

Parameter

Hinweise

Methoden

backfill

Parameter

Gibt zurück

create_from_datasets

Parameter

Gibt zurück

Ausnahmen

Hinweise

delete

Parameter

disable_schedule

Parameter

enable_schedule

Parameter

get_by_name

Parameter

Gibt zurück

get_output

Parameter

Gibt zurück

Hinweise

list

Parameter

Gibt zurück

run

Parameter

Gibt zurück

show

Parameter

Gibt zurück

update

Parameter

Gibt zurück

Attribute

alert_config

Gibt zurück

baseline_dataset

Gibt zurück

compute_target

Gibt zurück

drift_threshold

Gibt zurück

drift_type

Gibt zurück

enabled

Gibt zurück

feature_list

Gibt zurück

frequency

Gibt zurück

interval

Gibt zurück

latency

Gibt zurück

name

Gibt zurück

schedule_start

Gibt zurück

state

Gibt zurück

target_dataset

Gibt zurück

workspace

Gibt zurück

Feedback

Feedback

Zusätzliche Ressourcen