LocationClosestSelector Klasse

Definiert einen Join von Kundendaten mit öffentlichen Daten anhand der Kriterien des kürzesten sphärischen Abstands.

Initialisieren Sie mit Standortgranularität.

Vererbung
LocationClosestSelector

Konstruktor

LocationClosestSelector(_granularity: LocationClosestGranularity, enable_telemetry: bool = True)

Parameter

_granularity
LocationClosestGranularity
Erforderlich

Eine Standortgranularität, die beim Verbinden von Daten verwendet werden soll.

enable_telemetry
bool
Standardwert: True

Gibt an, ob Telemetrie aktiviert werden soll.

Hinweise

Die statische Methode process(self, env, customer_data, public_data, aggregator, join_keys, debug) wird verwendet, um die Daten basierend auf diesem Selektor zu verknüpfen. Dabei gilt Folgendes:

  • customer_data ist eine Instanz von „azureml.opendatasets.accessories.location_data.LocationData“.

  • public_data ist eine Instanz von „azureml.opendatasets.accessories.location_data.LocationData“.

  • aggregator ist einer der Aggregatoren in „azureml.opendatasets.aggregators.aggregator.Aggregator“.

  • join_keys ist eine Liste mit Joinschlüsselpaaren.

  • debug gibt an, ob Debugprotokolle ausgegeben werden sollen.

Diese Methode gibt ein Tupel aus einer geänderten Instanz der Kundendatenklasse, einer geänderten Instanz der öffentlichen Datenklasse und einer Liste von Joinschlüsselpaaren zurück.

Methoden

process

Verknüpfen von Kundendaten und öffentlichen Daten mithilfe des angegebenen Aggregators.

process

Verknüpfen von Kundendaten und öffentlichen Daten mithilfe des angegebenen Aggregators.

process(env: SparkEnv | PandasEnv, customer_data: LocationData, public_data: LocationData, aggregator: Aggregator, join_keys: list, debug: bool)

Parameter

env
RuntimeEnv
Erforderlich

Die Laufzeitumgebung.

customer_data
LocationData
Erforderlich

Eine Instanz einer von LocationData abgeleiteten Klasse.

public_data
LocationData
Erforderlich

Eine Instanz einer von LocationData abgeleiteten Klasse.

aggregator
Aggregator
Erforderlich

Ein Aggregator.

join_keys
list
Erforderlich

Eine Liste von Joinschlüsselpaaren

debug
bool
Erforderlich

Gibt an, ob Debugprotokolle ausgegeben werden sollen.

Gibt zurück

Ein Tupel aus einer geänderten Instanz der Kundendatenklasse, einer geänderten Instanz der öffentlichen Datenklasse und einer Liste von Joinschlüsselpaaren.

Rückgabetyp