Sdílet prostřednictvím


AbstractDataset Třída

Základní třída datových sad ve službě Azure Machine Learning

Odkazujte na TabularDatasetFactory třídu a FileDatasetFactory třídu a vytvořte instance datové sady.

Třída AbstractDataset konstruktor.

Tento konstruktor by neměl být vyvolán přímo. Datová sada je určená k vytvoření pomocí TabularDatasetFactory třídy a FileDatasetFactory třídy.

Konstruktor

AbstractDataset()

Metody

add_tags

Přidejte páry klíč-hodnota do slovníku značek této datové sady.

as_named_input

Zadejte název této datové sady, která se použije k načtení materializované datové sady při spuštění.

get_all

Získejte všechny registrované datové sady v pracovním prostoru.

get_by_id

Získejte datovou sadu, která se uloží do pracovního prostoru.

get_by_name

Získá registrovanou datovou sadu z pracovního prostoru podle názvu registrace.

get_partition_key_values

Vrátí jedinečné hodnoty klíče partition_keys.

Ověřte, jestli je partition_keys platnou podmnožinou celé sady klíčů oddílů, vrátí jedinečné hodnoty klíče partition_keys. Výchozí hodnota vrátí jedinečné kombinace kláves tak, že vezme úplnou sadu klíčů oddílů této datové sady, pokud partition_keys není žádná.


   # get all partition key value pairs
   partitions = ds.get_partition_key_values()
   # Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]

   partitions = ds.get_partition_key_values(['country'])
   # Return [{'country': 'US'}]
register

Zaregistrujte datovou sadu do zadaného pracovního prostoru.

remove_tags

Odeberte zadané klíče ze slovníku značek této datové sady.

unregister_all_versions

Zrušit registraci všech verzí pod názvem registrace této datové sady z pracovního prostoru.

update

Proveďte místní aktualizaci datové sady.

add_tags

Přidejte páry klíč-hodnota do slovníku značek této datové sady.

add_tags(tags=None)

Parametry

Name Description
tags
Vyžadováno

Slovník značek, které chcete přidat.

Návraty

Typ Description

Aktualizovaný objekt datové sady.

as_named_input

Zadejte název této datové sady, která se použije k načtení materializované datové sady při spuštění.

as_named_input(name)

Parametry

Name Description
name
Vyžadováno
str

Název datové sady pro spuštění.

Návraty

Typ Description

Objekt konfigurace popisující, jak má být datová sada materializována při spuštění.

Poznámky

Tento název bude použitelný jenom v rámci spuštění služby Azure Machine Learning. Název musí obsahovat pouze alfanumerické znaky a podtržítka, aby bylo možné ho zpřístupnit jako proměnnou prostředí. Tento název můžete použít k načtení datové sady v kontextu spuštění pomocí dvou přístupů:

  • Proměnná prostředí:

    Název bude název proměnné prostředí a materializovaná datová sada bude zpřístupněna jako hodnota proměnné prostředí. Pokud se datová sada stáhne nebo připojí, hodnota bude stažená nebo připojená cesta. Například:


   # in your job submission notebook/script:
   dataset.as_named_input('foo').as_download('/tmp/dataset')

   # in the script that will be executed in the run
   import os
   path = os.environ['foo'] # path will be /tmp/dataset

Poznámka:

Pokud je datová sada nastavená na přímý režim, bude hodnotou ID datové sady. Pak můžete

načtení objektu datové sady provedením Dataset.get_by_id(os.environ['foo'])

  • Run.input_datasets:

    Toto je slovník, ve kterém klíč bude název datové sady, který jste zadali v této metodě, a hodnota bude materializovaná datová sada. Pro staženou a připojenou datovou sadu bude hodnota stahovaná nebo připojená cesta. V případě přímého režimu bude hodnota stejný objekt datové sady, který jste zadali ve skriptu pro odeslání úlohy.


   # in your job submission notebook/script:
   dataset.as_named_input('foo') # direct mode

   # in the script that will be executed in the run
   run = Run.get_context()
   run.input_datasets['foo'] # this returns the dataset object from above.

get_all

Získejte všechny registrované datové sady v pracovním prostoru.

static get_all(workspace)

Parametry

Name Description
workspace
Vyžadováno

Existující pracovní prostor AzureML, ve kterém byly datové sady zaregistrovány.

Návraty

Typ Description

Slovník objektů TabularDataset a FileDataset klíčovaných podle názvu registrace.

get_by_id

Získejte datovou sadu, která se uloží do pracovního prostoru.

static get_by_id(workspace, id, **kwargs)

Parametry

Name Description
workspace
Vyžadováno

Existující pracovní prostor AzureML, ve kterém je datová sada uložená.

id
Vyžadováno
str

ID datové sady.

Návraty

Typ Description

Objekt datové sady. Pokud je datová sada zaregistrovaná, vrátí se také její název registrace a verze.

get_by_name

Získá registrovanou datovou sadu z pracovního prostoru podle názvu registrace.

static get_by_name(workspace, name, version='latest', **kwargs)

Parametry

Name Description
workspace
Vyžadováno

Existující pracovní prostor AzureML, ve kterém byla datová sada zaregistrována.

name
Vyžadováno
str

Název registrace.

version
Vyžadováno
int

Verze registrace. Výchozí hodnota je nejnovější.

Návraty

Typ Description

Registrovaný objekt datové sady.

get_partition_key_values

Vrátí jedinečné hodnoty klíče partition_keys.

Ověřte, jestli je partition_keys platnou podmnožinou celé sady klíčů oddílů, vrátí jedinečné hodnoty klíče partition_keys. Výchozí hodnota vrátí jedinečné kombinace kláves tak, že vezme úplnou sadu klíčů oddílů této datové sady, pokud partition_keys není žádná.


   # get all partition key value pairs
   partitions = ds.get_partition_key_values()
   # Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]

   partitions = ds.get_partition_key_values(['country'])
   # Return [{'country': 'US'}]
get_partition_key_values(partition_keys=None)

Parametry

Name Description
partition_keys
Vyžadováno

klíče oddílů

register

Zaregistrujte datovou sadu do zadaného pracovního prostoru.

register(workspace, name, description=None, tags=None, create_new_version=False)

Parametry

Name Description
workspace
Vyžadováno

Pracovní prostor pro registraci datové sady.

name
Vyžadováno
str

Název pro registraci datové sady.

description
Vyžadováno
str

Textový popis datové sady. Výchozí hodnota je Žádná.

tags
Vyžadováno

Slovník značek klíč-hodnota pro poskytnutí datové sady Výchozí hodnota je Žádná.

create_new_version
Vyžadováno

Logická hodnota pro registraci datové sady jako nové verze pod zadaným názvem.

Návraty

Typ Description

Registrovaný objekt datové sady.

remove_tags

Odeberte zadané klíče ze slovníku značek této datové sady.

remove_tags(tags=None)

Parametry

Name Description
tags
Vyžadováno

Seznam klíčů, které chcete odebrat.

Návraty

Typ Description

Aktualizovaný objekt datové sady.

unregister_all_versions

Zrušit registraci všech verzí pod názvem registrace této datové sady z pracovního prostoru.

unregister_all_versions()

Poznámky

Operace nemění žádná zdrojová data.

update

Proveďte místní aktualizaci datové sady.

update(description=None, tags=None)

Parametry

Name Description
description
Vyžadováno
str

Nový popis, který se má použít pro datovou sadu. Tento popis nahrazuje existující popis. Výchozí hodnota je existující popis. Pokud chcete vymazat popis, zadejte prázdný řetězec.

tags
Vyžadováno

Slovník značek, pomocí které se datová sada aktualizuje. Tyto značky nahrazují stávající značky pro datovou sadu. Výchozí hodnota je existující značky. Pokud chcete vymazat značky, zadejte prázdný slovník.

Návraty

Typ Description

Aktualizovaný objekt datové sady.

Atributy

data_changed_time

Vrátí čas změny zdrojových dat.

Návraty

Typ Description

Čas, kdy k poslední změně došlo u zdrojových dat.

Poznámky

Čas změny dat je k dispozici pro souborový zdroj dat. Žádné se nevrátí, pokud zdroj dat není podporovaný pro kontrolu, kdy došlo ke změně.

description

Vrátí popis registrace.

Návraty

Typ Description
str

Popis datové sady

id

Vrátí identifikátor datové sady.

Návraty

Typ Description
str

ID datové sady. Pokud datová sada není uložena do žádného pracovního prostoru, ID bude Žádné.

name

Vrátí název registrace.

Návraty

Typ Description
str

Název datové sady

partition_keys

Vrátí klíče oddílu.

Návraty

Typ Description

klíče oddílu

tags

Vrátí registrační značky.

Návraty

Typ Description
str

Značky datových sad

version

Vraťte registrační verzi.

Návraty

Typ Description
int

Verze datové sady