AbstractDataset Třída
Základní třída datových sad ve službě Azure Machine Learning
Odkazujte na TabularDatasetFactory třídu a FileDatasetFactory třídu a vytvořte instance datové sady.
Třída AbstractDataset konstruktor.
Tento konstruktor by neměl být vyvolán přímo. Datová sada je určená k vytvoření pomocí TabularDatasetFactory třídy a FileDatasetFactory třídy.
Konstruktor
AbstractDataset()
Metody
| add_tags |
Přidejte páry klíč-hodnota do slovníku značek této datové sady. |
| as_named_input |
Zadejte název této datové sady, která se použije k načtení materializované datové sady při spuštění. |
| get_all |
Získejte všechny registrované datové sady v pracovním prostoru. |
| get_by_id |
Získejte datovou sadu, která se uloží do pracovního prostoru. |
| get_by_name |
Získá registrovanou datovou sadu z pracovního prostoru podle názvu registrace. |
| get_partition_key_values |
Vrátí jedinečné hodnoty klíče partition_keys. Ověřte, jestli je partition_keys platnou podmnožinou celé sady klíčů oddílů, vrátí jedinečné hodnoty klíče partition_keys. Výchozí hodnota vrátí jedinečné kombinace kláves tak, že vezme úplnou sadu klíčů oddílů této datové sady, pokud partition_keys není žádná.
|
| register |
Zaregistrujte datovou sadu do zadaného pracovního prostoru. |
| remove_tags |
Odeberte zadané klíče ze slovníku značek této datové sady. |
| unregister_all_versions |
Zrušit registraci všech verzí pod názvem registrace této datové sady z pracovního prostoru. |
| update |
Proveďte místní aktualizaci datové sady. |
add_tags
Přidejte páry klíč-hodnota do slovníku značek této datové sady.
add_tags(tags=None)
Parametry
| Name | Description |
|---|---|
|
tags
Vyžadováno
|
Slovník značek, které chcete přidat. |
Návraty
| Typ | Description |
|---|---|
|
Aktualizovaný objekt datové sady. |
as_named_input
Zadejte název této datové sady, která se použije k načtení materializované datové sady při spuštění.
as_named_input(name)
Parametry
| Name | Description |
|---|---|
|
name
Vyžadováno
|
Název datové sady pro spuštění. |
Návraty
| Typ | Description |
|---|---|
|
Objekt konfigurace popisující, jak má být datová sada materializována při spuštění. |
Poznámky
Tento název bude použitelný jenom v rámci spuštění služby Azure Machine Learning. Název musí obsahovat pouze alfanumerické znaky a podtržítka, aby bylo možné ho zpřístupnit jako proměnnou prostředí. Tento název můžete použít k načtení datové sady v kontextu spuštění pomocí dvou přístupů:
Proměnná prostředí:
Název bude název proměnné prostředí a materializovaná datová sada bude zpřístupněna jako hodnota proměnné prostředí. Pokud se datová sada stáhne nebo připojí, hodnota bude stažená nebo připojená cesta. Například:
# in your job submission notebook/script:
dataset.as_named_input('foo').as_download('/tmp/dataset')
# in the script that will be executed in the run
import os
path = os.environ['foo'] # path will be /tmp/dataset
Poznámka:
Pokud je datová sada nastavená na přímý režim, bude hodnotou ID datové sady. Pak můžete
načtení objektu datové sady provedením Dataset.get_by_id(os.environ['foo'])
Run.input_datasets:
Toto je slovník, ve kterém klíč bude název datové sady, který jste zadali v této metodě, a hodnota bude materializovaná datová sada. Pro staženou a připojenou datovou sadu bude hodnota stahovaná nebo připojená cesta. V případě přímého režimu bude hodnota stejný objekt datové sady, který jste zadali ve skriptu pro odeslání úlohy.
# in your job submission notebook/script:
dataset.as_named_input('foo') # direct mode
# in the script that will be executed in the run
run = Run.get_context()
run.input_datasets['foo'] # this returns the dataset object from above.
get_all
Získejte všechny registrované datové sady v pracovním prostoru.
static get_all(workspace)
Parametry
| Name | Description |
|---|---|
|
workspace
Vyžadováno
|
Existující pracovní prostor AzureML, ve kterém byly datové sady zaregistrovány. |
Návraty
| Typ | Description |
|---|---|
|
Slovník objektů TabularDataset a FileDataset klíčovaných podle názvu registrace. |
get_by_id
Získejte datovou sadu, která se uloží do pracovního prostoru.
static get_by_id(workspace, id, **kwargs)
Parametry
| Name | Description |
|---|---|
|
workspace
Vyžadováno
|
Existující pracovní prostor AzureML, ve kterém je datová sada uložená. |
|
id
Vyžadováno
|
ID datové sady. |
Návraty
| Typ | Description |
|---|---|
|
Objekt datové sady. Pokud je datová sada zaregistrovaná, vrátí se také její název registrace a verze. |
get_by_name
Získá registrovanou datovou sadu z pracovního prostoru podle názvu registrace.
static get_by_name(workspace, name, version='latest', **kwargs)
Parametry
| Name | Description |
|---|---|
|
workspace
Vyžadováno
|
Existující pracovní prostor AzureML, ve kterém byla datová sada zaregistrována. |
|
name
Vyžadováno
|
Název registrace. |
|
version
Vyžadováno
|
Verze registrace. Výchozí hodnota je nejnovější. |
Návraty
| Typ | Description |
|---|---|
|
Registrovaný objekt datové sady. |
get_partition_key_values
Vrátí jedinečné hodnoty klíče partition_keys.
Ověřte, jestli je partition_keys platnou podmnožinou celé sady klíčů oddílů, vrátí jedinečné hodnoty klíče partition_keys. Výchozí hodnota vrátí jedinečné kombinace kláves tak, že vezme úplnou sadu klíčů oddílů této datové sady, pokud partition_keys není žádná.
# get all partition key value pairs
partitions = ds.get_partition_key_values()
# Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]
partitions = ds.get_partition_key_values(['country'])
# Return [{'country': 'US'}]
get_partition_key_values(partition_keys=None)
Parametry
| Name | Description |
|---|---|
|
partition_keys
Vyžadováno
|
klíče oddílů |
register
Zaregistrujte datovou sadu do zadaného pracovního prostoru.
register(workspace, name, description=None, tags=None, create_new_version=False)
Parametry
| Name | Description |
|---|---|
|
workspace
Vyžadováno
|
Pracovní prostor pro registraci datové sady. |
|
name
Vyžadováno
|
Název pro registraci datové sady. |
|
description
Vyžadováno
|
Textový popis datové sady. Výchozí hodnota je Žádná. |
|
tags
Vyžadováno
|
Slovník značek klíč-hodnota pro poskytnutí datové sady Výchozí hodnota je Žádná. |
|
create_new_version
Vyžadováno
|
Logická hodnota pro registraci datové sady jako nové verze pod zadaným názvem. |
Návraty
| Typ | Description |
|---|---|
|
Registrovaný objekt datové sady. |
remove_tags
Odeberte zadané klíče ze slovníku značek této datové sady.
remove_tags(tags=None)
Parametry
| Name | Description |
|---|---|
|
tags
Vyžadováno
|
Seznam klíčů, které chcete odebrat. |
Návraty
| Typ | Description |
|---|---|
|
Aktualizovaný objekt datové sady. |
unregister_all_versions
Zrušit registraci všech verzí pod názvem registrace této datové sady z pracovního prostoru.
unregister_all_versions()
Poznámky
Operace nemění žádná zdrojová data.
update
Proveďte místní aktualizaci datové sady.
update(description=None, tags=None)
Parametry
| Name | Description |
|---|---|
|
description
Vyžadováno
|
Nový popis, který se má použít pro datovou sadu. Tento popis nahrazuje existující popis. Výchozí hodnota je existující popis. Pokud chcete vymazat popis, zadejte prázdný řetězec. |
|
tags
Vyžadováno
|
Slovník značek, pomocí které se datová sada aktualizuje. Tyto značky nahrazují stávající značky pro datovou sadu. Výchozí hodnota je existující značky. Pokud chcete vymazat značky, zadejte prázdný slovník. |
Návraty
| Typ | Description |
|---|---|
|
Aktualizovaný objekt datové sady. |
Atributy
data_changed_time
Vrátí čas změny zdrojových dat.
Návraty
| Typ | Description |
|---|---|
|
Čas, kdy k poslední změně došlo u zdrojových dat. |
Poznámky
Čas změny dat je k dispozici pro souborový zdroj dat. Žádné se nevrátí, pokud zdroj dat není podporovaný pro kontrolu, kdy došlo ke změně.
description
id
Vrátí identifikátor datové sady.
Návraty
| Typ | Description |
|---|---|
|
ID datové sady. Pokud datová sada není uložena do žádného pracovního prostoru, ID bude Žádné. |