AbstractDataset Osztály
Adathalmazok alaposztálya az Azure Machine Learningben.
Az adathalmaz példányainak létrehozásához hivatkozzon TabularDatasetFactory az osztályra és FileDatasetFactory az osztályra.
Osztály AbstractDataset konstruktor.
Ezt a konstruktort nem szabad közvetlenül meghívni. Az adatkészletet osztály és FileDatasetFactory osztály használatával TabularDatasetFactory kell létrehozni.
- Öröklődés
-
builtins.objectAbstractDataset
Konstruktor
AbstractDataset()
Metódusok
add_tags |
Adjon hozzá kulcsértékpárokat az adathalmaz címkeszótárához. |
as_named_input |
Adjon meg egy nevet ennek az adatkészletnek, amely a futtatás során a materializált adatkészlet lekérésére szolgál. |
get_all |
Szerezze be a munkaterület összes regisztrált adathalmazát. |
get_by_id |
Szerezze be a munkaterületre mentett adatkészletet. |
get_by_name |
Regisztrált adatkészlet lekérése a munkaterületről a regisztrációs neve alapján. |
get_partition_key_values |
A partition_keys egyedi kulcsértékeinek visszaadása. ellenőrizze, hogy partition_keys a partíciókulcsok teljes készletének érvényes részhalmaza-e, partition_keys egyedi kulcsértékeit adja vissza, alapértelmezés szerint az egyedi kulcskombinációk visszaadásához az adathalmaz partíciókulcsainak teljes készletét veszi figyelembe, ha partition_keys Nincs
|
register |
Regisztrálja az adathalmazt a megadott munkaterületen. |
remove_tags |
Távolítsa el a megadott kulcsokat az adathalmaz címkeszótárából. |
unregister_all_versions |
Törölje az adathalmaz regisztrációs neve alatt lévő összes verzió regisztrációjának törlését a munkaterületről. |
update |
Végezze el az adathalmaz helyben történő frissítését. |
add_tags
Adjon hozzá kulcsértékpárokat az adathalmaz címkeszótárához.
add_tags(tags=None)
Paraméterek
Name | Description |
---|---|
tags
Kötelező
|
A hozzáadni kívánt címkék szótára. |
Válaszok
Típus | Description |
---|---|
A frissített adathalmaz-objektum. |
as_named_input
Adjon meg egy nevet ennek az adatkészletnek, amely a futtatás során a materializált adatkészlet lekérésére szolgál.
as_named_input(name)
Paraméterek
Name | Description |
---|---|
name
Kötelező
|
A futtatás adathalmazának neve. |
Válaszok
Típus | Description |
---|---|
A konfigurációs objektum, amely leírja, hogyan kell az adatkészletet materializálni a futtatás során. |
Megjegyzések
Az itt szereplő név csak egy Azure Machine Learning-futtatáson belül lesz érvényes. A névnek csak alfanumerikus és aláhúzásjeles karaktereket kell tartalmaznia, hogy környezeti változóként elérhetővé lehessen tenni. Ezzel a névvel lekérheti az adathalmazt egy futtatás kontextusában két módszerrel:
Környezeti változó:
A név a környezeti változó neve lesz, a materializált adathalmaz pedig elérhetővé válik a környezeti változó értékeként. Ha az adatkészlet le van töltve vagy csatlakoztatva van, az érték a letöltött/csatlakoztatott elérési út lesz. Például:
# in your job submission notebook/script:
dataset.as_named_input('foo').as_download('/tmp/dataset')
# in the script that will be executed in the run
import os
path = os.environ['foo'] # path will be /tmp/dataset
Megjegyzés
Ha az adathalmaz közvetlen módra van állítva, akkor az érték az adathalmaz azonosítója lesz. Ezt követően
az adathalmaz-objektum lekérése Dataset.get_by_id(os.environ['foo']) használatával
Run.input_datasets:
Ez egy olyan szótár, amelyben a kulcs az ebben a metódusban megadott adathalmaznév, az érték pedig a materializált adatkészlet lesz. A letöltött és csatlakoztatott adatkészletek esetében az érték a letöltött/csatlakoztatott elérési út lesz. Közvetlen mód esetén az érték ugyanaz az adathalmaz-objektum lesz, amit a feladatküldési szkriptben megadott.
# in your job submission notebook/script:
dataset.as_named_input('foo') # direct mode
# in the script that will be executed in the run
run = Run.get_context()
run.input_datasets['foo'] # this returns the dataset object from above.
get_all
Szerezze be a munkaterület összes regisztrált adathalmazát.
static get_all(workspace)
Paraméterek
Name | Description |
---|---|
workspace
Kötelező
|
A meglévő AzureML-munkaterület, amelyben az adathalmazok regisztrálva lettek. |
Válaszok
Típus | Description |
---|---|
A TabularDataset és FileDataset objektumok szótára, amely a regisztrációs nevük alapján van meghatározva. |
get_by_id
Szerezze be a munkaterületre mentett adatkészletet.
static get_by_id(workspace, id, **kwargs)
Paraméterek
Name | Description |
---|---|
workspace
Kötelező
|
A meglévő AzureML-munkaterület, amelyben az adatkészlet mentve van. |
id
Kötelező
|
Az adathalmaz azonosítója. |
Válaszok
Típus | Description |
---|---|
Az adathalmaz-objektum. Ha az adathalmaz regisztrálva van, a rendszer a regisztrációs nevét és verzióját is visszaadja. |
get_by_name
Regisztrált adatkészlet lekérése a munkaterületről a regisztrációs neve alapján.
static get_by_name(workspace, name, version='latest', **kwargs)
Paraméterek
Name | Description |
---|---|
workspace
Kötelező
|
A meglévő AzureML-munkaterület, amelyben az adatkészlet regisztrálva lett. |
name
Kötelező
|
A regisztrációs név. |
version
Kötelező
|
A regisztrációs verzió. Alapértelmezés szerint a "legújabb". |
Válaszok
Típus | Description |
---|---|
A regisztrált adathalmaz-objektum. |
get_partition_key_values
A partition_keys egyedi kulcsértékeinek visszaadása.
ellenőrizze, hogy partition_keys a partíciókulcsok teljes készletének érvényes részhalmaza-e, partition_keys egyedi kulcsértékeit adja vissza, alapértelmezés szerint az egyedi kulcskombinációk visszaadásához az adathalmaz partíciókulcsainak teljes készletét veszi figyelembe, ha partition_keys Nincs
# get all partition key value pairs
partitions = ds.get_partition_key_values()
# Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]
partitions = ds.get_partition_key_values(['country'])
# Return [{'country': 'US'}]
get_partition_key_values(partition_keys=None)
Paraméterek
Name | Description |
---|---|
partition_keys
Kötelező
|
partíciókulcsok |
register
Regisztrálja az adathalmazt a megadott munkaterületen.
register(workspace, name, description=None, tags=None, create_new_version=False)
Paraméterek
Name | Description |
---|---|
workspace
Kötelező
|
Az adathalmaz regisztrálandó munkaterülete. |
name
Kötelező
|
Az adathalmaz regisztrálásához szükséges név. |
description
Kötelező
|
Az adathalmaz szöveges leírása. Alapértelmezés szerint Nincs. |
tags
Kötelező
|
Kulcsértékcímkék szótára az adatkészlethez. Alapértelmezés szerint Nincs. |
create_new_version
Kötelező
|
Logikai érték az adathalmaz új verzióként való regisztrálásához a megadott név alatt. |
Válaszok
Típus | Description |
---|---|
A regisztrált adathalmaz-objektum. |
remove_tags
Távolítsa el a megadott kulcsokat az adathalmaz címkeszótárából.
remove_tags(tags=None)
Paraméterek
Name | Description |
---|---|
tags
Kötelező
|
Az eltávolítandó kulcsok listája. |
Válaszok
Típus | Description |
---|---|
A frissített adathalmaz-objektum. |
unregister_all_versions
Törölje az adathalmaz regisztrációs neve alatt lévő összes verzió regisztrációjának törlését a munkaterületről.
unregister_all_versions()
Megjegyzések
A művelet nem módosítja a forrásadatokat.
update
Végezze el az adathalmaz helyben történő frissítését.
update(description=None, tags=None)
Paraméterek
Name | Description |
---|---|
description
Kötelező
|
Az adathalmazhoz használandó új leírás. Ez a leírás lecseréli a meglévő leírást. A meglévő leírás alapértelmezett értéke. A leírás törléséhez írja be az üres sztringet. |
tags
Kötelező
|
Címkék szótára, amellyel frissítheti az adathalmazt. Ezek a címkék lecserélik az adathalmaz meglévő címkéit. A meglévő címkék alapértelmezett értéke. A címkék törléséhez írja be az üres szótárat. |
Válaszok
Típus | Description |
---|---|
A frissített adathalmaz-objektum. |
Attribútumok
data_changed_time
Adja vissza a forrásadatok módosított időpontját.
Válaszok
Típus | Description |
---|---|
A forrásadatok legutóbbi módosításának időpontja. |
Megjegyzések
A fájlalapú adatforrás esetében az adatok módosult ideje érhető el. A rendszer nem ad vissza semmit, ha az adatforrás nem támogatott annak ellenőrzéséhez, hogy történt-e változás.
description
id
Adja vissza az adathalmaz azonosítóját.
Válaszok
Típus | Description |
---|---|
Adathalmaz azonosítója. Ha az adathalmazt nem menti egyik munkaterületre sem, az azonosító Nem lesz. |