Megosztás a következőn keresztül:


AbstractDataset Osztály

Adathalmazok alaposztálya az Azure Machine Learningben.

Az adathalmaz példányainak létrehozásához hivatkozzon TabularDatasetFactory az osztályra és FileDatasetFactory az osztályra.

Osztály AbstractDataset konstruktor.

Ezt a konstruktort nem szabad közvetlenül meghívni. Az adatkészletet osztály és FileDatasetFactory osztály használatával TabularDatasetFactory kell létrehozni.

Öröklődés
builtins.object
AbstractDataset

Konstruktor

AbstractDataset()

Metódusok

add_tags

Adjon hozzá kulcsértékpárokat az adathalmaz címkeszótárához.

as_named_input

Adjon meg egy nevet ennek az adatkészletnek, amely a futtatás során a materializált adatkészlet lekérésére szolgál.

get_all

Szerezze be a munkaterület összes regisztrált adathalmazát.

get_by_id

Szerezze be a munkaterületre mentett adatkészletet.

get_by_name

Regisztrált adatkészlet lekérése a munkaterületről a regisztrációs neve alapján.

get_partition_key_values

A partition_keys egyedi kulcsértékeinek visszaadása.

ellenőrizze, hogy partition_keys a partíciókulcsok teljes készletének érvényes részhalmaza-e, partition_keys egyedi kulcsértékeit adja vissza, alapértelmezés szerint az egyedi kulcskombinációk visszaadásához az adathalmaz partíciókulcsainak teljes készletét veszi figyelembe, ha partition_keys Nincs


   # get all partition key value pairs
   partitions = ds.get_partition_key_values()
   # Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]

   partitions = ds.get_partition_key_values(['country'])
   # Return [{'country': 'US'}]
register

Regisztrálja az adathalmazt a megadott munkaterületen.

remove_tags

Távolítsa el a megadott kulcsokat az adathalmaz címkeszótárából.

unregister_all_versions

Törölje az adathalmaz regisztrációs neve alatt lévő összes verzió regisztrációjának törlését a munkaterületről.

update

Végezze el az adathalmaz helyben történő frissítését.

add_tags

Adjon hozzá kulcsértékpárokat az adathalmaz címkeszótárához.

add_tags(tags=None)

Paraméterek

tags
dict[str, str]
Kötelező

A hozzáadni kívánt címkék szótára.

Válaszok

A frissített adathalmaz-objektum.

Visszatérési típus

as_named_input

Adjon meg egy nevet ennek az adatkészletnek, amely a futtatás során a materializált adatkészlet lekérésére szolgál.

as_named_input(name)

Paraméterek

name
str
Kötelező

A futtatás adathalmazának neve.

Válaszok

A konfigurációs objektum, amely leírja, hogyan kell az adatkészletet materializálni a futtatás során.

Visszatérési típus

Megjegyzések

Az itt szereplő név csak egy Azure Machine Learning-futtatáson belül lesz érvényes. A névnek csak alfanumerikus és aláhúzásjeles karaktereket kell tartalmaznia, hogy környezeti változóként elérhetővé lehessen tenni. Ezzel a névvel lekérheti az adathalmazt egy futtatás kontextusában két módszerrel:

  • Környezeti változó:

    A név a környezeti változó neve lesz, a materializált adathalmaz pedig elérhetővé válik a környezeti változó értékeként. Ha az adatkészlet le van töltve vagy csatlakoztatva van, az érték a letöltött/csatlakoztatott elérési út lesz. Például:


   # in your job submission notebook/script:
   dataset.as_named_input('foo').as_download('/tmp/dataset')

   # in the script that will be executed in the run
   import os
   path = os.environ['foo'] # path will be /tmp/dataset

Megjegyzés

Ha az adathalmaz közvetlen módra van állítva, akkor az érték az adathalmaz azonosítója lesz. Ezt követően

az adathalmaz-objektum lekérése Dataset.get_by_id(os.environ['foo']) használatával

  • Run.input_datasets:

    Ez egy olyan szótár, amelyben a kulcs az ebben a metódusban megadott adathalmaznév, az érték pedig a materializált adatkészlet lesz. A letöltött és csatlakoztatott adatkészletek esetében az érték a letöltött/csatlakoztatott elérési út lesz. Közvetlen mód esetén az érték ugyanaz az adathalmaz-objektum lesz, amit a feladatküldési szkriptben megadott.


   # in your job submission notebook/script:
   dataset.as_named_input('foo') # direct mode

   # in the script that will be executed in the run
   run = Run.get_context()
   run.input_datasets['foo'] # this returns the dataset object from above.

get_all

Szerezze be a munkaterület összes regisztrált adathalmazát.

static get_all(workspace)

Paraméterek

workspace
Workspace
Kötelező

A meglévő AzureML-munkaterület, amelyben az adathalmazok regisztrálva lettek.

Válaszok

A TabularDataset és FileDataset objektumok szótára, amely a regisztrációs nevük alapján van meghatározva.

Visszatérési típus

get_by_id

Szerezze be a munkaterületre mentett adatkészletet.

static get_by_id(workspace, id, **kwargs)

Paraméterek

workspace
Workspace
Kötelező

A meglévő AzureML-munkaterület, amelyben az adatkészlet mentve van.

id
str
Kötelező

Az adathalmaz azonosítója.

Válaszok

Az adathalmaz-objektum. Ha az adathalmaz regisztrálva van, a rendszer a regisztrációs nevét és verzióját is visszaadja.

Visszatérési típus

get_by_name

Regisztrált adatkészlet lekérése a munkaterületről a regisztrációs neve alapján.

static get_by_name(workspace, name, version='latest', **kwargs)

Paraméterek

workspace
Workspace
Kötelező

A meglévő AzureML-munkaterület, amelyben az adatkészlet regisztrálva lett.

name
str
Kötelező

A regisztrációs név.

version
int
Kötelező

A regisztrációs verzió. Alapértelmezés szerint a "legújabb".

Válaszok

A regisztrált adathalmaz-objektum.

Visszatérési típus

get_partition_key_values

A partition_keys egyedi kulcsértékeinek visszaadása.

ellenőrizze, hogy partition_keys a partíciókulcsok teljes készletének érvényes részhalmaza-e, partition_keys egyedi kulcsértékeit adja vissza, alapértelmezés szerint az egyedi kulcskombinációk visszaadásához az adathalmaz partíciókulcsainak teljes készletét veszi figyelembe, ha partition_keys Nincs


   # get all partition key value pairs
   partitions = ds.get_partition_key_values()
   # Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]

   partitions = ds.get_partition_key_values(['country'])
   # Return [{'country': 'US'}]
get_partition_key_values(partition_keys=None)

Paraméterek

partition_keys
list[str]
Kötelező

partíciókulcsok

register

Regisztrálja az adathalmazt a megadott munkaterületen.

register(workspace, name, description=None, tags=None, create_new_version=False)

Paraméterek

workspace
Workspace
Kötelező

Az adathalmaz regisztrálandó munkaterülete.

name
str
Kötelező

Az adathalmaz regisztrálásához szükséges név.

description
str
Kötelező

Az adathalmaz szöveges leírása. Alapértelmezés szerint Nincs.

tags
dict[str, str]
Kötelező

Kulcsértékcímkék szótára az adatkészlethez. Alapértelmezés szerint Nincs.

create_new_version
bool
Kötelező

Logikai érték az adathalmaz új verzióként való regisztrálásához a megadott név alatt.

Válaszok

A regisztrált adathalmaz-objektum.

Visszatérési típus

remove_tags

Távolítsa el a megadott kulcsokat az adathalmaz címkeszótárából.

remove_tags(tags=None)

Paraméterek

tags
list[str]
Kötelező

Az eltávolítandó kulcsok listája.

Válaszok

A frissített adathalmaz-objektum.

Visszatérési típus

unregister_all_versions

Törölje az adathalmaz regisztrációs neve alatt lévő összes verzió regisztrációjának törlését a munkaterületről.

unregister_all_versions()

Megjegyzések

A művelet nem módosítja a forrásadatokat.

update

Végezze el az adathalmaz helyben történő frissítését.

update(description=None, tags=None)

Paraméterek

description
str
Kötelező

Az adathalmazhoz használandó új leírás. Ez a leírás lecseréli a meglévő leírást. A meglévő leírás alapértelmezett értéke. A leírás törléséhez írja be az üres sztringet.

tags
dict[str, str]
Kötelező

Címkék szótára, amellyel frissítheti az adathalmazt. Ezek a címkék lecserélik az adathalmaz meglévő címkéit. A meglévő címkék alapértelmezett értéke. A címkék törléséhez írja be az üres szótárat.

Válaszok

A frissített adathalmaz-objektum.

Visszatérési típus

Attribútumok

data_changed_time

Adja vissza a forrásadatok módosított időpontját.

Válaszok

A forrásadatok legutóbbi módosításának időpontja.

Visszatérési típus

Megjegyzések

A fájlalapú adatforrás esetében az adatok módosult ideje érhető el. A rendszer nem ad vissza semmit, ha az adatforrás nem támogatott annak ellenőrzéséhez, hogy történt-e változás.

description

Adja vissza a regisztrációs leírást.

Válaszok

Adathalmaz leírása.

Visszatérési típus

str

id

Adja vissza az adathalmaz azonosítóját.

Válaszok

Adathalmaz azonosítója. Ha az adathalmazt nem menti egyik munkaterületre sem, az azonosító Nem lesz.

Visszatérési típus

str

name

Adja vissza a regisztrációs nevet.

Válaszok

Adathalmaz neve.

Visszatérési típus

str

partition_keys

Adja vissza a partíciókulcsokat.

Válaszok

a partíciókulcsok

Visszatérési típus

tags

Adja vissza a regisztrációs címkéket.

Válaszok

Adathalmazcímkék.

Visszatérési típus

str

version

Adja vissza a regisztrációs verziót.

Válaszok

Adathalmaz verziója.

Visszatérési típus

int