Megosztás a következőn keresztül:


AbstractDataset Osztály

Adathalmazok alaposztálya az Azure Machine Learningben.

Az adathalmaz példányainak létrehozásához hivatkozzon TabularDatasetFactory az osztályra és FileDatasetFactory az osztályra.

Osztály AbstractDataset konstruktor.

Ezt a konstruktort nem szabad közvetlenül meghívni. Az adatkészletet osztály és FileDatasetFactory osztály használatával TabularDatasetFactory kell létrehozni.

Öröklődés
builtins.object
AbstractDataset

Konstruktor

AbstractDataset()

Metódusok

add_tags

Adjon hozzá kulcsértékpárokat az adathalmaz címkeszótárához.

as_named_input

Adjon meg egy nevet ennek az adatkészletnek, amely a futtatás során a materializált adatkészlet lekérésére szolgál.

get_all

Szerezze be a munkaterület összes regisztrált adathalmazát.

get_by_id

Szerezze be a munkaterületre mentett adatkészletet.

get_by_name

Regisztrált adatkészlet lekérése a munkaterületről a regisztrációs neve alapján.

get_partition_key_values

A partition_keys egyedi kulcsértékeinek visszaadása.

ellenőrizze, hogy partition_keys a partíciókulcsok teljes készletének érvényes részhalmaza-e, partition_keys egyedi kulcsértékeit adja vissza, alapértelmezés szerint az egyedi kulcskombinációk visszaadásához az adathalmaz partíciókulcsainak teljes készletét veszi figyelembe, ha partition_keys Nincs


   # get all partition key value pairs
   partitions = ds.get_partition_key_values()
   # Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]

   partitions = ds.get_partition_key_values(['country'])
   # Return [{'country': 'US'}]
register

Regisztrálja az adathalmazt a megadott munkaterületen.

remove_tags

Távolítsa el a megadott kulcsokat az adathalmaz címkeszótárából.

unregister_all_versions

Törölje az adathalmaz regisztrációs neve alatt lévő összes verzió regisztrációjának törlését a munkaterületről.

update

Végezze el az adathalmaz helyben történő frissítését.

add_tags

Adjon hozzá kulcsértékpárokat az adathalmaz címkeszótárához.

add_tags(tags=None)

Paraméterek

Name Description
tags
Kötelező

A hozzáadni kívánt címkék szótára.

Válaszok

Típus Description

A frissített adathalmaz-objektum.

as_named_input

Adjon meg egy nevet ennek az adatkészletnek, amely a futtatás során a materializált adatkészlet lekérésére szolgál.

as_named_input(name)

Paraméterek

Name Description
name
Kötelező
str

A futtatás adathalmazának neve.

Válaszok

Típus Description

A konfigurációs objektum, amely leírja, hogyan kell az adatkészletet materializálni a futtatás során.

Megjegyzések

Az itt szereplő név csak egy Azure Machine Learning-futtatáson belül lesz érvényes. A névnek csak alfanumerikus és aláhúzásjeles karaktereket kell tartalmaznia, hogy környezeti változóként elérhetővé lehessen tenni. Ezzel a névvel lekérheti az adathalmazt egy futtatás kontextusában két módszerrel:

  • Környezeti változó:

    A név a környezeti változó neve lesz, a materializált adathalmaz pedig elérhetővé válik a környezeti változó értékeként. Ha az adatkészlet le van töltve vagy csatlakoztatva van, az érték a letöltött/csatlakoztatott elérési út lesz. Például:


   # in your job submission notebook/script:
   dataset.as_named_input('foo').as_download('/tmp/dataset')

   # in the script that will be executed in the run
   import os
   path = os.environ['foo'] # path will be /tmp/dataset

Megjegyzés

Ha az adathalmaz közvetlen módra van állítva, akkor az érték az adathalmaz azonosítója lesz. Ezt követően

az adathalmaz-objektum lekérése Dataset.get_by_id(os.environ['foo']) használatával

  • Run.input_datasets:

    Ez egy olyan szótár, amelyben a kulcs az ebben a metódusban megadott adathalmaznév, az érték pedig a materializált adatkészlet lesz. A letöltött és csatlakoztatott adatkészletek esetében az érték a letöltött/csatlakoztatott elérési út lesz. Közvetlen mód esetén az érték ugyanaz az adathalmaz-objektum lesz, amit a feladatküldési szkriptben megadott.


   # in your job submission notebook/script:
   dataset.as_named_input('foo') # direct mode

   # in the script that will be executed in the run
   run = Run.get_context()
   run.input_datasets['foo'] # this returns the dataset object from above.

get_all

Szerezze be a munkaterület összes regisztrált adathalmazát.

static get_all(workspace)

Paraméterek

Name Description
workspace
Kötelező

A meglévő AzureML-munkaterület, amelyben az adathalmazok regisztrálva lettek.

Válaszok

Típus Description

A TabularDataset és FileDataset objektumok szótára, amely a regisztrációs nevük alapján van meghatározva.

get_by_id

Szerezze be a munkaterületre mentett adatkészletet.

static get_by_id(workspace, id, **kwargs)

Paraméterek

Name Description
workspace
Kötelező

A meglévő AzureML-munkaterület, amelyben az adatkészlet mentve van.

id
Kötelező
str

Az adathalmaz azonosítója.

Válaszok

Típus Description

Az adathalmaz-objektum. Ha az adathalmaz regisztrálva van, a rendszer a regisztrációs nevét és verzióját is visszaadja.

get_by_name

Regisztrált adatkészlet lekérése a munkaterületről a regisztrációs neve alapján.

static get_by_name(workspace, name, version='latest', **kwargs)

Paraméterek

Name Description
workspace
Kötelező

A meglévő AzureML-munkaterület, amelyben az adatkészlet regisztrálva lett.

name
Kötelező
str

A regisztrációs név.

version
Kötelező
int

A regisztrációs verzió. Alapértelmezés szerint a "legújabb".

Válaszok

Típus Description

A regisztrált adathalmaz-objektum.

get_partition_key_values

A partition_keys egyedi kulcsértékeinek visszaadása.

ellenőrizze, hogy partition_keys a partíciókulcsok teljes készletének érvényes részhalmaza-e, partition_keys egyedi kulcsértékeit adja vissza, alapértelmezés szerint az egyedi kulcskombinációk visszaadásához az adathalmaz partíciókulcsainak teljes készletét veszi figyelembe, ha partition_keys Nincs


   # get all partition key value pairs
   partitions = ds.get_partition_key_values()
   # Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]

   partitions = ds.get_partition_key_values(['country'])
   # Return [{'country': 'US'}]
get_partition_key_values(partition_keys=None)

Paraméterek

Name Description
partition_keys
Kötelező

partíciókulcsok

register

Regisztrálja az adathalmazt a megadott munkaterületen.

register(workspace, name, description=None, tags=None, create_new_version=False)

Paraméterek

Name Description
workspace
Kötelező

Az adathalmaz regisztrálandó munkaterülete.

name
Kötelező
str

Az adathalmaz regisztrálásához szükséges név.

description
Kötelező
str

Az adathalmaz szöveges leírása. Alapértelmezés szerint Nincs.

tags
Kötelező

Kulcsértékcímkék szótára az adatkészlethez. Alapértelmezés szerint Nincs.

create_new_version
Kötelező

Logikai érték az adathalmaz új verzióként való regisztrálásához a megadott név alatt.

Válaszok

Típus Description

A regisztrált adathalmaz-objektum.

remove_tags

Távolítsa el a megadott kulcsokat az adathalmaz címkeszótárából.

remove_tags(tags=None)

Paraméterek

Name Description
tags
Kötelező

Az eltávolítandó kulcsok listája.

Válaszok

Típus Description

A frissített adathalmaz-objektum.

unregister_all_versions

Törölje az adathalmaz regisztrációs neve alatt lévő összes verzió regisztrációjának törlését a munkaterületről.

unregister_all_versions()

Megjegyzések

A művelet nem módosítja a forrásadatokat.

update

Végezze el az adathalmaz helyben történő frissítését.

update(description=None, tags=None)

Paraméterek

Name Description
description
Kötelező
str

Az adathalmazhoz használandó új leírás. Ez a leírás lecseréli a meglévő leírást. A meglévő leírás alapértelmezett értéke. A leírás törléséhez írja be az üres sztringet.

tags
Kötelező

Címkék szótára, amellyel frissítheti az adathalmazt. Ezek a címkék lecserélik az adathalmaz meglévő címkéit. A meglévő címkék alapértelmezett értéke. A címkék törléséhez írja be az üres szótárat.

Válaszok

Típus Description

A frissített adathalmaz-objektum.

Attribútumok

data_changed_time

Adja vissza a forrásadatok módosított időpontját.

Válaszok

Típus Description

A forrásadatok legutóbbi módosításának időpontja.

Megjegyzések

A fájlalapú adatforrás esetében az adatok módosult ideje érhető el. A rendszer nem ad vissza semmit, ha az adatforrás nem támogatott annak ellenőrzéséhez, hogy történt-e változás.

description

Adja vissza a regisztrációs leírást.

Válaszok

Típus Description
str

Adathalmaz leírása.

id

Adja vissza az adathalmaz azonosítóját.

Válaszok

Típus Description
str

Adathalmaz azonosítója. Ha az adathalmazt nem menti egyik munkaterületre sem, az azonosító Nem lesz.

name

Adja vissza a regisztrációs nevet.

Válaszok

Típus Description
str

Adathalmaz neve.

partition_keys

Adja vissza a partíciókulcsokat.

Válaszok

Típus Description

a partíciókulcsok

tags

Adja vissza a regisztrációs címkéket.

Válaszok

Típus Description
str

Adathalmazcímkék.

version

Adja vissza a regisztrációs verziót.

Válaszok

Típus Description
int

Adathalmaz verziója.