data Pacchetto
Contiene moduli che supportano la rappresentazione dei dati per l'archivio dati e il set di dati in Azure Machine Learning.
Questo pacchetto contiene le funzionalità di base che supportano Datastore e Dataset le classi nel core pacchetto. Gli oggetti archivio dati contengono informazioni di connessione ai servizi di archiviazione di Azure a cui è possibile fare facilmente riferimento in base al nome senza la necessità di lavorare direttamente con le informazioni di connessione hardcode negli script. L'archivio dati supporta diversi servizi rappresentati dalle classi di questo pacchetto, tra cui AzureBlobDatastore, AzureFileDatastoree AzureDataLakeDatastore. Per un elenco completo dei servizi di archiviazione supportati, vedere la Datastore classe .
Mentre un archivio dati funge da contenitore per i file di dati, è possibile considerare un set di dati come riferimento o puntatore a dati specifici presenti nell'archivio dati. Sono supportati i tipi di set di dati seguenti:
TabularDataset rappresenta i dati in un formato tabulare creato analizzando il file o l'elenco di file forniti.
FileDataset fa riferimento a uno o più file negli archivi dati o negli URL pubblici.
Per altre informazioni, vedere l'articolo Aggiungere e registrare set di dati. Per iniziare a usare un set di dati, vedere https://aka.ms/tabulardataset-samplenotebook e https://aka.ms/filedataset-samplenotebook.
Moduli
| abstract_dataset |
Contiene la classe base astratta per i set di dati in Azure Machine Learning. |
| abstract_datastore |
Contiene la funzionalità di base per gli archivi dati che salvano le informazioni di connessione nei servizi di archiviazione di Azure. |
| azure_data_lake_datastore |
Contiene la funzionalità di base per gli archivi dati che salvano le informazioni di connessione in Azure Data Lake Storage. |
| azure_my_sql_datastore |
Contiene la funzionalità di base per gli archivi dati che salvano le informazioni di connessione in Database di Azure per MySQL. |
| azure_postgre_sql_datastore |
Contiene la funzionalità di base per gli archivi dati che salvano le informazioni di connessione in Database di Azure per PostgreSQL. |
| azure_sql_database_datastore |
Contiene la funzionalità di base per gli archivi dati che salvano le informazioni di connessione nel database SQL di Azure. |
| azure_storage_datastore |
Contiene funzionalità per gli archivi dati che salvano le informazioni di connessione nel BLOB di Azure e nell'archiviazione file di Azure. |
| constants |
Costanti usate nel pacchetto azureml.data. Solo per uso interno. |
| context_managers |
Contiene funzionalità per gestire il contesto dei dati degli archivi dati e dei set di dati. Solo per uso interno. |
| data_reference |
Contiene funzionalità che definisce come creare riferimenti ai dati negli archivi dati. |
| datacache |
Contiene funzionalità per la gestione di DatacacheStore e Datacache in Azure Machine Learning. |
| datacache_client |
Solo per uso interno. |
| datacache_consumption_config |
Contiene funzionalità per la configurazione del consumo di DataCache. |
| datacache_singularity_settings |
Contiene gli oggetti necessari per la rappresentazione delle impostazioni singolarità di Datacache. |
| datapath |
Contiene la funzionalità per creare riferimenti ai dati negli archivi dati. Questo modulo contiene la DataPath classe , che rappresenta la posizione dei dati e la DataPathComputeBinding classe , che rappresenta il modo in cui i dati vengono resi disponibili nelle destinazioni di calcolo. |
| dataset_action_run |
Contiene funzionalità che gestiscono l'esecuzione delle azioni del set di dati. Questo modulo fornisce metodi pratici per la creazione di azioni set di dati e ottenere i risultati dopo il completamento. |
| dataset_consumption_config |
Contiene funzionalità per la configurazione dell'utilizzo del set di dati. |
| dataset_definition |
Contiene funzionalità per gestire la definizione del set di dati e le relative operazioni. Annotazioni Questo modulo è deprecato. Per altre informazioni, vedere https://aka.ms/dataset-deprecation. |
| dataset_error_handling |
Contiene eccezioni per la gestione degli errori del set di dati in Azure Machine Learning. |
| dataset_factory |
Contiene funzionalità per creare set di dati per Azure Machine Learning. |
| dataset_profile |
Classe per la raccolta di statistiche di riepilogo sui dati prodotti da un flusso di dati. La funzionalità in questo modulo include la raccolta di informazioni relative all'esecuzione del profilo, indipendentemente dal fatto che il profilo non sia aggiornato o meno. |
| dataset_profile_run |
Contiene la configurazione per l'esecuzione del profilo del set di dati di monitoraggio in Azure Machine Learning. La funzionalità in questo modulo include la gestione e il monitoraggio dell'esecuzione del profilo del set di dati associata a un oggetto esperimento e a un ID di esecuzione individuale. |
| dataset_profile_run_config |
Contiene la configurazione per generare il riepilogo delle statistiche dei set di dati in Azure Machine Learning. La funzionalità di questo modulo include metodi per l'invio dell'esecuzione del profilo locale o remoto e la visualizzazione del risultato dell'esecuzione del profilo inviato. |
| dataset_snapshot |
Contiene la funzionalità per gestire le operazioni snapshot del set di dati. Annotazioni Questo modulo è deprecato. Per altre informazioni, vedere https://aka.ms/dataset-deprecation. |
| dataset_type_definitions |
Contiene valori di enumerazione usati con Dataset. |
| datastore_client |
Solo per uso interno. |
| dbfs_datastore |
Contiene la funzionalità per gli archivi dati che salvano le informazioni di connessione in Databricks File Sytem (DBFS). |
| file_dataset |
Contiene funzionalità per fare riferimento a uno o più file negli archivi dati o negli URL pubblici. Per altre informazioni, vedere l'articolo Aggiungere e registrare set di dati. Per iniziare a usare un set di dati di file, vedere https://aka.ms/filedataset-samplenotebook. |
| hdfs_datastore |
Contiene la funzionalità di base per gli archivi dati che salvano le informazioni di connessione in un cluster HDFS. |
| output_dataset_config |
Contiene configurazioni che specificano il modo in cui gli output per un processo devono essere caricati e alzati di livello a un set di dati. Per altre informazioni, vedere l'articolo come specificare gli output. |
| sql_data_reference |
Contiene la funzionalità per la creazione di riferimenti ai dati negli archivi dati che salvano le informazioni di connessione nei database SQL. |
| stored_procedure_parameter |
Contiene funzionalità per la creazione di un parametro da passare a una stored procedure SQL. |
| tabular_dataset |
Contiene funzionalità per rappresentare i dati in un formato tabulare analizzando il file o l'elenco di file forniti. Per altre informazioni, vedere l'articolo Aggiungere e registrare set di dati. Per iniziare a usare un set di dati tabulare, vedere https://aka.ms/tabulardataset-samplenotebook. |
Classi
| DataType |
Configura i tipi di dati delle colonne per un set di dati creato in Azure Machine Learning. I metodi DataType vengono utilizzati nei metodi della TabularDatasetFactory classe |
| DatacacheStore |
Annotazioni Si tratta di una classe sperimentale e può cambiare in qualsiasi momento. Per altre informazioni, vedere https://aka.ms/acr/connected-registry. Rappresenta un'astrazione di archiviazione su un account di archiviazione di Azure Machine Learning. I datacacheStore sono collegati alle aree di lavoro e vengono usati per archiviare informazioni correlate alla soluzione datacache sottostante. Attualmente è supportata solo la soluzione BLOB partizionata. Gli archivi datacache definiscono vari archivi dati BLOB che possono essere usati per la memorizzazione nella cache. Usare questa classe per eseguire operazioni di gestione, tra cui register, list, get e update datacachestores.
I datacacheStore per ogni servizio vengono creati con i Ottenere un archivio datacache in base al nome. Questa chiamata effettuerà una richiesta al servizio datacache. |
| FileDataset |
Rappresenta una raccolta di riferimenti ai file negli archivi dati o negli URL pubblici da usare in Azure Machine Learning. Un oggetto FileDataset definisce una serie di operazioni valutate in modo differito e non modificabili per caricare i dati dall'origine dati in flussi di file. I dati non vengono caricati dall'origine fino a quando non viene richiesto a FileDataset di recapitare i dati. Un oggetto FileDataset viene creato utilizzando il from_files metodo della classe FileDatasetFactory. Per altre informazioni, vedere l'articolo Aggiungere e registrare set di dati. Per iniziare a usare un set di dati di file, vedere https://aka.ms/filedataset-samplenotebook. Inizializzare l'oggetto FileDataset. Questo costruttore non dovrebbe essere richiamato direttamente. Il set di dati deve essere creato usando FileDatasetFactory la classe . |
| HDFSOutputDatasetConfig |
Rappresenta come restituire un percorso HDFS ed essere alzato di livello come FileDataset. Inizializzare un oggetto HDFSOutputDatasetConfig. |
| LinkFileOutputDatasetConfig |
Annotazioni Si tratta di una classe sperimentale e può cambiare in qualsiasi momento. Per altre informazioni, vedere https://aka.ms/acr/connected-registry. Rappresenta come collegare l'output di un'esecuzione e come promosso come FileDataset. LinkFileOutputDatasetConfig consente di collegare un set di dati di file come set di dati di output
Inizializzare un oggetto LinkFileOutputDatasetConfig. |
| LinkTabularOutputDatasetConfig |
Annotazioni Si tratta di una classe sperimentale e può cambiare in qualsiasi momento. Per altre informazioni, vedere https://aka.ms/acr/connected-registry. Rappresenta come collegare l'output di un'esecuzione ed essere alzato di livello come tabularDataset. LinkTabularOutputDatasetConfig consente di collegare un file tabulare come set di dati di output
Inizializzare un oggetto LinkTabularOutputDatasetConfig. |
| OutputFileDatasetConfig |
Rappresenta come copiare l'output di un'esecuzione ed essere alzato di livello come FileDataset. OutputFileDatasetConfig consente di specificare la modalità di caricamento di un percorso locale specifico nella destinazione di calcolo nella destinazione specificata. Se al costruttore non vengono passati argomenti, verrà generato automaticamente un nome, una destinazione e un percorso locale. Esempio di mancato passaggio di argomenti:
Esempio di creazione di un output che quindi promuove l'output in un set di dati tabulare e registrarlo con il nome foo:
Inizializzare un oggetto OutputFileDatasetConfig. OutputFileDatasetConfig consente di specificare la modalità di caricamento di un percorso locale specifico nella destinazione di calcolo nella destinazione specificata. Se al costruttore non vengono passati argomenti, verrà generato automaticamente un nome, una destinazione e un percorso locale. Esempio di mancato passaggio di argomenti:
Esempio di creazione di un output che quindi promuove l'output in un set di dati tabulare e registrarlo con il nome foo:
|
| TabularDataset |
Rappresenta un set di dati tabulare da usare in Azure Machine Learning. Un oggetto TabularDataset definisce una serie di operazioni valutate in modo differito e non modificabili per caricare dati dall'origine dati in rappresentazione tabulare. I dati non vengono caricati dall'origine fino a quando non viene richiesto a TabularDataset di recapitare i dati. TabularDataset viene creato usando metodi come from_delimited_files dalla TabularDatasetFactory classe . Per altre informazioni, vedere l'articolo Aggiungere e registrare set di dati. Per iniziare a usare un set di dati tabulare, vedere https://aka.ms/tabulardataset-samplenotebook. Inizializzare un oggetto TabularDataset. Questo costruttore non dovrebbe essere richiamato direttamente. Il set di dati deve essere creato usando TabularDatasetFactory la classe . |