DataReference Класс

Представляет ссылку на данные в хранилище данных.

DataReference представляет собой путь в хранилище данных и может использоваться для описания того, как и где должны быть доступны данные в рамках запуска. Данный подход больше не рекомендуется при осуществлении доступа к данным и их доставки в Машинном обучении Azure. Набор данных поддерживает доступ к данным из хранилища BLOB-объектов Azure, Файлов Azure, Azure Data Lake Storage 1-го поколения, Azure Data Lake Storage 2-го поколения, Базы данных Azure SQL и Базы данных Azure для PostgreSQL с помощью единого интерфейса с дополнительными возможностями управления данными. Рекомендуется использовать набор данных для чтения данных в проектах машинного обучения.

Дополнительные сведения об использовании набора данных Azure ML в двух распространенных сценариях приведены в статьях:

Конструктор Class DataReference.

Наследование
builtins.object
DataReference

Конструктор

DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)

Параметры

Имя Описание
datastore
Обязательно

Хранилище данных, на которое будет дана ссылка.

data_reference_name
str

Имя ссылки на данные.

значение по умолчанию: None
path_on_datastore
str

Относительный путь в резервном хранилище для ссылки на данные.

значение по умолчанию: None
mode
str

Операция со ссылкой на данные. Поддерживаются значения "Подключение" (по умолчанию) и "Загрузка".

Используйте режим "Загрузка", если скрипт ожидает конкретный (например, жестко заданный) путь для входных данных. В этом случае укажите путь с параметром path_on_compute при объявлении DataReference. Машинное обучение Azure загрузит данные, указанные в этом пути, перед выполнением скрипта.

В режиме "Подключение" создается временный каталог с подключенными данными, и переменная среды $AZUREML_DATAREFERENCE_data_reference_name< data_reference_name> задается с путем к временному каталогу. Если DataReference передается в список аргументов для шага конвейера (например, PythonScriptStep), ссылка будет дополнена путем к локальным данным в среде выполнения.

значение по умолчанию: mount
path_on_compute
str

Путь к целевому объекту вычислений для ссылки на данные.

значение по умолчанию: None
overwrite

Указывает, следует ли перезаписывать существующие данные.

значение по умолчанию: False
datastore
Обязательно

Хранилище данных, на которое будет дана ссылка.

data_reference_name
Обязательно
str

Имя ссылки на данные.

path_on_datastore
Обязательно
str

Относительный путь в резервном хранилище для ссылки на данные.

mode
Обязательно
str

Операция со ссылкой на данные. Поддерживаемые значения mount (по умолчанию) и download.

Используйте режим "Загрузка", если скрипт ожидает конкретный (например, жестко заданный) путь для входных данных. В этом случае укажите путь с параметром path_on_compute при объявлении DataReference. Машинное обучение Azure загрузит данные, указанные в этом пути, перед выполнением скрипта.

В режиме "Подключение" создается временный каталог с подключенными данными, и переменная среды $AZUREML_DATAREFERENCE_data_reference_name< data_reference_name> задается с путем к временному каталогу. Если DataReference передается в список аргументов для шага конвейера (например, PythonScriptStep), ссылка будет дополнена путем к локальным данным в среде выполнения.

path_on_compute
Обязательно
str

Путь к целевому объекту вычислений для ссылки на данные.

overwrite
Обязательно

Указывает, следует ли перезаписывать существующие данные.

Комментарии

DataReference определяет как расположение данных, так и способ их использования в целевой привязке вычислений (подключение или отправка). Путь к данным в хранилище данных может быть корневым каталогом/, каталогом в хранилище данных или файлом в хранилище данных.

Методы

as_download

Переключение операции ссылки на данные на загрузку.

Загрузка DataReference поддерживает только BLOB-объект Azure и общую папку Azure. Для загрузки данных из BLOB-объекта Azure, общей папки Azure, Azure Data Lake 1-го поколения и Azure Data Lake 2-го поколения рекомендуется использовать набор данных Машинного обучения Azure. Дополнительные сведения о создании и использовании набора данных см. на странице https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount

Переключение операции ссылки на данные на подключение.

Подключение DataReference поддерживает только BLOB-объект Azure. Для подключения данных в BLOB-объекте Azure, общей папке Azure, Azure Data Lake 1-го поколения и Azure Data Lake 2-го поколения рекомендуется использовать набор данных Машинного обучения Azure. Дополнительные сведения о создании и использовании набора данных см. на странице https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_upload

Переключение операции ссылки на данные на отправку.

Дополнительные сведения о том, какие вычисления и хранилища поддерживают отправку данных, см. в разделе https://aka.ms/datastore-matrix.

create

Создание DataReference с использованием DataPath и DataPathComputeBinding.

path

Создание экземпляра DataReference на основе заданного пути.

to_config

Преобразование объекта DataReference в объект DataReferenceConfiguration.

as_download

Переключение операции ссылки на данные на загрузку.

Загрузка DataReference поддерживает только BLOB-объект Azure и общую папку Azure. Для загрузки данных из BLOB-объекта Azure, общей папки Azure, Azure Data Lake 1-го поколения и Azure Data Lake 2-го поколения рекомендуется использовать набор данных Машинного обучения Azure. Дополнительные сведения о создании и использовании набора данных см. на странице https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_download(path_on_compute=None, overwrite=False)

Параметры

Имя Описание
path_on_compute
str

Путь к объекту вычислений для ссылки на данные.

значение по умолчанию: None
overwrite

Указывает, следует ли перезаписывать существующие данные.

значение по умолчанию: False

Возвращаемое значение

Тип Описание

Новый объект ссылки на данные.

as_mount

Переключение операции ссылки на данные на подключение.

Подключение DataReference поддерживает только BLOB-объект Azure. Для подключения данных в BLOB-объекте Azure, общей папке Azure, Azure Data Lake 1-го поколения и Azure Data Lake 2-го поколения рекомендуется использовать набор данных Машинного обучения Azure. Дополнительные сведения о создании и использовании набора данных см. на странице https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount()

Возвращаемое значение

Тип Описание

Новый объект ссылки на данные.

as_upload

Переключение операции ссылки на данные на отправку.

Дополнительные сведения о том, какие вычисления и хранилища поддерживают отправку данных, см. в разделе https://aka.ms/datastore-matrix.

as_upload(path_on_compute=None, overwrite=False)

Параметры

Имя Описание
path_on_compute
str

Путь к объекту вычислений для ссылки на данные.

значение по умолчанию: None
overwrite

Указывает, следует ли перезаписывать существующие данные.

значение по умолчанию: False

Возвращаемое значение

Тип Описание

Новый объект ссылки на данные.

create

Создание DataReference с использованием DataPath и DataPathComputeBinding.

static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)

Параметры

Имя Описание
data_reference_name
str

Имя создаваемой ссылки на данные.

значение по умолчанию: None
datapath

[Обязательно] Используемый путь к данным.

значение по умолчанию: None
datapath_compute_binding

[Обязательно] Используемая привязка вычислений для пути к данным.

значение по умолчанию: None

Возвращаемое значение

Тип Описание

Объект DataReference.

path

Создание экземпляра DataReference на основе заданного пути.

path(path=None, data_reference_name=None)

Параметры

Имя Описание
path
str

Путь к хранилищу данных.

значение по умолчанию: None
data_reference_name
str

Имя ссылки на данные.

значение по умолчанию: None

Возвращаемое значение

Тип Описание

Объект ссылки на данные.

to_config

Преобразование объекта DataReference в объект DataReferenceConfiguration.

to_config()

Возвращаемое значение

Тип Описание

Новый объект DataReferenceConfiguration.