Заметка
Доступ к этой странице требует авторизации. Вы можете попробовать войти в систему или изменить каталог.
Доступ к этой странице требует авторизации. Вы можете попробовать сменить директорию.
Важно!
Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.
Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классическая версия) можно будет использовать до 31 августа 2024 г.
- См. сведения о перемещении проектов машинного обучения из ML Studio (классической) в Машинное обучение Azure.
- См. дополнительные сведения о Машинном обучении Azure.
Поддержка документации по ML Studio (классической) прекращается, а сама документация может не обновляться в будущем.
в этой статье описывается, как использовать параметр экспорт в Azure в модуле экспорт данных в Машинное обучение Studio (классическая модель).
Примечание
применимо к: только Машинное обучение Studio (классическая модель)
Подобные модули перетаскивания доступны в конструкторе машинного обучения Azure.
Этот параметр полезен, если вы хотите экспортировать результаты или промежуточные данные из эксперимента машинного обучения в таблицу Azure. Служба таблиц Azure — это служба управления данными в Azure, которая может хранить большие объемы структурированных нереляционных данных. Это хранилище данных NoSQL, которое принимает вызовы с проверкой подлинности внутри и за пределами Azure.
Экспорт данных в таблицу Azure
Добавьте модуль Export Data (экспорт данных ) в свой эксперимент. Этот модуль можно найти в категории Ввод и вывод данных в студии (классическая модель).
Подключение его в модуль, который создает данные, которые необходимо экспортировать в хранилище таблиц Azure.
Укажите, следует ли экспортировать данные в общедоступный общий ресурс или в закрытую учетную запись хранения, для которой требуются учетные данные для входа, задав параметр типа проверки подлинности .
Общедоступный (URL-адрес SAS). Выберите этот параметр, если учетная запись поддерживает доступ через URL-адрес SAS. В поле URI-адрес SAS таблицы введите или вставьте полный URI, определяющий учетную запись и общедоступный большой двоичный объект.
URL-адрес SAS — это URL-адрес для доступа с ограниченным временем, который можно создать с помощью служебной программы хранилища Azure. На странице, доступной через URL-адрес SAS, данные могут храниться только в следующих форматах: CSV, TSV и ARFF.
Учетная запись. Выберите этот параметр, если данные находятся в частной учетной записи. Также необходимо указать учетные данные, включая имя учетной записи и ключ.
Если вы хотите экспортировать данные в защищенное, закрытое хранилище, укажите учетные данные, необходимые для доступа к учетной записи:
Имя учетной записи таблицы: введите или вставьте имя учетной записи, содержащей большой двоичный объект, к которому требуется получить доступ. Например, если полный URL-адрес учетной записи хранения —
https://myshared.table.core.windows.net, введитеmyshared.Ключ учетной записи таблицы: Вставьте ключ доступа, связанный с учетной записью хранения.
Имя таблицы: введите имя конкретной таблицы, которую требуется считать.
Укажите, какие столбцы следует сохранять в хранилище таблиц, и какие столбцы следует использовать при определении схемы таблицы с помощью свойств столбца.
ключ раздела: выберите столбец, который будет использоваться для секционирования сохраненного набора данных для таблицы в служба хранилища Azure. Таблицы в Azure разбиваются на разделы для поддержки балансировки нагрузки между узлами хранилища. Все табличные сущности упорядочены по секциям. Поэтому свойство PartitionKey является обязательным для всех операций с таблицами.
Ключ строки таблицы Azure: выберите столбец, который должен использоваться для свойства RowKey . Свойство RowKey является системным свойством, которое требуется для каждой сущности в таблице. Вместе со свойством PartitionKey он формирует уникальный индекс для каждой строки в таблице.
Примечание
Для RowKey и PartitionKeyнеобходимо использовать разные столбцы. Убедитесь, что любой столбец, выбранный для RowKey или PartitionKey, также включен в список целевых столбцов или возникает ошибка.
- Исходные столбцы в таблице Azure: выберите дополнительные столбцы из набора данных, который необходимо сохранить в таблице Azure. Необходимо также включить столбцы, выбранные для PartitionKey и RowKey.
дополнительные сведения о таблицах в служба хранилища Azure см. в разделе основные сведения о модели данных службы таблиц.
Укажите имена столбцов, которые должны быть записаны в таблицу.
Важно!
Необходимо указать имя столбца для каждого столбца, который вы выводите в таблицу, включая RowKey, PartitionKeyи все исходные столбцы.
Если число введенных столбцов не соответствует числу выходных столбцов, возникает ошибка.
При вводе новых имен столбцов они должны быть указаны в порядке индексов столбцов исходных столбцов.
Режим записи в таблицу Azure: укажите, как следует вести себя при экспорте данных , если данные уже существуют в таблице Azure.
INSERT:
Insert EntityОперация вставляет новую сущность с уникальным первичным ключом, которая формируется из комбинации свойств PartitionKey и RowKey .Слияние.
Merge Entityоперация обновляет существующую сущность, обновляя ее свойства. Эта операция не заменяет существующую сущность.Replace:
Update Entityоперация заменяет содержимое заданной сущности в таблице.InsertOrReplace:
InsertOrReplace EntityОперация вставляет сущность, если сущность не существует. Если она существует, заменяется существующая сущность.InsertOrMerge:
InsertOrMerge EntityОперация вставляет сущность, если сущность не существует. Если сущность существует, предоставленные свойства сущности объединяются с уже существующими.
Использовать кэшированные результаты: укажите, следует ли обновлять данные при каждом запуске эксперимента.
Если выбран этот параметр, то модуль Export Data (экспорт данных ) сохраняет данные в указанную таблицу при первом запуске эксперимента, а затем не выполняет операции записи, если не были внесены изменения в поток.
Если отменить выбор этого параметра, данные будут записываться в назначение каждый раз при выполнении эксперимента независимо от того, совпадают ли данные.
Запустите эксперимент.
Технические примечания
В этом разделе содержатся сведения и советы относительно реализации, а также ответы на часто задаваемые вопросы.
Часто задаваемые вопросы
Почему при записи в существующую таблицу возникает ошибка
Проверьте схему таблицы, чтобы убедиться, что имена столбцов и типы данных совпадают. Например, в хранилище таблиц Azure столбец ИДЕНТИФИКАТОРов должен быть строкой.
Если возникает ошибка, Ошибка 0027: размер переданных объектов не согласуется, убедитесь, что таблица существует в указанном контейнере. в настоящее время Azure ML может выполнять запись только в существующие таблицы.
Почему возникает ошибка, не удается найти существующий столбец
Если вы не выполняли эксперимент, то при экспорте данныхне обнаруживаются вышестоящее столбцы. При внесении в эксперимент любых вышестоящего изменения может потребоваться удалить модуль Экспорт данных , а затем добавить и перенастроить его.
Как избежать повторной записи одних и тех же данных
Если данные в эксперименте изменяются по какой бы то ни было причине, модуль Экспорт данных всегда будет записывать новые данные.
Однако если эксперимент выполняется с другим изменением, которое не влияет на результаты, установите для параметра использовать кэшированные результаты значение true. Модуль проверит, выполнялся ли этот эксперимент ранее с теми же параметрами, и если предыдущий результат найден, данные не будут записаны в таблицу Azure.
Можно ли экспортировать данные в другой географический регион
Да. Тем не менее, если учетная запись хранения находится в другом регионе на кластерном узле, используемом для эксперимента машинного обучения, доступ к данным может быть медленнее. Кроме того, вы платите за входящий и исходящий данные подписки.
Примеры
Примеры использования этих модулей машинного обучения см. в Коллекция решений ии Azure.
Параметры модуля
Общедоступные или SAS-открытые варианты
| Имя | Диапазон | Тип | По умолчанию | Описание |
|---|---|---|---|---|
| URI SAS таблицы | any | Строка |
Учетная запись — параметры частной учетной записи
| Имя | Диапазон | Тип | По умолчанию | Описание |
|---|---|---|---|---|
| Имя учетной записи таблицы | ||||
| Ключ учетной записи таблицы | any | SecureString |
Варианты хранилищ
| Имя | Диапазон | Тип | По умолчанию | Описание |
|---|---|---|---|---|
| Имя таблицы | Строка | нет | ||
| Ключ раздела | any | SecureString | нет | Выберите столбец, который будет использоваться в качестве ключа при секционировании таблицы. Если столбец не выбран, имя столбца в качестве ключа секции для всех записей |
| Ключ строки таблицы Azure | any | колумнпиккер | нет | Выберите столбец, содержащий уникальный идентификатор для строк таблицы. По умолчанию используется ключ строки на основе идентификатора GUID |
| Исходные столбцы таблицы Azure | any | колумнпиккер | нет | Укажите, какие столбцы включать в таблицу: по имени или по индексу столбца |
| Целевые столбцы таблицы Azure | any | Строка | нет | Введите имена столбцов для использования в целевой таблице |
| Режим записи таблицы Azure | List: INSERT, MERGE, Replace, InsertOrReplace, InsertOrMerge | Перечисление | нет | |
| Использование кэшированных результатов | True или false | Логическое | FALSE | Модуль выполняется только в том случае, если не существует допустимого кэша. в противном случае используйте кэшированные данные из предыдущих выполнений. |
Исключения
| Исключение | Описание |
|---|---|
| Ошибка 0027 | Исключение возникает, если два объекта должны быть одинакового размера, но это не так. |
| Ошибка 0003 | Исключение возникает, если один или несколько входных аргументов имеют значение NULL или пусты. |
| Ошибка 0029 | Исключение возникает при передаче недопустимого универсального кода ресурса. |
| Ошибка 0030 | Исключение возникает, когда не удается скачать файл. |
| Ошибка 0002 | Исключение возникает, если один или несколько параметров не удалось проанализировать или преобразовать из заданного типа в необходимый для целевого метода тип. |
| Ошибка 0009 | Исключение возникает, если имя учетной записи хранилища Azure или имя контейнера указаны неверно. |
| Ошибка 0048 | Исключение возникает, когда не удается открыть файл. |
| Ошибка 0046 | Исключение возникает, если не удается создать каталог по указанному пути. |
| Ошибка 0049 | Исключение возникает, когда не удается проанализировать файл. |
список ошибок, относящихся к модулям студии (классическая версия), см. в разделе Машинное обучение коды ошибок.
список исключений API см. в разделе Машинное обучение REST API коды ошибок.
См. также раздел
Импорт данных
Экспорт данных
Экспорт Базу данных SQL Azure
Экспорт данных в хранилище BLOB-объектов Azure
Экспорт в запрос Hive