Заметка
Доступ к этой странице требует авторизации. Вы можете попробовать войти в систему или изменить каталог.
Доступ к этой странице требует авторизации. Вы можете попробовать сменить директорию.
ОТНОСИТСЯ К:
Машинное обучение Studio (классическое)
Машинное обучение Azure
Внимание
Поддержка Студии машинного обучения (классической) будет прекращена 31 августа 2024 г. До этой даты рекомендуется перейти на Машинное обучение Azure.
Начиная с 1 декабря 2021 года вы не сможете создавать новые ресурсы Студии машинного обучения (классической). Существующие ресурсы Студии машинного обучения (классической) можно будет использовать до 31 августа 2024 г.
- См. сведения о переносе проектов машинного обучения из Студии машинного обучения (классическая версия) в Машинное обучение Azure.
- См. дополнительные сведения о Машинном обучении Azure.
Закрывается поддержка документации по продукту ML Studio (classic), и в будущем она может не обновляться.
Зачастую на предприятиях, работающих с локальными данными, используются преимущества масштабируемости и гибкости облака для рабочих нагрузок машинного обучения. Но при этом на предприятиях не хотят нарушать свои текущие бизнес-процессы и рабочие процессы, перемещая их локальные данные в облако. Студия машинного обучения (классическая модель) теперь поддерживает чтение данных из базы данных SQL Server с последующим обучением и оценкой модели по этим данным. Больше не требуется вручную копировать и синхронизировать данные между облаком и локальным сервером. Вместо этого модуль Импорт данных в Студии машинного обучения (классическая модель) теперь может считывать данные для заданий обучения и оценки непосредственно из базы данных SQL Server.
Эта статья содержит общие сведения о передаче данных сервера SQL Server в Студию машинного обучения (классическая модель). Предполагается, что вы знакомы с такими основными понятиями Студии (классическая модель), как рабочие области, модули, наборы данных, эксперименты и т. д.
Примечание.
Эта функция недоступна для бесплатных рабочих пространств. Дополнительные сведения о ценах и уровнях машинного обучения см. на странице Цены на Machine Learning Studio (классическая версия).
Установка локальной среды выполнения интеграции фабрики данных
Для доступа к базе данных SQL Server из Студии машинного обучения (классическая модель) вам необходимо скачать и установить локальную среду выполнения интеграции Фабрики данных, ранее известную как шлюз управления данными. При настройке подключения в Студии машинного обучения (классическая версия) у вас будет возможность скачать и установить Среду выполнения интеграции (IR), используя описанное ниже диалоговое окно Скачивание и регистрация шлюза данных.
Среду выполнения интеграции также можно установить заранее, скачав и запустив пакет установки MSI из Центра загрузки Майкрософт. С помощью пакета установки MSI также можно обновить существующую среду выполнения интеграции до последней версии с сохранением всех параметров.
Для установки локальной среды выполнения интеграции фабрики данных необходимо выполнить следующие предварительные требования:
- Для локальной среды выполнения интеграции фабрики данных необходима 64-разрядная операционная система с установленной платформой .NET Framework 4.6.1 или более поздней версии.
- Поддерживаемые версии ОС Windows: Windows 10 , Windows Server 2012, Windows Server 2012 R2 и Windows Server 2016.
- Рекомендуемая конфигурация для компьютера, на котором будет размещена среда выполнения интеграции: четырехъядерный процессор с тактовой частотой не менее 2 ГГц, не менее 8 ГБ ОЗУ и не менее 80 ГБ дискового пространства.
- Если хост-компьютер переходит в режим гибернации, ИК-передатчик перестает отвечать на запросы данных. Поэтому перед установкой интеграционной среды на компьютере следует настроить соответствующую схему управления питанием. Если компьютер настроен на гибернацию, то установка IR выдаст сообщение.
- Поскольку копирование осуществляется с определенной частотой, использование ресурсов компьютера (ЦП, память) также следует этому же типичному образцу с пиковыми и спокойными периодами. Использование ресурсов также зависит от объема перемещаемых данных. Когда выполняется несколько заданий копирования, в пиковые периоды уровень использования ресурсов системы повышается. Выше приведены минимальные требования к конфигурации, технически являющейся достаточной. Мы рекомендуем всегда иметь больше ресурсов, чем указано для минимальной конфигурации, так как нагрузка зависит от объема перемещаемых данных.
При настройке и использовании собственной среды выполнения интеграции фабрики данных учитывайте следующее:
На одном компьютере может быть установлен только один экземпляр IR.
Можно использовать единое интеграционное средство выполнения для нескольких локальных источников данных.
Несколько сред выполнения интеграции на разных компьютерах можно подключить к одному и тому же локальному источнику данных.
Среды выполнения интеграции можно настроить только для одной рабочей области одновременно. В настоящее время интеграционные ресурсы не могут быть совместно использованы между рабочими пространствами.
Для одной рабочей области можно настроить несколько сред выполнения интеграции. Например, во время разработки можно использовать IR, которая подключена к тестовым источникам данных, а для запуска в эксплуатацию — рабочую IR.
Среда выполнения интеграции необязательно должна находиться на том же компьютере, что и источник данных. Но если он расположен вблизи источника данных, это ускоряет подключение шлюза к этому источнику. Мы рекомендуем установить среду выполнения интеграции на компьютере, отличном от того, на котором размещен локальный источник данных, чтобы среда выполнения интеграции не конкурировала с источником данных за использование ресурсов.
Если вы уже установили среду выполнения интеграции на компьютер, который используется для сценариев Power BI или Фабрики данных Azure, установите отдельную среду выполнения интеграции для Студии машинного обучения (классическая модель) на другом компьютере.
Примечание.
Локальная среда выполнения Data Factory и шлюз Power BI не могут работать одновременно на одном и том же компьютере.
Необходимо использовать локальную среду выполнения интеграции для Студии машинного обучения (классическая модель), даже если вы используете Azure ExpressRoute для других данных. Источник данных следует считать локальным (то есть защищенным брандмауэром), даже если используется ExpressRoute. Для связи между студией машинного обучения и источником данных следует использовать локальную среду выполнения интеграции фабрики данных.
Дополнительные сведения о предварительных требованиях для установки, этапах установки и устранении неполадок см. в статье Среда выполнения интеграции в фабрике данных.
Импорт данных из базы данных SQL Server в машинное обучение
В этом пошаговом руководстве описывается, как установить среду выполнения интеграции Фабрики данных Azure в рабочей области Машинного обучения Azure, настроить ее, а затем считывать данные из базы данных SQL Server.
Совет
Прежде чем начать, отключите блокирование всплывающих окон в браузере для studio.azureml.net. Если вы используете браузер Google Chrome, скачайте и установите одно из нескольких расширений, доступных в интернет-магазине Google Chrome Click Once App Extension.
Примечание.
Локальная среда выполнения интеграции фабрики данных Azure ранее называлась "шлюзом управления данными". В этом пошаговом руководстве она по-прежнему будет называться "шлюзом".
Шаг 1. Создание шлюза
Первым шагом является создание и настройка шлюза для доступа к базе данных SQL.
Войдите в Студию машинного обучения (классическая) и выберите необходимую рабочую область.
Щелкните колонку ПАРАМЕТРЫ слева и выберите вкладку ШЛЮЗЫ ДАННЫХ вверху.
Щелкните НОВЫЙ ШЛЮЗ ДАННЫХ в нижней части экрана.
В диалоговом окне Новый шлюз данных введите имя шлюза и при необходимости добавьте его описание. Щелкните стрелку в нижнем правом углу, чтобы перейти к следующему шагу настройки.
В диалоговом окне Download and register data gateway (Скачивание и регистрация шлюза данных) скопируйте ключ регистрации шлюза в буфер обмена.
Если вы еще не скачали и не установили шлюз управления данными Майкрософт, щелкните Download data management gateway(Скачать шлюз управления данными). Вы перейдете в Центр загрузки Майкрософт, где можно выбрать нужную версию шлюза, скачать ее и установить. Дополнительные сведения о необходимых условиях для установки, этапах установки и устранении неполадок можно найти в подразделах в начале статьи Перемещение данных между локальными источниками и облаком при помощи шлюза управления данными.
После установки шлюза откроется диспетчер конфигурации шлюза управления данными и появится диалоговое окно Регистрация шлюза . Вставьте ключ регистрации шлюза, скопированный в буфер обмена, и нажмите кнопку Зарегистрировать.
Если вы уже установили шлюз, запустите диспетчер конфигурации шлюза управления данными. Щелкните Изменить ключ, вставьте ключ регистрации шлюза, скопированный в буфер обмена на предыдущем шаге, и нажмите кнопку ОК.
Когда установка будет завершена, отобразится диалоговое окно Регистрация шлюза для диспетчера конфигурации шлюза управления данными Майкрософт. Вставьте ключ регистрации шлюза, скопированный в буфер обмена на предыдущем шаге, и щелкните Зарегистрировать.
Настройка шлюза будет завершена после задания следующих значений на вкладке Главная в диспетчере конфигурации шлюза управления данными Майкрософт.
В полях Имя шлюза и Имя экземпляра указывается имя шлюза.
Для параметра Регистрация установлено значение Зарегистрировано.
В поле Состояние установлено значение Запущено.
В строке состояния внизу отображается надпись Подключение к облачной службе шлюза управления данными установлено и зеленый флажок.
При успешной регистрации Студия Машинного Обучения (классическая версия) также обновляется.
В диалоговом окне Download and register data gateway (Скачивание и регистрация шлюза данных) щелкните галочку, чтобы завершить настройку. На странице Параметры отображается состояние шлюза "В сети". В области справа можно просмотреть состояние и другие полезные сведения.
В диспетчере конфигурации шлюза управления данными Майкрософт перейдите на вкладку Сертификат. Сертификат, указанный на этой вкладке, используется для шифрования и расшифровывания учетных данных локального хранилища данных, указанного на портале. Это созданный по умолчанию сертификат. Корпорация Майкрософт рекомендует заменить его собственным сертификатом, сохраненном в системе управления сертификатами. Чтобы использовать вместо него собственный сертификат, щелкните Изменить .
(Необязательно.) Если для устранения проблем со шлюзом вы хотите использовать подробное ведение журнала, то в диспетчере конфигурации шлюза управления данными перейдите на вкладку Диагностика и установите флажок Включить запись подробных сведений в журнал для устранения неполадок. Данные журналов можно изучить в средстве просмотра событий Windows, развернув узел Журналы приложений и служб ->Шлюз управления данными. На вкладке Диагностика можно также проверить подключение к локальному источнику данных через шлюз.
На этом процесс установки шлюза в Студии машинного обучения (классическая модель) завершается. Теперь все готово к использованию локальных данных.
В Студии машинного обучения (классическая модель) можно создать и настроить несколько шлюзов для каждой рабочей области. Например, можно использовать один шлюз, который будет подключаться к тестовым источникам данных во время разработки, и второй шлюз для подключения к рабочим источникам данных. Студия машинного обучения (классическая модель) позволяет настроить несколько шлюзов в соответствии с вашей корпоративной средой. В настоящее время шлюз нельзя совместно использовать между несколькими рабочими областями и на одном компьютере можно установить только один шлюз. Дополнительные сведения см. в статье Перемещение данных между локальными источниками и облаком с помощью шлюза управления данными.
Шаг 2. Использование шлюза для чтения данных из локального источника данных
После настройки шлюза можно добавить в эксперимент модуль Импорт данных, который вводит данные из базы данных SQL Server.
В Студии машинного обучения (классическая модель) выберите вкладку Эксперименты, щелкните +Создать в левом нижнем углу и выберите пустой эксперимент (либо один из примеров экспериментов).
Найдите и перетащите модуль Импорт данных на холст эксперимента.
Внизу холста нажмите кнопку Сохранить как . Введите "Студия машинного обучения (классическая) на уровне предприятия: Учебник по SQL Server" для названия эксперимента, выберите рабочую область и нажмите кнопку ОК.
Щелкните модуль Импорт данных, чтобы выбрать его, а затем в области Свойства справа от полотна в раскрывающемся списке Источник данных выберите "Локальная база данных SQL".
Выберите шлюз данных , который вы установили и зарегистрировали. Вы можете установить еще один шлюз, выбрав "(Добавить шлюз данных…)".
Введите имя сервера базы данных SQL и имя базы данных SQL, а также SQL-запрос к базе данных, который требуется выполнить.
Нажмите кнопку Enter values (Введите значения) в разделе Имя пользователя и пароль и введите учетные данные базы данных. Вы можете воспользоваться функцией встроенной проверки подлинности Windows или проверку подлинности SQL Server в зависимости от того, как настроен ваш SQL Server.
Сообщение "values required" (Требуются значения) изменится на "values set" (Значения заданы) с зеленой галочкой. Необходимо только один раз ввести учетные данные, если только не изменится информация о базе данных или пароль. Студия машинного обучения (классическая модель) использует сертификат, предоставленный при установке шлюза, для шифрования учетных данных в облаке. Azure никогда не хранит локальные учетные данные без шифрования.
Щелкните ЗАПУСТИТЬ , чтобы выполнить эксперимент.
После завершения эксперимента можно визуализировать данные, импортированные из базы данных, щелкнув порт вывода модуля Import Data (Импорт данных) и выбрав Visualize (Визуализировать).
После завершения разработки эксперимента можно развернуть и ввести в эксплуатацию свою модель. С помощью службы выполнения пакетов из базы данных SQL Server, настроенной в модуле Импорт данных, будут считываться данные, которые будут использоваться для оценки. Хотя вы можете для оценки локальных данных использовать службу ответа на запросы, вместо нее корпорация Майкрософт рекомендует использовать надстройку Excel . В настоящее время запись в базу данных SQL Server через модуль Экспорт данных не поддерживается в экспериментах или опубликованных веб-службах.