Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
В этой статье вы узнаете, как перенести данные из одного расположения в другое в учетной записи хранения Azure Data Lake 2-го поколения с помощью Azure Synapse Analytics.
Предпосылки
- Подписка Azure. Если у вас нет подписки Azure, создайте бесплатную учетную запись Azure перед началом работы.
- Учетная запись хранения Azure: Вы используете Azure Data Lake второго поколения в качестве источника данных. Если у вас нет учетной записи для хранения, см. раздел Создание учетной записи хранения в Azure для получения информации о действиях по ее созданию.
Создание связанных служб
В Azure Synapse Analytics связанная служба — это место, где определяется информация о подключении к другим службам. В этом разделе вы добавите Azure Synapse Analytics и Azure Data Lake 2-го поколения в качестве связанных служб.
- Откройте интерфейс пользователя Azure Synapse Analytics и перейдите на вкладку "Управление".
- В разделе Внешние подключения выберите Связанные службы.
- Чтобы добавить связанную службу, выберите Создать.
- Выберите плитку Azure Data Lake Storage 2-го поколения в списке и щелкните Продолжить.
- Введите учетные данные для проверки подлинности. В настоящее время поддерживаемые типы проверки подлинности: ключ учетной записи, служебный принципал и управляемое удостоверение. Выберите тестовое подключение, чтобы проверить правильность учетных данных.
- По завершении нажмите кнопку Создать.
Создание конвейера
Конвейер содержит логический поток для выполнения набора действий. В этом разделе вы создадите конвейер, содержащий действие копирования, которое отправляет данные из Azure Data Lake 2-го поколения в выделенный пул SQL.
- Перейдите на вкладку Orchestrate. Нажмите на значок плюса рядом с заголовком конвейеров и выберите Конвейер.
- В разделе Перемещение и преобразование в области действий перетащите Копирование данных на полотно конвейера.
- Выберите действие копирования и перейдите на вкладку Источника. Выберите Создать, чтобы создать новый исходный набор данных.
- Выберите Azure Data Lake Storage 2-го поколения в качестве хранилища данных и нажмите кнопку "Продолжить".
- Выберите DelimitedText в качестве формата и нажмите "Продолжить".
- В области параметров набора выберите созданную службу, связанную с ADLS. Укажите путь к файлу исходных данных и укажите, имеет ли первая строка заголовок. Схему можно импортировать из хранилища файлов или примера файла. Закончив, выберите OK.
- Перейдите на вкладку Слив. Выберите Новый, чтобы создать новый набор данных.
- Выберите Azure Data Lake Storage 2-го поколения в качестве хранилища данных и нажмите кнопку "Продолжить".
- Выберите DelimitedText в качестве формата и нажмите "Продолжить".
- В области параметров набора выберите созданную службу, связанную с ADLS. Укажите путь к папке, в которой требуется записать данные. Закончив, выберите OK.
Отладка и публикация конвейера
После завершения настройки конвейера можно выполнить отладку перед публикацией артефактов, чтобы убедиться, что все правильно.
- Чтобы выполнить отладку конвейера, на панели инструментов щелкните Отладка. Состояние выполнения конвейера вы можете найти на вкладке Выходные данные в нижней части окна.
- После успешного запуска конвейера на верхней панели инструментов выберите Опубликовать все. Это действие публикует сущности (наборы данных и конвейеры), созданные в службе Synapse Analytics.
- Дождитесь сообщения Успешно опубликовано. Чтобы просмотреть уведомления, нажмите кнопку колокольчика в правом верхнем углу.
Активация и мониторинг конвейера
На этом шаге вы вручную активируете конвейер, опубликованный на предыдущем шаге.
- Выберите Добавить триггер на панели инструментов, а затем Trigger Now (Запустить сейчас). На странице Запуск конвейера выберите Готово.
- Перейдите на вкладку Монитор, расположенную на левой панели. Вы видите выполнение конвейера, инициированное вручную. Ссылки в столбце Действия позволят вам просмотреть подробные сведения о активности и повторно выполнить поток обработки.
- Чтобы увидеть запуски действий, связанные с выполнением конвейера, выберите ссылку Просмотреть запуски действий в столбце Действия. В этом примере существует только одно действие, поэтому в списке отображается только одна запись. Для получения сведений об операции копирования выберите ссылку Сведения (значок в виде очков) в столбце Действия. Выберите Запуски конвейера в верхней части экрана, чтобы вернуться к представлению "Запуски конвейера". Чтобы обновить список, нажмите кнопку Обновить.
- Убедитесь, что данные правильно записаны в выделенном пуле SQL.
Дальнейшие действия
Дополнительные сведения об интеграции данных для Azure Synapse Analytics см. в статье «Загрузка данных в выделенный пул SQL».