Примечание.
Для доступа к этой странице требуется авторизация. Вы можете попробовать войти или изменить каталоги.
Для доступа к этой странице требуется авторизация. Вы можете попробовать изменить каталоги.
ПРИМЕНИМО К:
Azure Data Factory
Azure Synapse Analytics
Совет
Data Factory в Microsoft Fabric — это следующее поколение Azure Data Factory с более простой архитектурой, встроенным ИИ и новыми функциями. Если вы не знакомы с интеграцией данных, начните с Fabric Data Factory. Существующие рабочие нагрузки ADF могут обновляться до Fabric для доступа к новым возможностям в области обработки и анализа данных, аналитики в режиме реального времени и отчетов.
В этом руководстве вы создаете пакет Data Factory, который демонстрирует некоторые функции управления потоком. Этот конвейер выполняет простую копию из контейнера в Azure Blob Storage в другой контейнер в той же учетной записи хранения. Если действие копирования завершается успешно, конвейер отправляет по электронной почте подробную информацию об успешной операции копирования (например, количество записанных данных). Если происходит сбой действия копирования, конвейер отправляет по электронной почте данные об ошибке копирования (например, текст сообщения об ошибке). В этом руководстве вы научитесь передавать параметры.
Общие сведения о сценарии:
В этом руководстве вы выполните следующие шаги:
- Создали фабрику данных.
- Создайте связанную службу Azure Storage.
- Создание набора данных BLOB Azure
- Создайте конвейер, содержащий действие копирования и веб-действие.
- Отправка результатов действий для последующих действий.
- Использование передачи параметров и системных переменных.
- Запуск конвейера.
- Следите за процессами конвейера и активностями.
В этом руководстве используется портал Azure. Для взаимодействия с Azure Data Factory можно использовать другие механизмы, см. статью "Краткие руководства" в разделе оглавления.
Предварительные условия
- подписка Azure. Если у вас нет подписки Azure, создайте учетную запись free перед началом работы.
- учетная запись Azure Storage. Blob-хранилище используется как источник данных. Если у вас нет учетной записи хранения Azure, см. статью Создание учетной записи хранения с инструкциями по её созданию.
- База данных SQL Azure. Вы используете базу данных как хранилище данных приемник. Если у вас нет базы данных в Azure SQL Database, ознакомьтесь со статьей Create a database in Azure SQL Database для получения пошаговых инструкций по её созданию.
Создать таблицу больших двоичных объектов
Запустите Блокнот. Скопируйте следующий текст и сохраните его в файл input.txt на диске.
John,Doe Jane,DoeИспользуйте такие средства, как Azure Storage Explorer выполните следующие действия:
- Создайте контейнер adfv2branch.
- Создайте папку input в контейнере adfv2branch.
- Передайте файл input.txt в этот контейнер.
Создание конечных точек рабочего процесса электронной почты
Чтобы активировать отправку сообщения электронной почты из конвейера, используйте Azure Logic Apps для определения рабочего процесса. Дополнительные сведения о создании рабочего процесса приложения логики см. в статье "Создание примера рабочего процесса приложения логики потребления".
Рабочий процесс успешной отправки сообщения электронной почты
Создайте рабочий процесс приложения логики потребления с именем CopySuccessEmail. Добавьте триггер запроса с именем Когда получен HTTP-запрос и добавьте действие Office 365 Outlook с именем Отправить электронное письмо. При появлении запроса войдите в учетную запись Office 365 Outlook.
Для триггера запроса заполните схему тела запроса JSON следующим кодом JSON:
{
"properties": {
"dataFactoryName": {
"type": "string"
},
"message": {
"type": "string"
},
"pipelineName": {
"type": "string"
},
"receiver": {
"type": "string"
}
},
"type": "object"
}
Триггер запроса в конструкторе рабочих процессов должен выглядеть следующим образом:
Для действия отправки электронной почты настройте способ форматирования электронной почты, используя свойства, переданные в схеме JSON текста запроса. Рассмотрим пример:
Сохраните рабочий процесс. Запишите URL-адрес запроса HTTP Post для рабочего процесса успешной электронной почты.
//Success Request Url
https://prodxxx.eastus.logic.azure.com:443/workflows/000000/triggers/manual/paths/invoke?api-version=2016-10-01&sp=%2Ftriggers%2Fmanual%2Frun&sv=1.0&sig=000000
Рабочий процесс сбоя отправки сообщения электронной почты
Выполните те же действия, чтобы создать другой рабочий процесс приложения логики с именем CopyFailEmail. В триггере «Запрос» значение схемы JSON тела запроса такое же. Измените формат вашего электронного письма, как Subject, чтобы адаптировать его на случай неудачи. Рассмотрим пример:
Сохраните рабочий процесс. Запишите URL-адрес запроса HTTP Post для вашего рабочего процесса отправки электронной почты при ошибке.
//Fail Request Url
https://prodxxx.eastus.logic.azure.com:443/workflows/000000/triggers/manual/paths/invoke?api-version=2016-10-01&sp=%2Ftriggers%2Fmanual%2Frun&sv=1.0&sig=000000
Теперь у вас будут два URL-адреса рабочих процессов.
//Success Request Url
https://prodxxx.eastus.logic.azure.com:443/workflows/000000/triggers/manual/paths/invoke?api-version=2016-10-01&sp=%2Ftriggers%2Fmanual%2Frun&sv=1.0&sig=000000
//Fail Request Url
https://prodxxx.eastus.logic.azure.com:443/workflows/000000/triggers/manual/paths/invoke?api-version=2016-10-01&sp=%2Ftriggers%2Fmanual%2Frun&sv=1.0&sig=000000
Создание фабрики данных
Запустите веб-браузер Microsoft Edge или Google Chrome. В настоящее время пользовательский интерфейс фабрики данных поддерживается только в Microsoft Edge и веб-браузерах Google Chrome.
Разверните меню в левом верхнем углу и выберите "Создать ресурс". Затем выберите Аналитика>фабрика данных:
На странице Новая фабрика данных введите ADFTutorialDataFactory в поле Имя.
Имя фабрики данных Azure должно быть уникальным в мире. При возникновении указанной ниже ошибки измените имя фабрики данных (например, на ваше_имя_ADFTutorialDataFactory) и попробуйте создать фабрику данных снова. Ознакомьтесь со статьей Фабрика данных — правила именования, чтобы узнать правила именования для артефактов "Фабрики данных".
Имя фабрики данных ADFTutorialDataFactory недоступно.
Выберите подписку Azure, где вы хотите создать фабрику данных.
Для группы ресурсов выполните одно из следующих действий.
Выберите Использовать существующуюи укажите существующую группу ресурсов в раскрывающемся списке.
Выберите Создать новуюи укажите имя группы ресурсов.
Дополнительные сведения о группах ресурсов см. в статье Пользование групп ресурсов для управления ресурсами Azure.
Укажите V2 при выборе версии.
Укажите расположение фабрики данных. В раскрывающемся списке отображаются только поддерживаемые местоположения. Хранилища данных (Azure Storage, Azure SQL Database и т. д.) и вычислительные ресурсы (HDInsight и т. д.), используемые фабрикой данных, могут находиться в других регионах.
Выберите Закрепить на панели управления.
Нажмите кнопку Создать.
Когда завершится создание, откроется страница Фабрика данных, как показано на рисунке ниже.
Щелкните плитку Open Azure Data Factory Studio, чтобы запустить пользовательский интерфейс Azure Data Factory на отдельной вкладке.
Создание конвейера
На данном этапе вы создадите конвейер с одной копировальной операцией и двумя веб-действиями. Вы используете следующие функции для создания пайплайна:
- параметры конвейера, к которым осуществляется доступ с помощью наборов данных.
- Веб-действие для запуска рабочих процессов логических приложений с целью отправки электронных писем о завершении — успешном или неудачном.
- Соединение одной активности с другой (в случае успеха и неудачи)
- использование выходных данных действия в качестве входных данных для последующего действия.
На главной странице пользовательского интерфейса Data Factory выберите плитку Orchestrate (Оркестрация).
В окне свойств для конвейера перейдите на вкладку Параметры и нажмите кнопку Создать, чтобы добавить три строковых параметра sourceBlobContainer, sinkBlobContainer и receiver.
- Параметр sourceBlobContainer в конвейере используется исходным набором данных BLOB-объекта.
- sinkBlobContainer — параметр в конвейере, используемый набором данных контейнера приемника
- получатель — этот параметр используется двумя веб-действиями в конвейере, отправляющим сообщения об успешном выполнении или сбое получателю, адрес электронной почты которого указан этим параметром.
На панели элементов "Действия" найдите действие "Копировать" и перетащите действие копирования в область конструктора конвейеров.
Выберите операцию копирования, которую вы перетаскивали на рабочую поверхность конструктора конвейера. В окне Свойства для действия Копирование в нижней части окна перейдите на вкладку Источник и щелкните + Новый. На этом шаге вы создаете исходный набор данных для действия копирования.
В окне New Dataset выберите вкладку Azure вверху и выберите Azure Blob Storage и выберите Continue.
В окне "Выбор формата" выберите "Текст с разделителями" и нажмите кнопку "Продолжить".
Показан снимок экрана окна «Выбор формата» с выделенным форматом текст с разделителями.
Вы увидите новую вкладку, названную Задать свойства. Измените имя этого набора данных на SourceBlobDataset. Выберите раскрывающийся список связанной службы и нажмите кнопку +Создать, чтобы создать связанную службу в исходном наборе данных.
Откроется окно новой связанной службы , в котором можно заполнить необходимые свойства для связанной службы.
В окне New Linked Service (Новая связанная служба) сделайте следующее:
- Введите AzureStorageLinkedService в поле Имени.
- Выберите учетную запись хранения Azure с именем учетной записи Storage.
- Нажмите кнопку Создать.
В следующем окне Задать свойства выберите Открыть этот набор данных, чтобы ввести параметризованное значение для имени файла.
Введите
@pipeline().parameters.sourceBlobContainerв качестве имени папки иemp.txtв качестве имени файла.
Вернитесь на вкладку конвейера (или щелкните конвейер на дереве просмотра слева) и выберите действие копирования в дизайнере. Убедитесь, что для исходного набора данных выбран новый набор данных.
В окне свойств перейдите на вкладку Приемник и нажмите кнопку + Создать в поле Sink Dataset (Целевой набор данных). На этом этапе вы создаете приемный набор данных для копирования, так же, как вы создали исходный набор данных.
В окне New Dataset выберите Azure Blob Storage и щелкните Continue, а затем снова выберите DelimitedText в формате Select и снова щелкните Continue еще раз.
На странице свойств для набора данных, введите SinkBlobDataset для Имени и выберите AzureStorageLinkedService для LinkedService.
Разверните раздел "Дополнительно" страницы свойств и выберите "Открыть этот набор данных".
На вкладке Подключение измените путь к файлу. Введите
@pipeline().parameters.sinkBlobContainerпапку и@concat(pipeline().RunId, '.txt')имя файла. Это выражение использует идентификатор текущего запуска конвейера для создания имени файла. Списки поддерживаемых системных переменных и выражений вы найдете в статьях Системные переменные, поддерживаемые в фабрике данных Azure и Выражения и функции в фабрике данных Azure.
Переключитесь обратно на вкладку конвейера в верхней части. Найдите Web в строке поиска и перетащите Web действие на поверхность конструктора конвейера. Присвойте этому действию имя SendSuccessEmailActivity. Веб-действие разрешает выполнять запрос к любой конечной точке REST. Дополнительные сведения о деятельности см. в разделе Веб-активность. Этот конвейер использует веб-активность для активации рабочего процесса электронной почты Logic Apps.
Перейдите на вкладку Настройки из вкладки Общие и выполните следующие действия:
В поле URL-адрес укажите URL-адрес для рабочего процесса приложений логики, который отправляет сообщение электронной почты об успешном выполнении.
Выберите POST в поле Метод.
Щелкните ссылку + Добавить заголовок в разделе Заголовки.
Добавьте заголовок с именем Content-Type и значением application/json.
Внесите следующий код JSON в поле Текст.
{ "message": "@{activity('Copy1').output.dataWritten}", "dataFactoryName": "@{pipeline().DataFactory}", "pipelineName": "@{pipeline().Pipeline}", "receiver": "@pipeline().parameters.receiver" }Текст сообщения содержит следующие свойства.
Сообщение — передача значения
@{activity('Copy1').output.dataWritten. Обращается к свойству предыдущего действия копирования и передает значение dataWritten. В случае сбоя передайте выходные данные ошибки вместо@{activity('CopyBlobtoBlob').error.message.Имя фабрики данных — передаваемое значение
@{pipeline().DataFactory}— это системная переменная, позволяющая получить доступ к соответствующему имени фабрики данных. Список системных переменных см. в статье Системные переменные.Имя конвейера — передаваемое
@{pipeline().Pipeline}значение . Это системная переменная, которая позволяет обращаться к соответствующему имени конвейера.Получатель — передача значения "@pipeline().parameters.receiver"). Доступ к параметрам конвейера.
Подключите действие Copy к действию Web, перетащив зеленый флажок рядом с Copy и отпустив его на веб-действие.
Перетащите ещё одно Веб-действие из панели элементов "Действия" в область конструктора конвейера и задайте для него имяSendFailureEmailActivity.
Перейдите на вкладку Настройки и выполните здесь следующие действия:
Укажите URL-адрес для рабочего процесса в Logic Apps, который отправляет электронное письмо об ошибке.
Выберите POST в поле Метод.
Щелкните ссылку + Добавить заголовок в разделе Заголовки.
Добавьте заголовок с именем Content-Type и значением application/json.
Внесите следующий код JSON в поле Текст.
{ "message": "@{activity('Copy1').error.message}", "dataFactoryName": "@{pipeline().DataFactory}", "pipelineName": "@{pipeline().Pipeline}", "receiver": "@pipeline().parameters.receiver" }
Выберите красную кнопку X справа от активности Copy в pipeline designer и перетащите ее на только что созданную активность SendFailureEmailActivity.
Чтобы проверить работу конвейера, нажмите кнопку Проверка на панели инструментов. Закройте окно Pipeline Validation Output, нажав кнопку >>.
Чтобы опубликовать сущности (наборы данных, конвейеры и т. д.) в службу фабрики данных, щелкните Опубликовать все. Дождитесь, пока не увидите сообщение Успешно опубликовано.
Запустите выполнение конвейера, которое завершится успешно
Чтобы запустить конвейер, щелкните Триггер на панели инструментов, а затем Trigger Now (Запустить сейчас).
В окне Запуск конвейера выполните следующие действия.
Введите adftutorial/adfv2branch/input в качестве значения для параметра sourceBlobContainer.
Введите adftutorial/adfv2branch/output в качестве значения для параметра sinkBlobContainer.
Введите адрес электронной почты для получателя.
Нажмите кнопку Готово.
Следите за успешным выполнением конвейера
Чтобы отследить выполнение конвейера, перейдите на вкладку Мониторинг слева. Вы видите, что запуск конвейера был инициирован вручную вами. Нажмите кнопку Обновить, чтобы обновить этот список.
Чтобы просмотреть запуски действий, связанные с этим запуском конвейера, щелкните первую ссылку в столбце Действия. Вы можете переключиться к предыдущему представлению, щелкнув раздел Конвейеры вверху страницы. Нажмите кнопку Обновить, чтобы обновить этот список.
Запуск конвейера, который завершится сбоем
Перейдите на вкладку Правка слева.
Чтобы запустить конвейер, щелкните Триггер на панели инструментов, а затем Trigger Now (Запустить сейчас).
В окне Запуск конвейера выполните следующие действия.
- Введите adftutorial/dummy/input в качестве значения для параметра sourceBlobContainer. Убедитесь, что папка dummy не существует в контейнере adftutorial.
- Введите adftutorial/dummy/output в качестве значения для параметра sinkBlobContainer.
- Введите адрес электронной почты для получателя.
- Нажмите кнопку Готово.
Отследите неудачный запуск конвейера.
Чтобы отследить выполнение конвейера, перейдите на вкладку Мониторинг слева. Вы видите, что запуск конвейера был инициирован вручную вами. Нажмите кнопку Обновить, чтобы обновить этот список.
Щелкните ссылку Ошибка рядом с запуском конвейера, чтобы просмотреть сведения об этой ошибке.
Чтобы просмотреть запуски действий, связанные с этим запуском конвейера, щелкните первую ссылку в столбце Действия. Нажмите кнопку Обновить, чтобы обновить этот список. Обратите внимание, что "Copy activity" в конвейере завершилось сбоем. Веб-действию удалось отправить сообщение об ошибке указанному получателю.
Щелкните ссылку Ошибка в столбце Действия, чтобы просмотреть сведения об этой ошибке.
Связанный контент
В этом руководстве вы выполнили следующие шаги:
- Создали фабрику данных.
- Создайте связанную службу Azure Storage.
- Создание набора данных BLOB Azure
- Создайте конвейер, который содержит действие копирования и веб-действие.
- Отправка результатов действий для последующих действий.
- Использование передачи параметров и системных переменных.
- Запуск конвейера.
- Следите за процессами конвейера и активностями.
Теперь вы можете перейти к разделу "Основные понятия" для получения дополнительных сведений о Azure Data Factory.