Безопасное копирование данных из Хранилища BLOB-объектов Azure в Базу данных SQL с помощью частных конечных точек

Статья
03.10.2024

ОБЛАСТЬ ПРИМЕНЕНИЯ: Фабрика данных Azure Azure Synapse Analytics

Совет

Попробуйте использовать фабрику данных в Microsoft Fabric, решение для аналитики с одним интерфейсом для предприятий. Microsoft Fabric охватывает все, от перемещения данных до обработки и анализа данных в режиме реального времени, бизнес-аналитики и отчетности. Узнайте, как бесплатно запустить новую пробную версию !

В этом руководстве вы создадите фабрику данных с помощью пользовательского интерфейса фабрики данных Azure. Конвейер в этой фабрике данных безопасно копирует данные из хранилища BLOB-объектов Azure в базу данных SQL Azure (как разрешающую доступ только к выбранным сетям), используя частные конечные точки в Фабрика данных Azure управляемых виртуальная сеть. Шаблон конфигурации в этом руководстве применяется к копированию из файлового в реляционное хранилище данных. Список хранилищ данных, которые поддерживаются в качестве источников и приемников, см. в таблице Поддерживаемые хранилища данных и форматы. Функция частных конечных точек доступна во всех уровнях Фабрика данных Azure, поэтому для их использования не требуется никакого конкретного уровня. Дополнительные сведения о ценах и категориях см. на странице цен на Фабрика данных Azure.

Примечание

Если вы еще не работали с фабрикой данных, ознакомьтесь со статьей Введение в фабрику данных Azure.

Вот какие шаги выполняются в этом руководстве:

Создали фабрику данных.
создание конвейера с действием копирования;

Необходимые компоненты

Подписка Azure. Если у вас еще нет подписки Azure, создайте бесплатную учетную запись Azure, прежде чем начинать работу.
Учетная запись хранения Azure. В этом руководстве в качестве источника будет использоваться хранилище BLOB-объектов. Если у вас нет учетной записи хранения, создайте ее, следуя действиям в этом разделе. Убедитесь, что получить доступ к учетной записи хранения можно только из выбранных сетей.
База данных SQL Azure. Используйте базу данных как хранилище данных-приемник. Если у вас нет базы данных SQL, создайте ее, следуя указаниям в статье Создание базы данных SQL Azure на портале Azure. Убедитесь, что получить доступ к службе "База данных SQL" можно только из выбранных сетей.

Создание большого двоичного объекта и таблицы SQL

Теперь подготовьте хранилище больших двоичных объектов и базу данных SQL к изучению этого учебника, выполнив следующие действия.

Создание исходного большого двоичного объекта

Откройте Блокнот. Скопируйте следующий текст и сохраните его в файл emp.txt на диске.
```
FirstName,LastName
John,Doe
Jane,Doe
```
Создайте контейнер с именем adftutorial в хранилище BLOB-объектов. Создайте папку input в этом контейнере. Затем отправьте файл emp.txt в папку input. Эти задачи можно выполнить с помощью портала Azure или специальных средств, таких как Обозреватель службы хранилища Azure.

Создание таблицы-приемника SQL

Используйте следующий скрипт SQL, чтобы создать таблицу dbo.emp в базе данных SQL.

SQL

CREATE TABLE dbo.emp
(
    ID int IDENTITY(1,1) NOT NULL,
    FirstName varchar(50),
    LastName varchar(50)
)
GO

CREATE CLUSTERED INDEX IX_emp_ID ON dbo.emp (ID);

Создание фабрики данных

На этом этапе вы создадите фабрику данных и запустите пользовательский интерфейс службы "Фабрика данных" для создания конвейера в фабрике данных.

Откройте Microsoft Edge или Google Chrome. Сейчас только эти браузеры поддерживают пользовательский интерфейс фабрики данных.
В меню слева выберите Создать ресурс>Аналитика>Фабрика данных.
На странице Новая фабрика данных в поле Имя введите ADFTutorialDataFactory.

Имя фабрики данных Azure должно быть глобально уникальным. Если вы увидите следующую ошибку касательно значения имени, введите другое имя фабрики данных (например, yournameADFTutorialDataFactory). Дополнительные сведения о правилах именования артефактов фабрики данных см. в статье Фабрика данных Azure — правила именования.
Выберите подписку Azure, в рамках которой вы хотите создать фабрику данных.
Для группы ресурсов выполните одно из следующих действий:
- Выберите Использовать существующуюи укажите существующую группу ресурсов в раскрывающемся списке.
- Выберите Создать новуюи укажите имя группы ресурсов.
Сведения о группах ресурсов см. в статье Общие сведения об Azure Resource Manager.
В качестве версии выберите V2.
В поле Расположение выберите расположение фабрики данных. В раскрывающемся списке отображаются только поддерживаемые расположения. Хранилища данных (например, служба хранилища Azure и база данных SQL) и вычислительные ресурсы (например, Azure HDInsight), используемые фабрикой данных, могут располагаться в других регионах.
Нажмите кнопку создания.
После завершения создания вы увидите уведомление в центре уведомлений. Выберите Перейти к ресурсу, чтобы открыть страницу фабрики данных.
Выберите Открыть на плитке Open Azure Data Factory Studio (Открыть студию Фабрики данных Azure), чтобы запустить пользовательский интерфейс Фабрики данных на отдельной вкладке.

Создание среды выполнения интеграции Azure в управляемой виртуальной сети Фабрики данных

На этом шаге вы создадите среду выполнения интеграции Azure и включите управляемую виртуальную сеть Фабрики данных.

На портале Фабрики данных перейдите в раздел Управление и выберите Создать, чтобы создать среду выполнения интеграции Azure.
На странице Integration runtime setup (Настройка среды выполнения интеграции) выберите, какую среду выполнения интеграции следует создать на основе требуемых возможностей. По условиям этого руководства выберите Azure и нажмите кнопку Продолжить.
Выберите Azure и щелкните Продолжить, чтобы создать среду выполнения интеграции Azure.
В разделе Virtual network configuration (Preview) (Конфигурация виртуальной сети (предварительная версия)) выберите Включить.
Нажмите кнопку создания.

Создание конвейера

На этом шаге вы создадите в фабрике данных конвейер с действием копирования. Это действие копирования копирует данные из хранилища BLOB-объектов в базу данных SQL. В предыдущем руководстве вы создали конвейер, выполнив следующие действия:

Создание связанной службы.
Создание входных и выходных наборов данных.
Создание конвейера.

В этом учебнике вы сразу приступите к созданию конвейера, а связанные службы и наборы данных будете создавать по мере необходимости для настройки конвейера.

На домашней странице выберите Orchestrate (Оркестрация).
На панели свойств для конвейера введите CopyPipeline в поле имени конвейера.
На панели элементов Действия разверните категорию Move and Transform (Переместить и преобразовать) и перетащите действие Копирование данных из панели элементов в область конструктора конвейера. В качестве имени введите CopyFromBlobToSql.

Настройка источника

Совет

В этом учебнике в качестве типа проверки подлинности для исходного хранилища данных используется ключ учетной записи. При необходимости вы также можете выбрать другие поддерживаемые способы проверки подлинности, такие как универсальный код ресурса SAS, субъект-службу и управляемое удостоверение. Дополнительные сведения см. в соответствующих разделах статьи Копирование данных в хранилище больших двоичных объектов Azure и обратно с помощью фабрики данных Azure.

Чтобы безопасно хранить секреты для хранилищ данных, также рекомендуется использовать Azure Key Vault. Дополнительные сведения и иллюстрации см. в статье Хранение учетных данных в Azure Key Vault.

Создание исходного набора данных и связанной службы

Перейдите на вкладку "Источник ". Нажмите +Создать , чтобы создать исходный набор данных.
В диалоговом окне Новый набор данных выберите Хранилище BLOB-объектов Azure и щелкните Продолжить. Выберите Хранилище BLOB-объектов для исходного набора данных, потому что именно там находится источник данных.
В диалоговом окне Выбор формата выберите тип формата ваших данных, а затем нажмите кнопку Продолжить.
В диалоговом окне Установка свойств введите SourceBlobDataset в качестве имени. Установите флажок Использовать первую строку в качестве заголовка. В текстовом поле Связанная служба выберите + Создать.
В окне New Linked Service (Azure Blob Storage) (Новая связанная служба (хранилище BLOB-объектов Azure)) в качестве имени введите AzureStorageLinkedService и выберите учетную запись хранения в списке Имя учетной записи хранения.
Обязательно включите режим Интерактивная разработка. Его включение может занять около одной минуты.
Выберите Test connection (Проверить подключение). Эта операция должна завершиться сбоем, если получить доступ к учетной записи хранения можно только из выбранной сети. Это означает, что Фабрике данных нужно создать частную конечную точку и получить для нее утверждение, прежде чем использовать ее. В сообщении об ошибке должна присутствовать ссылка, по которой вы можете перейти к интерфейсу создания управляемой частной конечной точки. Кроме того, можно сразу открыть вкладку Управление и выполнить инструкции из следующего раздела, чтобы создать управляемую частную конечную точку.

Примечание

Вкладка Управление может быть доступна не для всех экземпляров фабрики данных. Если она не отображается, вы можете получить доступ к частным конечным точкам, выбрав Создание>Подключения>Частная конечная точка.
Не закрывая это диалоговое окно, перейдите к учетной записи хранения.
Следуйте инструкциям в этом разделе, чтобы утвердить частную ссылку.
Вернитесь к диалоговому окну. Выберите Проверить соединение, а затем нажмите кнопку Создать, чтобы развернуть связанную службу.
После создания связанной службы снова откроется страница Установка свойств. Рядом с полем Путь к файлу выберите Обзор.
Перейдите к папке adftutorial/input, выберите файл emp.txt и нажмите кнопку OK.
Нажмите ОК. Автоматически откроется страница конвейера. Убедитесь, что на вкладке Источник выбрано значение SourceBlobDataset. Чтобы просмотреть данные на этой странице, выберите Просмотр данных.

Создание управляемой частной конечной точки

Если вы не переходили по гиперссылке при проверке подключения, перейдите по указанному пути. Здесь вам нужно создать управляемую частную конечную точку, которая будет подключаться к созданной связанной службе.

Перейдите на вкладку Управление.

Примечание

Вкладка Управление может быть доступна не для всех экземпляров фабрики данных. Если она не отображается, вы можете получить доступ к частным конечным точкам, выбрав Создание>Подключения>Частная конечная точка.
Перейдите в раздел Managed private endpoints (Управляемые частные конечные точки).
В разделе Managed private endpoints (Управляемые частные конечные точки) выберите + Создать.
Выберите в списке плитку Хранилище BLOB-объектов Azure, а затем щелкните Продолжить.
Введите имя созданной учетной записи хранения.
Нажмите кнопку создания.
Через несколько секунд для созданной частной ссылки отобразится состояние ожидания утверждения.
Выберите созданную частную конечную точку. Вы увидите гиперссылку, которая ведет к интерфейсу утверждения частной конечной точки на уровне учетной записи хранения.

Утверждение частной ссылки в учетной записи хранения

В разделе Параметры для учетной записи хранения выберите Подключения частных конечных точек.
Установите флажок для созданной частной конечной точки и выберите Утвердить.
Добавьте описание и выберите Да.
Вернитесь к разделу Managed private endpoints (Управляемые частные конечные точки) на вкладке Управление для Фабрики данных.
Через одну-две минуты в пользовательском интерфейсе Фабрики данных отобразится состояние ожидания утверждения частной конечной точки.

Настройка приемника

Совет

В этом учебнике проверка подлинности хранилища данных приемника выполняется с помощью проверки подлинности SQL. При необходимости вы также можете выбрать другие поддерживаемые способы проверки подлинности, такие как субъект-службу и управляемое удостоверение. Дополнительные сведения см. в соответствующих разделах статьи о копировании и преобразовании данных в службе "База данных SQL Azure" с помощью Фабрики данных Azure.

Создание целевого набора данных и связанной службы

Перейдите на вкладку Приемник и выберите + Создать, чтобы создать целевой набор данных.
В диалоговом окне Новый набор данных в поле поиска введите SQL, чтобы отфильтровать соединители. Выберите База данных SQL Azure и нажмите кнопку Продолжить. В этом руководстве вы будете копировать данные в базу данных SQL.
В диалоговом окне Установка свойств введите OutputSqlDataset в качестве имени. В раскрывающемся списке Связанная служба выберите + Создать. Связанную службу нужно сопоставить с набором данных. Связанная служба содержит строку подключения, которая потребуется фабрике данных для подключения к базе данных SQL в среде выполнения. Набор данных определяет контейнер, папку и (необязательно) файл, куда копируются данные.
В диалоговом окне New Linked Service (Azure SQL Database) (Новая связанная служба (База данных SQL Azure)) сделайте следующее:
1. В поле Имя введите AzureSqlDatabaseLinkedService.
2. В списке Имя сервера выберите необходимый экземпляр SQL Server.
3. Обязательно включите режим Интерактивная разработка.
4. В списке Имя базы данных выберите базу данных SQL.
5. В поле Имя пользователя введите имя пользователя.
6. В поле Пароль введите пароль для этого пользователя.
7. Выберите Test connection (Проверить подключение). Операция должна завершиться сбоем, так как получить доступ к серверу SQL можно только из выбранных сетей. Это означает, что Фабрике данных нужно создать частную конечную точку и получить для нее утверждение, прежде чем использовать ее. В сообщении об ошибке должна присутствовать ссылка, по которой вы можете перейти к интерфейсу создания управляемой частной конечной точки. Кроме того, можно сразу открыть вкладку Управление и выполнить инструкции из следующего раздела, чтобы создать управляемую частную конечную точку.
8. Не закрывая это диалоговое окно, перейдите к выбранному экземпляру SQL Server.
9. Следуйте инструкциям в этом разделе, чтобы утвердить частную ссылку.
10. Вернитесь к диалоговому окну. Выберите Проверить соединение, а затем нажмите кнопку Создать, чтобы развернуть связанную службу.
Автоматически откроется диалоговое окно Установка свойств. В поле Таблица выберите [dbo].[emp]. Затем выберите OK.
Перейдите на вкладку с конвейером и убедитесь, что в поле Sink Dataset (Целевой набор данных) выбрано значение OutputSqlDataset.

При необходимости вы можете сопоставить схему источника с соответствующей схемой назначения, выполнив действия в статье Сопоставление схемы в действии копирования.

Создание управляемой частной конечной точки

Перейдите на вкладку Управление.
Перейдите в раздел Managed private endpoints (Управляемые частные конечные точки).
В разделе Managed private endpoints (Управляемые частные конечные точки) выберите + Создать.
Выберите в списке плитку База данных SQL Azure, а затем нажмите кнопку Продолжить.
Введите имя выбранного экземпляра SQL Server.
Нажмите кнопку создания.
Через несколько секунд для созданной частной ссылки отобразится состояние ожидания утверждения.
Выберите созданную частную конечную точку. Вы увидите гиперссылку, которая ведет к интерфейсу утверждения частной конечной точки на уровне SQL Server.

Утверждение частной ссылки в экземпляре SQL Server

В разделе Параметры для экземпляра SQL Server выберите Подключения частных конечных точек.
Установите флажок для созданной частной конечной точки и выберите Утвердить.
Добавьте описание и выберите Да.
Вернитесь к разделу Managed private endpoints (Управляемые частные конечные точки) на вкладке Управление для Фабрики данных.
Через одну-две минуты для частной конечной точки отобразится состояние ожидания утверждения.

Отладка и публикация конвейера

Вы можете отладить работу конвейера, прежде чем публиковать артефакты (связанные службы, наборы данных и конвейер) в фабрике данных или вашем собственном репозитории Git Azure Repos.

Чтобы выполнить отладку конвейера, на панели инструментов щелкните Отладка. Состояние выполнения конвейера вы можете найти на вкладке Выходные данные в нижней части окна.
После успешного запуска конвейера в верхней панели инструментов выберите Опубликовать все. Это действие опубликует созданные сущности (наборы данных и конвейеры) в фабрике данных.
Дождитесь сообщения Опубликовано. Чтобы отобразить сообщения с уведомлениями, выберите Показывать уведомления в правом верхнем углу (кнопка в виде колокольчика).

Итоги

В этом примере конвейер копирует данные из Хранилища BLOB-объектов в службу "База данных SQL" с помощью частной конечной точки в управляемой виртуальной сети Фабрики данных. Вы научились выполнять следующие задачи:

Создали фабрику данных.
создание конвейера с действием копирования;

Примечание. Автор создал эту статью с помощью ИИ. Подробнее

Дополнительные ресурсы

Документация

Управляемая виртуальная сеть и управляемые частные конечные точки - Azure Data Factory

Сведения об управляемой виртуальной сети и управляемых частных конечных точках в Фабрике данных Azure.
Использование Приватного канала Azure для Фабрики данных Azure - Azure Data Factory

Узнайте, как работает Приватный канал Azure в Фабрике данных Azure.
Доступ к локальному серверу SQL Server из управляемой виртуальной сети Фабрики данных с помощью частной конечной точки - Azure Data Factory

В этом учебнике описано, как с помощью портала Azure настроить службу "Приватный канал" и получить доступ к локальному серверу SQL Server из управляемой виртуальной сети с помощью частной конечной точки.
Перенос существующей среды выполнения интеграции Azure в среду выполнения интеграции Azure в управляемой виртуальной сети - Azure Data Factory

В этом руководстве описано, как перевести существующую среду выполнения интеграции Azure в среду выполнения интеграции Azure в управляемой виртуальной сети.
Стратегии получения доступа к данным - Azure Data Factory

Фабрика данных Azure теперь поддерживает диапазоны статических IP-адресов.
Копирование и прямое и обратное преобразование данных на SQL Server - Azure Data Factory & Azure Synapse

Сведения о том, как копировать и преобразовывать данные в базу данных SQL Server, которая находится в локальной среде или на виртуальной машине Azure, и преобразовывать их с помощью Фабрики данных Azure или конвейеров Azure Synapse Analytics.
Среда выполнения интеграции - Azure Data Factory & Azure Synapse

Здесь приведены сведения о среде выполнения интеграции в Фабрике данных Azure и Azure Synapse Analytics.
IP-адреса Azure Integration Runtime - Azure Data Factory

Узнайте, из каких IP-адресов необходимо разрешить исходящий трафик, чтобы правильно настроить брандмауэры для защиты сетевого доступа к хранилищам данных.

Обучение

Модуль

Использование конвейеров фабрики данных в Microsoft Fabric - Training

Использование конвейеров фабрики данных в Microsoft Fabric

Сертификация

Microsoft Certified: Azure Data Engineer Associate (Сертификация Майкрософт. Помощник Инженера данных Azure) - Certifications

Продемонстрировать понимание распространенных задач проектирования данных для реализации рабочих нагрузок проектирования данных и управления ими в Microsoft Azure с помощью ряда служб Azure.

События

FabCon Vegas

31 мар., 23 - 2 апр., 23

Самое большое событие обучения Fabric, Power BI и SQL. 31 марта – 2 апреля. Используйте код FABINSIDER, чтобы сэкономить $400.

Зарегистрироваться сегодня

Поделиться через

Безопасное копирование данных из Хранилища BLOB-объектов Azure в Базу данных SQL с помощью частных конечных точек

Необходимые компоненты

Создание большого двоичного объекта и таблицы SQL

Создание исходного большого двоичного объекта

Создание таблицы-приемника SQL

Создание фабрики данных

Создание среды выполнения интеграции Azure в управляемой виртуальной сети Фабрики данных

Создание конвейера

Настройка источника

Создание исходного набора данных и связанной службы

Создание управляемой частной конечной точки

Утверждение частной ссылки в учетной записи хранения

Настройка приемника

Создание целевого набора данных и связанной службы

Создание управляемой частной конечной точки

Утверждение частной ссылки в экземпляре SQL Server

Отладка и публикация конвейера

Итоги

Обратная связь

Дополнительные ресурсы