Использование Azure Synapse Analytics с облачной аналитикой

Azure Synapse Analytics — это подготовленная к работе интегрированная служба аналитики, которая ускоряет извлечение аналитических сведений в разных хранилищах данных и системах больших данных. Azure Synapse Analytics позволяет использовать следующие возможности.

  • Лучшие технологии SQL, используемые в хранилищах корпоративных данных.
  • Технологии Spark, используемые для больших данных.
  • Конвейеры для приложения данных (с выравниванием источника) и извлечения, преобразования и загрузки (ETL) или извлечения, загрузки и преобразования (ELT).

Azure Synapse Studio — это инструмент в Azure Synapse, который предоставляет единый интерфейс для управления, мониторинга, кодирования и безопасности. Synapse Studio имеет глубокую интеграцию с другими службами Azure, такими как Power BI, Azure Cosmos DB и Машинное обучение Azure.

Примечание.

В этом разделе описаны предписанные конфигурации, относящиеся к облачной аналитике. Это дополнение к официальной документации по Azure Synapse Analytics.

Обзор

Во время начальной настройки целевой зоны данных можно развернуть единую рабочую область Azure Synapse Analytics для использования всеми аналитиками и специалистами по обработке данных. Можно создать больше рабочих областей для определенных интеграций данных или продуктов данных.

Вам может потребоваться дополнительная рабочая область Azure Synapse Analytics, если продукту данных необходимо предоставить доступ к стандартизованным данным с безопасностью на уровне строк и на уровне столбцов. Для этих рабочих областей можно предоставить пулы Azure Synapse. Командам по обработке продуктов данных может потребоваться собственная рабочая область для создания продуктов данных и отдельная рабочая область, предназначенная только для команд по обработке продуктов с ограниченным доступом к разработке.

Настройка Azure Synapse Analytics

Первым шагом в развертывании Azure Synapse Analytics является настройка рабочей области Azure Synapse, которая подключена к учетной записи Azure Purview.

Возможности работы с сетями в Azure Synapse Analytics

Целевая зона данных создает рабочие области с использованием управляемой виртуальной сети Azure Synapse Analytics. Взаимодействие с Azure Synapse осуществляется через три предоставляемые конечные точки: пул SQL, SQL по запросу и конечную точку разработки.

На уровне сети аналитика облачного масштабирования использует управляемые частные конечные точки synapse. Эти конечные точки гарантируют, что весь трафик между виртуальной сетью целевой зоны данных и рабочими областями Azure Synapse полностью перемещается по магистральной сети Microsoft.

Управление доступом к данным в Azure Synapse

Используйте списки управления доступом с помощью сквозной передачи Microsoft Entra в Azure Synapse Analytics для управления доступом к файлам в озере данных.

Для данных, в которых необходимо ограничить возвращаемые столбцы и строки, рекомендуется использовать безопасность на уровне строк и столбцов, чтобы ограничить доступ к данным в таблицах в выделенном или бессерверном пуле SQL Azure Synapse. Безопасность на уровне строк и столбцов реализована на уровне базы данных и в дополнение к ролям базы данных.

Например, безопасность на уровне строк гарантирует, что пользователи в определенном приложении данных (с выравниванием по источнику) или продукте данных отображаются только собственные данные. Даже если в таблице содержатся корпоративные данные.

Можно сочетать безопасность на уровне строк с безопасностью на уровне столбцов, чтобы ограничить доступ к столбцам с конфиденциальными данными. Таким образом, и безопасность на уровне строк, и безопасность на уровне столбцов применяют логику ограничения доступа на уровне базы данных, а не на уровне приложений. Разрешение оценивается каждый раз при попытке доступа к данным с любого уровня.

Примечание.

Бессерверный пул SQL Azure Synapse поддерживает безопасность на уровне столбцов для представлений, а не для внешних таблиц. В случае внешних таблиц можно создать логическое представление поверх внешней таблицы и применить безопасность на уровне столбцов. В случае безопасности на уровне строк настраиваемые представления можно использовать в качестве обходного решения.

Дополнительные сведения см. в статье Об управлении доступом к данным Azure Synapse Analytics.

Управление доступом к данным Azure Synapse в Azure Data Lake

При развертывании рабочей области Azure Synapse Analytics потребуется учетная запись Azure Data Lake Storage из подписки или URL-адрес учетной записи хранения. Указанная учетная запись хранения определяется как основная для развернутой рабочей области Azure Synapse для хранения данных. Azure Synapse хранит данные в контейнере, который включает таблицы Apache Spark и журналы приложений Spark в папке с именем /synapse/{workspaceName}. Также имеется контейнер для управления любыми библиотеками, которые вы решите установить.

Совет

Рекомендуется использовать выделенный контейнер на уровне разработки или трех учетных записей озера данных. Этот контейнер используется в качестве основного хранилища для хранения метаданных Spark.

См. статью Управление доступом к данным Azure Synapse Analytics для получения рекомендаций по настройке доступа к данным.

Следующие шаги