аналитику в масштабах облака;

Благодаря более крупным и изощренным формам внедрения облачных технологий переход к облаку становится все более сложным. Аналитика в масштабе облака Azure — это масштабируемая, воспроизводимая платформа, которая соответствует уникальным потребностям вашей организации для создания современных платформ данных.

Аналитика в масштабе облака охватывает как технические, так и нетехнических аспекты аналитики и управления в облаке. В этом руководстве мы стремимся поддерживать внедрение гибридных и многооблачных сред, не зависящих от облака, но включенные примеры технической реализации посвящены продуктам Azure.

Облачная аналитика имеет следующие цели:

  • Служить данными как продукт, а не побочный продукт
  • Предоставление экосистемы продуктов данных, а не единственного хранилища данных, которое может не соответствовать вашему сценарию данных
  • Использование подхода по умолчанию для обеспечения управления данными и обеспечения безопасности
  • Повысьте командам последовательно определять приоритеты бизнес-результатов, а не сосредоточиться только на базовых технологиях.

Аналитика в масштабе облака основана на платформе внедрения облачных технологий Майкрософт и требует понимания целевых зон. Если у вас еще нет реализации целевых зон Azure, проконсультируйтесь с облачными командами о том, как выполнить предварительные требования. Дополнительные сведения см. в разделе Подготовка среды к реализации плана по внедрению в облако.

Эталонные архитектуры позволяют начать с небольшого объема ресурсов и со временем увеличиваться, адаптируя сценарий к вашим вариантам использования.

Аналитика в масштабе облака включает повторяемые шаблоны, которые ускоряют развертывание пяти основных инфраструктур и ресурсов. Она также адаптируется для различных размеров организации. Если вы являетесь небольшим предприятием с ограниченными ресурсами, централизованная модель операций, смешиваемая с некоторыми экспертами по бизнес-теме, может соответствовать вашей ситуации. Если вы являетесь более крупным предприятием с автономными бизнес-подразделениями (каждый из которых имеет собственные инженеры данных и аналитики), то распределенная операционная модель, такая как сетка данных или структура данных, может лучше удовлетворить ваши потребности.

Задачи

Аналитика в масштабе облака предоставляет платформу, построенную на следующих принципах. Эти принципы устраняют проблемы со сложными архитектурами данных, которые не масштабируется в соответствии с потребностями организаций.

Принцип Description
Разрешить
  • Масштабирование без повышенной сложности
  • Разделение проблем с целью упростить управление
  • Создание инфраструктуры самообслуживания данных
Follow
  • Рекомендации по созданию хорошо спроектированных облачных служб
Поддержка
  • Локальные и многооблачные сценарии
Внедрение
  • Независимость от продуктов и поставщиков
  • Cloud Adoption Framework
Фиксация
  • Целевые зоны Azure в качестве базовой инфраструктуры для всех рабочих нагрузок
  • Операционная модель
Включить
  • Общая инфраструктура данных
  • Распределенная архитектура в режиме централизованного управления
  • Защищенная сетевая линия видимости

Рекомендации по реализации

Руководство по реализации можно разбить на два раздела:

  • Глобальное руководство, применимое ко всем рабочим нагрузкам.
  • Рекомендации по масштабированию облака

Глобальное руководство

Документация Описание
Cloud Adoption Framework Управление данными и управление ими — это процесс жизненного цикла, который начинается с разработки существующей облачной стратегии и обеспечивает выполнение текущих операций. Этот Cloud Adoption Framework помогает управлять полным жизненным циклом хранилища данных.
Хорошо спроектированная платформа Azure Архитектура рабочей нагрузки и операции оказывают непосредственное влияние на данные. Узнайте, как архитектура может улучшить управление данными рабочей нагрузки и управление ими.

Рекомендации по масштабированию облака

Section Описание
Создание начальной стратегии Как создать стратегию работы с данными и стать организацией, управляемой данными.
Определение плана Как разработать план для аналитики в масштабе облака.
Подготовка ресурсов аналитики Общие сведения об управлении данными и целевых зонах данных с ключевыми вопросами проектирования, такими как регистрация предприятия, сеть, управление удостоверениями и доступом, политики, непрерывность бизнес-процессов и аварийное восстановление.
Управление аналитикой Требования к управлению данными, каталогом данных, происхождением данных master управлением данными, качеством данных, соглашениями об общем доступе к данным и метаданными.
Защита ресурсов аналитики Как защитить аналитические ресурсы с помощью проверки подлинности и авторизации, конфиденциальности данных и управления доступом к данным.
Организация людей и команд Организация эффективных операций, ролей, команд и командных функций.
Управление аналитическим пространством Как подготовить платформу и наблюдаемость для сценария.

Архитектуры

В этом разделе рассматриваются сведения о физических реализациях аналитики в масштабе облака. Он сопоставляет физические архитектуры целевых зон управления данными и целевых зон данных.

Аналитика в масштабе облака имеет два основных понятия архитектуры:

  • Целевая зона данных
  • Целевая зона управления данными

Эти архитектуры стандартизируют рекомендации и минимизуют узкие места развертывания для команд разработчиков и могут ускорить развертывание распространенных решений аналитики в масштабе облака. Вы можете применить их рекомендации для архитектуры lakehouse и сетки данных. В этом руководстве представлены возможности, необходимые для хорошо управляемой платформы аналитики, которая масштабируется в соответствии с вашими потребностями.

На следующей схеме представлен обзор платформы данных, содержащей центральную целевую зону управления данными и несколько целевых зон данных.

Схема высокоуровневой структуры, содержащей как целевую зону управления данными, так и целевые зоны данных.

Вы можете начать с одной целевой зоны и выполнить масштабирование до нескольких целевых зон и управлять всеми ими из целевой зоны управления данными.

Дополнительные сведения см. в статье Обзор архитектур.

Шаблоны развертывания

Этот раздел содержит множество эталонных шаблонов, которые можно развернуть.

Хранилище Содержимое Обязательно Модель развертывания
Шаблон управления данными Центральные службы управления данными и общие службы данных, такие как каталог данных и локальная среда выполнения интеграции Да По одному на аналитику в масштабе облака
Шаблон целевой зоны данных Общие службы целевой зоны данных, включая прием, управление и хранение данных Да По одному на каждую целевую зону данных
Шаблон интеграции данных — пакетная обработка Дополнительные службы, необходимые для пакетной обработки данных Нет По одному или несколько на каждую целевую зону данных
Шаблон интеграции данных — потоковая обработка Дополнительные службы, необходимые для обработки потока данных Нет По одному или несколько на каждую целевую зону данных
Шаблон продукта данных — аналитика, обработка и анализ данных Дополнительные службы, необходимые для аналитики данных и искусственного интеллекта Нет По одному или несколько на каждую целевую зону данных

Эти шаблоны содержат шаблоны Azure Resource Manager, файлы параметров шаблонов и определения конвейера CI/CD для развертывания ресурсов.

Шаблоны могут меняться со временем из-за новых служб и требований Azure. Защитите ветвь main каждого репозитория, чтобы она оставалась без ошибок и готова к использованию и развертыванию. Используйте подписку на разработку, чтобы протестировать изменения конфигурации шаблона перед слиянием усовершенствований функций обратно в ветвь main.

Дополнительные сведения см. в разделе Шаблоны развертывания.

Акселераторы решений

Акселераторы решений — это проекты с открытым кодом на GitHub. Эти репозитории содержат ресурсы и сведения, которые упрощают и ускоряют решение проблем с помощью технологий.

Дополнительные сведения см. в разделе Акселераторы решений.

Рекомендации

Следующие расширенные статьи уровня 300+ в оглавлении облачной аналитики помогут центральным ИТ-командам развертывать инструменты и управлять процессами управления данными и управления ими:

Разверните раздел Рекомендуемые продукты Azure в оглавлении аналитики в масштабе облака , чтобы узнать о продуктах Azure, поддерживающих аналитику в масштабе облака.

Распространенные сценарии клиентов

Следующие распространенные пути взаимодействия с клиентами поддерживают аналитику в масштабе облака.

  • Подготовьте среду. Используйте статьи Подготовка среды в качестве ресурсов. Создайте процессы и подходы, которые поддерживают весь портфель рабочих нагрузок в пространстве данных.

  • Улучшите элементы управления в пространстве данных. Сосредоточьтесь на статьях Управление пространством данных и Защита пространства данных , чтобы интегрировать аналитику облачного масштаба в существующие операции.

  • Влиять на изменения отдельных рабочих нагрузок. По мере улучшения процессов аналитики в масштабе облака центральные команды управления данными будут находить требования, зависящие от знаний архитектуры отдельных рабочих нагрузок. Используйте статьи Об архитектуре , чтобы понять, как можно использовать сценарии внутри для вашего варианта использования.

  • Оптимизируйте отдельные рабочие нагрузки и группы рабочих нагрузок. Начните с руководства по Azure Well-Architected Framework , чтобы интегрировать стратегии аналитики в масштабе облака в отдельные рабочие нагрузки. В этом руководстве описываются рекомендации и архитектуры, которые центральные ИТ-отделы и команды управления должны использовать для ускорения разработки отдельных рабочих нагрузок.

  • Используйте рекомендации для адаптации отдельных ресурсов. Разверните раздел Рекомендации в оглавлении аналитики облачного масштаба , чтобы найти статьи о процессах подключения всего пространства данных в одну плоскость управления аналитикой облачного масштаба.

  • Используйте определенные продукты Azure. Ускоряйте и улучшайте возможности облачной аналитики с помощью продуктов Azure, приведенных в разделе Рекомендуемые продукты Azure в оглавлении облачной аналитики .

Выполнить действие

Дополнительные сведения о планировании реализации облачной аналитики см. в следующих разделах:

Дальнейшие действия

Начните работу с аналитикой в масштабе облака: