Расширенная архитектура решений для аналитики

Службы Azure Analysis Services
хранилище BLOB-объектов Azure
Azure Cosmos DB
Azure Synapse Analytics
Power BI

Идеи, связанные с решением

Эта статья — идея решения. Если вы хотите, чтобы мы дополнили содержимое дополнительными сведениями, такими как потенциальные варианты использования, альтернативные службы, рекомендации по реализации или рекомендации по ценам, сообщите нам об этом, предоставив отзыв на GitHub.

Эта архитектура позволяет объединять любые данные в любом масштабе с пользовательским машинным обучением и получать аналитику данных практически в реальном времени в службах потоковой передачи.

Архитектура

Схема расширенной архитектуры аналитики с использованием Azure Synapse Analytics с Azure Data Lake Storage, Azure Analysis Services, Azure Cosmos DB и Power BI.

Скачайте файл Visio этой архитектуры.

Поток данных

  1. Объедините все структурированные, неструктурированные и частично структурированные данные (журналы, файлы и мультимедиа) с помощью конвейеров Synapse для Azure Data Lake Storage.
  2. Используйте пулы Apache Spark для очистки и преобразования бесструктурных наборов данных и их объединения со структурированными данными из операционных баз данных или хранилищ данных.
  3. Используйте масштабируемые методы машинного обучения и глубокого обучения для получения более глубокой аналитики из этих данных с помощью Python, Scala или .NET с помощью записных книжек в пуле Apache Spark.
  4. Примените пул Apache Spark и конвейеры Synapse в Azure Synapse Analytics для доступа к данным и перемещения в большом масштабе.
  5. Запрос данных в Power BI и создание отчетов по ней.
  6. Воспользуйтесь аналитическими сведениями из пулов Apache Spark в Azure Cosmos DB, чтобы сделать их доступными через веб-приложения и мобильные приложения.

Рабочий процесс

  • Azure Synapse Analytics — это быстрое, гибкое и надежное облачное хранилище данных, которое позволяет масштабировать, вычислять и хранить эластично и независимо с архитектурой массовой параллельной обработки.
  • Документация по конвейерам Synapse позволяет создавать, планировать и оркестрировать рабочие процессы ETL/ELT.
  • Хранилище BLOB-объектов Azure — это масштабируемое хранилище объектов для любого типа неструктурированных изображений данных, видео, аудио, документов и более простое и экономичное.
  • пулы Spark Azure Synapse Analytics — это быстрая, простая и совместная платформа аналитики на основе Apache Spark.
  • Azure Cosmos DB — это многомодельная глобально распределенная служба баз данных. Узнайте, как реплицировать данные в любом количестве регионов Azure и масштабировать пропускную способность независимо от хранилища.
  • Azure Synapse Link для Azure Cosmos DB позволяет практически в реальном времени выполнять аналитику по операционным данным в Azure Cosmos DB без какого-либо снижения производительности или повышения затрат на транзакционную рабочую нагрузку. Для этого применяются два аналитических модуля, доступные в рабочей области Azure Synapse: бессерверная служба SQL и пулы Spark.
  • Azure Analysis Services — это аналитика корпоративного уровня как услуга, которая позволяет с уверенностью управлять, развертывать, тестировать и предоставлять решение бизнес-аналитики.
  • Power BI — это набор инструментов бизнес-аналитики, которые обеспечивают целостное представление обо всей вашей организации. Подключение к сотням источников данных, упрощение подготовки данных и внеплановый анализ. Создавать красивые отчеты, а затем публиковать их для вашей организации, чтобы использовать их в Интернете и на мобильных устройствах.

Альтернативные варианты

  • Synapse Link является предпочтительным решением Майкрософт для аналитики на основе данных Azure Cosmos DB.

Сведения о сценарии

Преобразуйте данные в полезные сведения с помощью лучших в своем классе средств машинного обучения. Это решение позволяет объединять любые данные в любом масштабе, а также создавать и развертывать пользовательские модели машинного обучения в большом масштабе. Сведения о том, как платформы данных корпоративного уровня разрабатываются как часть целевой зоны предприятия, см. в документации по целевой зоне данных Cloud Adoption Framework.

Потенциальные варианты использования

Организации имеют возможность получить доступ к большему набору данных, чем когда-либо прежде. Расширенная аналитика помогает воспользоваться преимуществами аналитики данных. К областям относятся:

  • Обслуживание клиентов.
  • средств прогнозного обслуживания;
  • Рекомендации по продуктам или службам.
  • Оптимизация системы от цепочек поставок до операций центра обработки данных.
  • Разработка продуктов и услуг.

Рекомендации

Оптимизация затрат

Оптимизация затрат заключается в поиске способов уменьшения ненужных расходов и повышения эффективности работы. Дополнительные сведения см. в разделе Обзор критерия "Оптимизация затрат".

Дальнейшие действия

См. следующую документацию по службам, которые представлены в этой архитектуре: