Рекомендации по продуктам Azure для использования в розничной торговле

Хранилище BLOB-объектов
Центры событий
HDInsight
Stream Analytics
Power BI

Идеи, связанные с решением

Эта статья — идея решения. Если вы хотите, чтобы мы дополнили содержимое дополнительными сведениями, такими как потенциальные варианты использования, альтернативные службы, рекомендации по реализации или рекомендации по ценообразованию, сообщите нам об этом, предоставив отзыв на GitHub.

Эта идея решения реализует процесс агрегирования данных клиентов в полный профиль.

Архитектура

Схема архитектуры, показывающая поток данных между генератором событий и панелью мониторинга. Другие этапы включают аналитику и машинное обучение.

Скачайте файл Visio этой архитектуры.

Поток данных

  1. Генератор данных передает имитированные события клиента для Центры событий Azure.
  2. Задание Azure Stream Analytics считывает данные из Центров событий и выполняет агрегаты.
  3. Stream Analytics сохраняет сгруппированные по времени данные для Хранилище BLOB-объектов Azure.
  4. Задание Spark, выполняемое в Azure HDInsight, объединяет последние данные браузера клиентов с данными о покупках и демографическими данными, чтобы создать объединенный профиль пользователя.
  5. Второе задание Spark оценивает каждый профиль клиента по модели машинного обучения. Этот процесс прогнозирует будущие модели приобретения. Эти прогнозы показывают, может ли данный клиент совершить покупку в ближайшие 30 дней. Если это так, система определяет вероятную категорию продукта покупки.
  6. Прогнозы и другие данные профиля визуализируются и совместно используются в виде диаграмм и таблиц в служба Power BI.

Компоненты

  • Хранилище BLOB-объектов — это служба, которая является частью службы хранилища Azure. Хранилище BLOB-объектов предлагает оптимизированное облачное хранилище для больших объемов неструктурированных данных.
  • Центры событий — это полностью управляемая платформа потоковой передачи.
  • Машинное обучение Azure — это облачная среда, которую можно использовать для обучения, развертывания, автоматизации, администрирования и отслеживания моделей машинного обучения.
  • Azure SQL База данных — это полностью управляемое ядро СУБД PaaS (платформа как услуга). База данных SQL работает в последней стабильной версии SQL Server и операционной системе с исправлениями.
  • Stream Analytics предлагает бессерверную потоковую обработку в реальном времени. Эта служба позволяет выполнять запросы в облаке и на пограничных устройствах.
  • Power BI — это служба бизнес-аналитики, которая предоставляет интерактивные визуализации и возможности бизнес-аналитики. Простой в использовании интерфейс позволяет создавать собственные отчеты и панели мониторинга.
  • HDInsight — это управляемая полнофункциональный облачный аналитический сервис с открытым кодом для предприятий.

Сведения о сценарии

Глубокое понимание интересов клиентов и шаблонов приобретения является критически важным компонентом любой операции бизнес-аналитики розничной торговли. Эта идея решения объединяет данные клиентов в полный профиль. Расширенные модели машинного обучения поддерживаются надежностью и вычислительной мощностью Azure для предоставления прогнозной аналитики смоделированных клиентов.

Потенциальные варианты использования

Это решение обычно используется розничными торговцами.

Развертывание этого сценария

Дополнительные сведения о построении этого решения см. в руководстве по решению на сайте GitHub.

Типичный розничный бизнес собирает данные клиентов через различные каналы. Эти каналы включают шаблоны просмотра веб-страниц, поведение покупок, демографические данные и другие веб-данные на основе сеансов. Некоторые данные порождены основными бизнес-операциями. Однако другие данные необходимо извлекать и объединять из внешних источников, таких как партнеры, производители, общественное достояние и т. д.

Многие предприятия применяют лишь небольшую часть доступных данных, но для максимальной рентабельности инвестиций бизнес должен интегрировать соответствующие данные из всех источников. Традиционно интеграция внешних разнородных источников данных в общую подсистему обработки данных требует значительных усилий и ресурсов для настройки. Это решение описывает простой и масштабируемый подход к интеграции аналитики и машинного обучения для прогнозирования покупательской активности клиентов.

Функции решения

В этом решении рассматриваются проблемы, описанные в предыдущем разделе:

  • Благодаря равномерному доступу к данным из нескольких источников данных с минимальным перемещением данных и сложностью системы, что повышает производительность.
  • Путем выполнения операций извлечения, передачи и загрузки (ETL) и проектирования признаков, необходимых для использования модели прогнозного машинного обучения.
  • Путем создания комплексного профиля клиента 360, который дополняется прогнозной аналитикой, которая выполняется в распределенной системе. Этот анализ поддерживается Microsoft R Server и HDInsight.

Дальнейшие действия