Введение в руководство по хранилищу данных

Область применения: конечная точка аналитики SQL и хранилище в Microsoft Fabric

Microsoft Fabric предоставляет единый магазин для всех аналитических потребностей для каждого предприятия. Он охватывает полный спектр служб, включая перемещение данных, озеро данных, проектирование данных, интеграцию данных и обработку данных, аналитику в режиме реального времени и бизнес-аналитику. При использовании Microsoft Fabric нет необходимости объединять разные службы от нескольких поставщиков. Вместо этого клиент пользуется комплексным комплексным продуктом, который легко понять, подключить, создать и работать. Ни один другой продукт на рынке не предлагает широту, глубину и уровень интеграции, которую предлагает Microsoft Fabric. Кроме того, Microsoft Purview по умолчанию включается в каждый клиент для удовлетворения требований соответствия требованиям и управления.

Цель этого руководства

Хотя многие понятия в Microsoft Fabric могут быть знакомы специалистам по анализу данных и аналитики, это может быть сложно применить эти понятия в новой среде. В этом руководстве описаны пошаговые инструкции по комплексному сценарию получения данных до использования данных для создания базового понимания пользовательского интерфейса Microsoft Fabric, различных интерфейсов и точек интеграции, а также профессиональных и гражданских разработчиков Microsoft Fabric.

Учебники не предназначены для эталонной архитектуры, исчерпывающего списка функций и функций или рекомендации по конкретным рекомендациям.

Комплексный сценарий хранилища данных

В качестве необходимых компонентов для этого руководства выполните следующие действия.

  1. Войдите в учетную запись Power BI Online или если у вас еще нет учетной записи, зарегистрируйтесь для получения бесплатной пробной версии.
  2. Включите Microsoft Fabric в клиенте.

В этом руководстве вы берете на себя роль разработчика хранилища в вымышленной компании World Importers и выполните следующие действия на портале Microsoft Fabric для создания и реализации комплексного решения для хранилища данных:

  1. Создайте рабочую область Microsoft Fabric.
  2. Создание хранилища.
  3. Прием данных из источника в модель измерения хранилища данных с помощью конвейера данных.
  4. Создайте таблицы в хранилище.
  5. Загрузите данные с помощью T-SQL с помощью редактора sql-запросов.
  6. Преобразуйте данные для создания агрегированных наборов данных с помощью T-SQL.
  7. Используйте редактор визуальных запросов для запроса к хранилищу данных.
  8. Анализ данных с помощью записной книжки.
  9. Создание и выполнение запросов между хранилищами с помощью редактора SQL-запросов .
  10. Создайте отчеты Power BI с помощью режима DirectLake для анализа данных на месте.
  11. Создайте отчет из Центра данных.
  12. Очистка ресурсов путем удаления рабочей области и других элементов.

Сквозная архитектура хранилища данных

Схема, показывающая сквозную архитектуру хранилища данных.

Источники данных — Microsoft Fabric упрощает и быстро подключается к Службам данных Azure, другим облачным платформам и локальным источникам данных для приема данных.

Прием . С помощью 200+ собственных соединителей в рамках конвейера Microsoft Fabric и перетаскивания данных с помощью потока данных можно быстро создавать аналитические сведения для вашей организации. Ярлык — это новая функция в Microsoft Fabric, которая позволяет подключаться к существующим данным без необходимости копировать или перемещать их. Дополнительные сведения о функции ярлыка см. далее в этом руководстве.

Преобразование и хранение — Microsoft Fabric стандартизирует формат Delta Lake, что означает, что все подсистемы Microsoft Fabric могут считывать и работать с теми же данными, хранящимися в OneLake, — не требуется дедупликации данных. Это хранилище позволяет создавать хранилище данных или сетку данных на основе вашей организации. Для преобразования можно выбрать низкокодовый или безкодовый интерфейс с конвейерами и потоками данных или использовать T-SQL для первого взаимодействия с кодом.

Использование . Данные из хранилища можно использовать Power BI, ведущий инструмент бизнес-аналитики в отрасли для создания отчетов и визуализации. Каждое хранилище поставляется со встроенной конечной точкой TDS, чтобы легко подключаться к данным и запрашивать данные из других средств отчетности при необходимости. При создании хранилища вторичный элемент, называемый семантической моделью по умолчанию, создается одновременно с тем же именем. Вы можете использовать семантику по умолчанию, чтобы начать визуализацию данных с помощью всего нескольких шагов.

Демонстрационные данные

Для примера данных мы используем образец базы данных WWI. Для комплексного сценария хранилища данных мы создали достаточные данные для просмотра возможностей масштабирования и производительности платформы Microsoft Fabric.

Wide World Importers (WWI) является оптовым импортером товаров и распространителем товаров, работающих из района Сан-Франциско Бей. Как оптовик, клиенты WWI в основном являются компаниями, которые перепродают отдельным лицам. WWI продает розничным клиентам через США включая специализированные магазины, супермаркеты, вычислительные магазины, туристические магазины достопримечательность и некоторые лица. WWI также продает другим оптовикам через сеть агентов, которые способствуют продуктам от имени WWI. Дополнительные сведения о профиле и работе компании см . в примерах баз данных Wide World Importers для Microsoft SQL.

Как правило, данные из транзакционных систем (или бизнес-приложений) можно перенести в промежуточное пространство озера данных или хранилища данных. Однако в этом руководстве мы используем модель измерения, предоставляемую WWI в качестве исходного источника данных. Мы используем его в качестве источника для приема данных в хранилище данных и преобразования его с помощью T-SQL.

Модель данных

Хотя модель WWI-измерений содержит несколько таблиц фактов, в этом руководстве мы сосредоточимся только на fact_sale таблице и его связанных измерениях, как показано ниже, чтобы продемонстрировать этот комплексный сценарий хранилища данных:

Схема, на которой показана модель данных, используемая в этом руководстве, которая включает в себя fact_sale таблицу и связанные с ней измерения.

Следующий шаг