События
Чемпионат мира Power BI DataViz
14 февр., 16 - 31 мар., 16
С 4 шансами войти, вы можете выиграть пакет конференции и сделать его в LIVE Grand Finale в Лас-Вегасе
ПодробнееЭтот браузер больше не поддерживается.
Выполните обновление до Microsoft Edge, чтобы воспользоваться новейшими функциями, обновлениями для системы безопасности и технической поддержкой.
Примечание
Эта статья входит в серию статей по планированию реализации Power BI. В этой серии основное внимание уделяется интерфейсу Power BI в Microsoft Fabric. Общие сведения о серии см. в статье о планировании реализации Power BI.
Подготовка данных (иногда называется ETL, которая является акронимом для извлечения, преобразования и загрузки) часто включает значительное количество работ в зависимости от качества и структуры исходных данных. Сценарий самостоятельной подготовки данных фокусируется на повторном использовании действий по подготовке данных бизнес-аналитиками. Она достигает этой цели повторного использования путем перемещения работы по подготовке данных из Power Query (в отдельных файлах Power BI Desktop) в Power Query Online (с помощью потока данных Power BI). Централизация логики помогает достичь одного источника истины и снижает уровень усилий, необходимых другим создателям контента.
Потоки данных создаются с помощью Power Query Online в одном из нескольких средств: служба Power BI, Power Apps или Dynamics 365 Customer Insights. Поток данных, созданный в Power BI, называется аналитическим потоком данных. Потоки данных, созданные в Power Apps, могут быть одним из двух типов: стандартными или аналитическими. Этот сценарий охватывает только поток данных Power BI, созданный и управляемый в служба Power BI.
Примечание
Сценарий самостоятельной подготовки данных является одним из сценариев самостоятельной бизнес-аналитики. Полный список сценариев самообслуживания см. в статье о сценариях использования Power BI.
Для краткости некоторые аспекты, описанные в сценариях совместной работы и доставки содержимого, не рассматриваются в этой статье. Для полного охвата сначала ознакомьтесь с этими статьями.
На следующей схеме представлен общий обзор наиболее распространенных действий пользователей и компонентов Power BI, поддерживающих самостоятельную подготовку данных. Основное внимание уделяется созданию потока данных в Power Query Online, который становится источником данных для нескольких семантических моделей. Цель состоит в том, чтобы многие семантические модели использовали подготовку данных, которая выполняется один раз потоком данных.
Совет
Мы рекомендуем скачать схему сценария, если вы хотите внедрить ее в презентацию, документацию или запись блога, или распечатать ее в виде стенного плаката. Так как это масштабируемое изображение векторной графики (SVG), его можно масштабировать вверх или вниз без потери качества.
На схеме сценария показаны следующие действия пользователя, инструменты и функции:
Пункт | Описание |
---|---|
|
Создатель потока данных разрабатывает коллекцию таблиц в потоке данных Power BI. Для потока данных, предназначенного для повторного использования, обычно (но не требуется) создателю принадлежат централизованной команде, которая поддерживает пользователей через границы организации (например, ИТ, корпоративная бизнес-аналитика или Центр превосходства). |
|
Поток данных подключается к данным из одного или нескольких источников данных. |
|
Некоторым источникам данных может потребоваться локальный шлюз данных или шлюз виртуальной сети для обновления данных, например те, которые находятся в частной сети организации. Эти шлюзы используются как для разработки потока данных в Power Query Online, которая является веб-версией Power Query, так и для обновления потока данных. |
|
Потоки данных разрабатываются с помощью Power Query Online. Знакомый интерфейс Power Query в Power Query Online упрощает переход с Power BI Desktop. |
|
Поток данных сохраняется в виде элемента в рабочей области, выделенной для хранения и защиты потоков данных. Расписание обновления потока данных требуется для поддержания текущего значения данных (не показанного на схеме сценария). |
|
Поток данных можно повторно использовать в качестве источника данных создателями контента, а также другими семантические модели, которые могут находиться в разных рабочих областях. |
|
Создатель семантической модели разрабатывает новую модель данных с помощью Power BI Desktop. Создатель семантической модели может использовать все возможности Power Query в Power BI Desktop. При необходимости можно применить другие шаги запроса для дальнейшего преобразования данных потока данных или объединения выходных данных потока данных. |
|
После готовности создатель семантической модели публикует файл Power BI Desktop (PBIX), содержащий модель данных в служба Power BI. Обновление для семантической модели управляется отдельно от потока данных (не показанного на схеме сценария). |
|
Другие создатели семантической модели самообслуживания могут создавать новые модели данных в Power BI Desktop с помощью потока данных в качестве источника данных. |
|
На портале администрирования администраторы Power BI могут настроить подключения Azure для хранения данных потока данных в учетной записи Azure Data Lake Storage 2-го поколения (ADLS 2-го поколения). К параметрам относятся назначение учетной записи хранения на уровне клиента и включение разрешений хранилища на уровне рабочей области. |
|
Администраторы Power BI управляют параметрами на портале администрирования. |
|
По умолчанию потоки данных хранят данные с помощью внутреннего хранилища, управляемого служба Power BI. При необходимости выходные данные потока данных можно хранить в учетной записи ADLS 2-го поколения организации. Этот тип хранилища иногда называется собственным озером данных. Преимущество хранения данных потока данных в озере данных заключается в том, что к нему можно получить доступ и использовать другие средства бизнес-аналитики. |
|
Данные потока данных в ADLS 2-го поколения хранятся в контейнере power BI, известном как файловая система. В этом контейнере папка существует для каждой рабочей области. Вложенная папка создается для каждого потока данных, а также для каждой таблицы. Power BI создает моментальный снимок при каждом обновлении данных потока данных. Моментальные снимки являются самоописыванием, включая метаданные и файлы данных. |
|
Администраторы Azure управляют разрешениями для учетной записи ADLS 2-го поколения организации. |
|
Администраторы Power BI контролируют и отслеживают действия в служба Power BI. |
Совет
Мы рекомендуем также ознакомиться с расширенным сценарием подготовки данных. Он основывается на концепциях, представленных в этом сценарии.
Ниже приведены некоторые ключевые моменты, которые необходимо подчеркнуть в сценарии самостоятельной подготовки данных.
Поток данных состоит из коллекции таблиц (также известных как сущности). Все работы по созданию потока данных выполняются в Power Query Online. Потоки данных можно создавать в нескольких продуктах, включая Power Apps, Dynamics 365 Customer Insights и Power BI.
Примечание
Потоки данных нельзя создавать в личной рабочей области в служба Power BI.
Схема сценария описывает использование потока данных Power BI для предоставления подготовленных данных другим создателям семантической модели самообслуживания.
Примечание
Семантическая модель использует поток данных в качестве источника данных. Отчет не может подключаться непосредственно к потоку данных.
Ниже приведены некоторые преимущества использования потоков данных Power BI.
Совет
Создайте таблицы потоков данных, применяя принципы проектирования схемы звезды. Схема звезды хорошо подходит для создания семантических моделей Power BI. Кроме того, уточняйте выходные данные потока данных, чтобы применить понятные имена и использовать определенные типы данных. Эти методы способствуют согласованности в зависимых семантических моделях и помогают сократить объем работы, которую необходимо выполнить создателям семантической модели.
Когда создатель семантической модели подключается к потоку данных в Power BI Desktop, создатель не ограничивается использованием точных выходных данных потока данных. Они по-прежнему имеют полную функциональность Power Query, доступную для них. Эта функция полезна, если требуется дополнительная работа по подготовке данных, или данные требуют дальнейшего преобразования.
Существует множество методов проектирования, шаблонов и рекомендаций для потоков данных, которые могут принимать их от самообслуживания до подготовки предприятия. Потоки данных в рабочей области с заданным режимом лицензии Premium на пользователя, емкостью Premium или емкостью Fabric могут воспользоваться расширенными функциями.
Важно!
Иногда эта статья относится к Power BI Premium или ее подпискам на емкость (SKU). Обратите внимание, что корпорация Майкрософт в настоящее время объединяет варианты покупки и отставает от номера SKU емкости Power BI Premium. Новые и существующие клиенты должны рассмотреть возможность приобретения подписок на емкость Fabric (SKU) вместо этого.
Дополнительные сведения см. в разделе "Важные обновления", поступающие в лицензирование Power BI Premium и вопросы и ответы по Power BI Premium.
Примечание
Одним из дополнительных функций является добавочное обновление потоков данных. Хотя добавочное обновление для семантических моделей является функцией Power BI Pro, добавочное обновление для потоков данных является функцией Premium.
Дополнительные сведения о расширенных функциях потока данных см. в сценарии расширенной подготовки данных.
Как упоминалось ранее, поток данных является источником данных для семантических моделей. В большинстве случаев используются несколько расписаний обновления данных: один для потока данных и один для каждой семантической модели. Кроме того, можно использовать DirectQuery из семантической модели к потоку данных, которая является функцией Premium (не показана на схеме сценария).
В Microsoft Azure учетная запись ADLS 2-го поколения — это конкретный тип учетной записи служба хранилища Azure с включенным иерархическим пространством имен. ADLS 2-го поколения имеет преимущества производительности, управления и безопасности для операционных аналитических рабочих нагрузок. По умолчанию потоки данных Power BI используют внутреннее хранилище, которое является встроенной учетной записью озера данных, управляемой служба Power BI. При необходимости организации могут принести собственное озеро данных, подключився к учетной записи ADLS 2-го поколения своей организации.
Ниже приведены некоторые преимущества использования учетной записи озера данных организации:
Раздел подключений Azure на портале администрирования содержит параметр для настройки подключения к учетной записи ADLS 2-го поколения. Настройка этого параметра позволяет использовать собственное озеро данных. После настройки можно настроить рабочие области для использования этой учетной записи озера данных.
Важно!
Установка подключений Azure не означает, что все потоки данных в клиенте Power BI хранятся в этой учетной записи по умолчанию. Чтобы использовать явную учетную запись хранения (вместо внутреннего хранилища), каждая рабочая область должна быть специально подключена.
Перед созданием потоков данных в рабочей области важно задать подключения к рабочей области Azure. Та же учетная запись хранения Azure используется для резервных копий семантической модели Power BI.
Администратор Power BI может настроить параметр для разрешения разрешений хранилища на уровне рабочей области (в разделе подключений Azure на портале администрирования). Если этот параметр включен, этот параметр позволяет администраторам рабочей области использовать другую учетную запись хранения, отличную от учетной записи хранения, определенной на уровне клиента. Включение этого параметра особенно полезно для децентрализованных бизнес-подразделений, которые управляют собственным озером данных в Azure.
Примечание
Разрешение на хранение на уровне рабочей области на портале администрирования применяется ко всем рабочим областям в клиенте Power BI.
Данные в учетной записи ADLS 2-го поколения хранятся в структуре Common Data Model (CDM). Структура CDM — это формат метаданных, который определяет способ хранения самоописающей схемы, а также данных. Структура CDM обеспечивает семантику согласованности в формате, стандартизованном для совместного использования данных в различных приложениях (не показанном на схеме сценария).
Существует несколько преимуществ публикации потока данных в рабочей области , отдельной от места хранения зависимых семантических моделей. Одним из преимуществ является ясность того, кто отвечает за управление типами контента (если у вас разные люди, обрабатывающие различные обязанности). Другим преимуществом является то, что для каждого типа контента можно назначать определенные разрешения рабочей области.
Примечание
Потоки данных нельзя создавать в личной рабочей области в служба Power BI.
В сценарии расширенной подготовки данных описывается настройка нескольких рабочих областей для повышения гибкости при поддержке создателей самообслуживания корпоративного уровня.
Как правило, локальный шлюз данных требуется для подключения к источникам данных, которые находятся в частной корпоративной сети или виртуальной сети.
Шлюз данных требуется, если:
Совет
Потоки данных требуют централизованного шлюза данных в стандартном режиме. Шлюз в личном режиме не поддерживается при работе с потоками данных.
Журнал действий записывает действия пользователя, происходящие в служба Power BI. Администраторы Power BI могут использовать данные журнала действий, собранные для аудита, чтобы помочь им понять шаблоны использования и внедрение. Журнал действий также ценен для поддержки усилий по управлению, аудита безопасности и требований соответствия требованиям. В сценарии самостоятельной подготовки данных особенно полезно отслеживать использование потоков данных.
В следующей статье серии вы узнаете о сценарии использования расширенной подготовки данных.
События
Чемпионат мира Power BI DataViz
14 февр., 16 - 31 мар., 16
С 4 шансами войти, вы можете выиграть пакет конференции и сделать его в LIVE Grand Finale в Лас-Вегасе
ПодробнееОбучение
Схема обучения
Use advance techniques in canvas apps to perform custom updates and optimization - Training
Use advance techniques in canvas apps to perform custom updates and optimization
Сертификация
Демонстрация методов и рекомендаций, которые соответствуют бизнес-и техническим требованиям для моделирования, визуализации и анализа данных с помощью Microsoft Power BI.
Документация
Сценарии использования Power BI: управляемая самостоятельная бизнес-аналитика - Power BI
Сведения о повторном использовании централизованных общих семантических моделей другими создателями отчетов Power BI.
Узнайте, как настраиваемая локальная бизнес-аналитика Power BI позволяет создавать специализированные семантические модели путем расширения и персонализации существующих семантических моделей.
Сценарии использования Power BI: самостоятельная публикация содержимого - Power BI
Узнайте, как самостоятельное публикация содержимого Power BI заключается в публикации содержимого для разработки, тестирования и рабочей среды с конвейерами развертывания.