События
Чемпионат мира Power BI DataViz
14 февр., 16 - 31 мар., 16
С 4 шансами войти, вы можете выиграть пакет конференции и сделать его в LIVE Grand Finale в Лас-Вегасе
ПодробнееЭтот браузер больше не поддерживается.
Выполните обновление до Microsoft Edge, чтобы воспользоваться новейшими функциями, обновлениями для системы безопасности и технической поддержкой.
Потоки данных поддерживаются для пользователей Power BI Pro, Premium на пользователя (PPU) и Power BI Premium. Некоторые функции доступны только с подпиской Power BI Premium (которая является лицензией уровня Premium или PPU). В этой статье описаны и подробно описаны функции PPU и premium и их использование.
Следующие функции доступны только в подписке на емкость Power BI Premium (PPU или premium):
В следующих разделах подробно описаны все эти функции.
Важно!
Эта статья относится к первому поколению потоков данных (1-го поколения) и не применяется ко второму поколению потоков данных (2-го поколения), которые доступны в Microsoft Fabric (предварительная версия). Дополнительные сведения см. в статье "Получение из потоков данных поколения 1 в потоки данных 2-го поколения".
Расширенный вычислительный механизм в Power BI позволяет подписчикам Power BI Premium использовать свою емкость для оптимизации использования потоков данных. Использование расширенного подсистемы вычислений обеспечивает следующие преимущества:
Примечание
Важно!
Расширенный вычислительный модуль работает только для емкостей A3 или более крупных емкостей Power BI.
В Power BI Premium расширенный вычислительный модуль настраивается отдельно для каждого потока данных. Выбрать один из трех конфигураций:
Отключен
Оптимизировано (по умолчанию) — расширенная подсистема вычислений отключена. Он автоматически включается, когда таблица в потоке данных ссылается на другую таблицу или когда поток данных подключен к другому потоку данных в той же рабочей области.
Вкл.
Чтобы изменить параметр по умолчанию и включить расширенный вычислительный модуль, выполните следующие действия.
В рабочей области рядом с потоком данных, для которого нужно изменить параметры, выберите "Дополнительные параметры".
В меню "Дополнительные параметры" потока данных выберите "Параметры".
Разверните параметры расширенного вычислительного ядра.
В параметрах расширенного вычислительного ядра нажмите кнопку "Вкл." и нажмите кнопку "Применить".
После включения расширенного вычислительного модуля вернитесь к потокам данных и вы увидите улучшение производительности в любой вычисляемой таблице, которая выполняет сложные операции, такие как соединения или группы по операциям для потоков данных, созданных из существующих связанных сущностей в той же емкости.
Чтобы лучше всего использовать подсистему вычислений, разделите этап ETL на два отдельных потока данных в одной рабочей области следующим образом:
Вопрос. Я включил расширенный вычислительный модуль, но мои обновления медленнее. Почему?
Ответ. Если включить расширенный вычислительный модуль, существует два возможных объяснения, которые могут привести к более медленному времени обновления:
Если расширенный вычислительный модуль включен, для правильной работы требуется некоторая память. Таким образом, объем памяти, доступный для выполнения обновления, уменьшается и, следовательно, увеличивает вероятность очередей обновлений. Это увеличение уменьшает количество потоков данных, которые могут одновременно обновляться. Чтобы устранить эту проблему, при включении расширенных вычислений распространение обновлений потока данных с течением времени и оценить, подходит ли размер емкости, чтобы обеспечить доступность памяти для одновременных обновлений потока данных.
Другая причина, по которой может возникнуть более медленное обновление, заключается в том, что подсистема вычислений работает только над существующими сущностями. Если поток данных ссылается на источник данных, который не является потоком данных, вы не увидите улучшения. В некоторых сценариях больших данных не будет увеличиваться производительность, так как начальное чтение из источника данных будет медленнее, так как данные необходимо передать в расширенный вычислительный механизм.
Вопрос. Я не вижу переключения расширенного вычислительного модуля. Почему?
Ответ. Расширенный вычислительный механизм выпускается на этапах для регионов по всему миру, но пока не доступен в каждом регионе.
Вопрос. Каковы поддерживаемые типы данных для подсистемы вычислений?
Ответ. Расширенный вычислительный модуль и потоки данных в настоящее время поддерживают следующие типы данных. Если поток данных не использует один из следующих типов данных, во время обновления возникает ошибка:
Вы можете использовать DirectQuery для подключения непосредственно к потокам данных и таким образом подключаться непосредственно к потоку данных без необходимости импортировать свои данные.
Использование DirectQuery с потоками данных позволяет улучшить процессы Power BI и потоков данных:
Избегайте отдельных расписаний обновления. DirectQuery подключается непосредственно к потоку данных, удаляя необходимость создания импортированной семантической модели. Таким образом, использование DirectQuery с потоками данных означает, что вам больше не нужны отдельные расписания обновления для потока данных и семантической модели, чтобы убедиться, что данные синхронизированы.
Фильтрация данных — DirectQuery полезна для работы с отфильтрованным представлением данных внутри потока данных. DirectQuery можно использовать с подсистемой вычислений для фильтрации данных потока данных и работы с отфильтрованным подмножеством. Фильтрация данных позволяет работать с меньшим и более управляемым подмножеством данных в потоке данных.
Использование DirectQuery с потоками данных доступно в Power BI Desktop.
Существуют необходимые условия для использования DirectQuery с потоками данных:
Дополнительные сведения о DirectQuery с потоками данных см. в статье Использование DirectQuery с потоками данных.
Чтобы обеспечить доступность потока данных для доступа DirectQuery, расширенный вычислительный модуль должен находиться в оптимизированном состоянии. Чтобы включить DirectQuery для потоков данных, задайте для нового параметра расширенных параметров подсистемы вычислений значение "Вкл.".
После применения этого параметра обновите поток данных, чтобы оптимизация вступила в силу.
Существует несколько известных ограничений с DirectQuery и потоками данных:
Составные и смешанные модели с источниками данных DirectQuery в настоящее время не поддерживаются.
Большие потоки данных могут столкнуться с проблемами времени ожидания при просмотре визуализаций. Большие потоки данных, которые возникают с проблемами времени ожидания, должны использовать режим импорта.
В параметрах источника данных соединитель потока данных будет отображать недопустимые учетные данные, если вы используете DirectQuery. Это предупреждение не влияет на поведение, и семантическая модель будет работать правильно.
Если поток данных содержит 340 столбцов или более, использование соединителя потока данных в Power BI Desktop с включенным параметром расширенного вычислительного модуля приводит к отключению параметра DirectQuery для потока данных. Чтобы использовать DirectQuery в таких конфигурациях, используйте менее 340 столбцов.
При использовании потоков данных с подпиской Power BI Premium можно выполнять вычисления в хранилище. Эта функция позволяет выполнять вычисления существующих потоков данных и возвращать результаты, позволяющие сосредоточиться на создании отчетов и аналитике.
Для выполнения вычислений в хранилище сначала необходимо создать поток данных и перенести данные в хранилище потоков данных Power BI. После создания потока данных, содержащего данные, можно создать вычисляемые сущности, которые являются сущностями, выполняющими вычисления в хранилище.
При работе с потоками данных, созданными в учетной записи Azure Data Lake Storage 2-го поколения организации, связанные сущности и вычислительные сущности работают правильно, если сущности находятся в той же учетной записи хранения.
Вычисляемые сущности поддерживаются только в одной рабочей области.
В качестве рекомендации при вычислении данных, присоединенных к локальным и облачным данным, создайте новый поток данных для каждого источника (один для локальной среды и один для облака), а затем создайте третий поток данных для слияния или вычисления по этим двум источникам данных.
Вы можете ссылаться на существующие потоки данных в одной рабочей области с помощью связанных сущностей с подпиской Power BI Premium, что позволяет выполнять вычисления для этих сущностей с помощью вычисляемых сущностей или создавать таблицу "один источник истины", которую можно повторно использовать в нескольких потоках данных.
Потоки данных можно задать для обновления постепенно, чтобы избежать необходимости извлекать все данные при каждом обновлении. Для этого выберите поток данных, а затем щелкните значок добавочного обновления.
Параметр добавочного обновления добавляет параметры в поток данных, чтобы указать диапазон дат. Подробные сведения о настройке добавочного обновления см. в разделе"Использование добавочного обновления с потоками данных".
Не устанавливайте поток данных для добавочного обновления в следующих ситуациях:
Дополнительные сведения о потоках данных и Power BI см. в следующих статьях.
События
Чемпионат мира Power BI DataViz
14 февр., 16 - 31 мар., 16
С 4 шансами войти, вы можете выиграть пакет конференции и сделать его в LIVE Grand Finale в Лас-Вегасе
ПодробнееОбучение
Модуль
Создание масштабируемых потоков данных Power BI и управление ими - Training
Создайте логику преобразования Power BI для многократного использования в организации с потоками данных Power BI. Узнайте, как объединить потоки данных Power BI с Power BI Premium для масштабируемых операций извлечения, преобразования и загрузки, а также попрактикуйтесь в создании и использовании потоков данных.
Сертификация
Демонстрация методов и рекомендаций, которые соответствуют бизнес-и техническим требованиям для моделирования, визуализации и анализа данных с помощью Microsoft Power BI.
Документация
Общие сведения об обновлении потоков данных и оптимизация - Power BI
Узнайте, как использовать и оптимизировать обновления потока данных, чтобы повысить производительность при работе с данными в Power BI.
Использование DirectQuery с потоками данных - Power BI
Узнайте, как подключить Power BI Desktop к семантическим моделям в потоках данных Power BI с помощью DirectQuery.
Настройка и использование потока данных - Power BI
Узнайте, как настроить поток данных в служба Power BI и использовать этот поток данных в Power BI Desktop.