Функции потоков данных уровня "Премиум" (устаревшие версии)

Потоки данных поддерживаются для пользователей Power BI Pro, Premium Per User (PPU) и Power BI Premium. Некоторые функции доступны только с подпиской Power BI Premium (которая является лицензией уровня Premium или PPU). В этой статье описаны и детализированы функции PPU и только для подписчиков Premium и их использование.

Следующие функции доступны только в Power BI Premium (PPU или подписка на премиум-емкость):

Расширенный вычислительный модуль
DirectQuery
Вычисляемые сущности
Связанные сущности
Добавочное обновление

В следующих разделах подробно описаны все эти функции.

Внимание

Эта статья относится к первому поколению потоков данных (1-го поколения) и не применяется ко второму поколению потоков данных (2-го поколения), которые доступны в Microsoft Fabric. Дополнительные сведения см. в статье Об обновлении потока данных 1-го поколения до потока данных 2-го поколения.

Улучшенный вычислительный движок

Расширенный вычислительный механизм в Power BI позволяет подписчикам Power BI Premium использовать свою емкость для оптимизации использования потоков данных. Использование усиленного вычислительного двигателя обеспечивает следующие преимущества:

Значительно сокращает время обновления, необходимое для длительных операций ETL (извлечение, преобразование, загрузка) для вычисляемых сущностей, таких как выполнение соединений, отдельных, фильтров и группирования по.
Выполняет запросы DirectQuery по сущностям.

Примечание.

Процессы проверки и обновления информируют о потоках данных в схеме модели. Чтобы задать схему таблиц самостоятельно, используйте Редактор Power Query и задайте типы данных.
Эта функция доступна во всех кластерах Power BI, кроме WABI-INDIA-CENTRAL-A-PRIMARY

Включение расширенного вычислительного модуля

Внимание

Расширенный вычислительный модуль работает только для емкостей A3 или более крупных емкостей Power BI.

В Power BI Premium расширенный вычислительный модуль настраивается отдельно для каждого потока данных. Можно выбрать из трёх конфигураций.

Отключен
Оптимизировано (по умолчанию) — расширенная подсистема вычислений отключена. Он автоматически включается, когда таблица в потоке данных ссылается на другую таблицу или когда поток данных подключен к другому потоку данных в той же рабочей области.
Вкл.

Чтобы изменить параметр по умолчанию и включить расширенный вычислительный модуль, выполните следующие действия.

В рабочей области рядом с потоком данных, для которого нужно изменить параметры, выберите "Дополнительные параметры".
В меню Дополнительные параметры потока данных выберите Настройки.
Разверните настройки расширенного вычислительного движка.
В параметрах расширенного вычислительного ядра нажмите кнопку "Вкл." и нажмите кнопку "Применить".

Используйте расширенный вычислительный модуль

После активации расширенного вычислительного модуля вернитесь к потокам данных, и вы увидите улучшение производительности в любой вычисляемой таблице, которая выполняет сложные операции, такие как соединения или операции группировки по для потоков данных, созданных из существующих связанных сущностей в рамках той же производительности.

Чтобы лучше всего использовать подсистему вычислений, разделите этап ETL на два отдельных потока данных в одной рабочей области следующим образом:

Поток данных 1 . Этот поток данных должен принимать только все необходимые данные из источника данных.
Поток данных 2 - выполнить все операции ETL в этом втором потоке данных, но убедитесь, что вы ссылаетесь на поток данных 1, который должен находиться в одной емкости. Кроме того, убедитесь в том, что вы сначала выполняете операции, такие как фильтр, сгруппировать по, выделить уникальные элементы, объединить. И выполните эти операции перед любой другой операцией, чтобы убедиться, что подсистема вычислений используется.

Общие вопросы и ответы

Вопрос. Я включил расширенный вычислительный модуль, но мои обновления медленнее. Почему?

Ответ. Если включить расширенный вычислительный модуль, существует два возможных объяснения, которые могут привести к более медленному времени обновления:

Если расширенный вычислительный модуль включен, для правильной работы требуется некоторая память. Таким образом, объем памяти, доступный для выполнения обновления, уменьшается и, следовательно, увеличивает вероятность очередей обновлений. Это увеличение уменьшает количество потоков данных, которые могут одновременно обновляться. Чтобы устранить эту проблему, при включении расширенных вычислений распределяйте обновления потока данных во времени и оцените, достаточен ли размер емкости, чтобы обеспечить наличие памяти для одновременного выполнения обновлений потока данных.
Другая причина, по которой может наблюдаться более медленное обновление, заключается в том, что вычислительный движок работает только с существующими сущностями. Если поток данных ссылается на источник данных, который не является потоком данных, вы не увидите улучшения. В некоторых сценариях больших данных не будет увеличиваться производительность, так как начальное чтение из источника данных будет медленнее, так как данные необходимо передать в расширенный вычислительный механизм.

Вопрос. Я не вижу переключения расширенного вычислительного модуля. Почему?

Ответ. Расширенный вычислительный механизм выпускается на этапах для регионов по всему миру, но пока не доступен в каждом регионе.

Вопрос. Каковы поддерживаемые типы данных для подсистемы вычислений?

Ответ. Расширенный вычислительный модуль и потоки данных в настоящее время поддерживают следующие типы данных. Если поток данных не использует один из следующих типов данных, во время обновления возникает ошибка:

Дата/время
Десятичное число
Текст
Целое число
Дата/часовой пояс
Истина/ложь
Дата
Время

Использование DirectQuery с потоками данных в Power BI

Вы можете использовать DirectQuery для подключения непосредственно к потокам данных и таким образом подключаться непосредственно к потоку данных без необходимости импортировать свои данные.

Использование DirectQuery с потоками данных позволяет улучшить процессы Power BI и потоков данных:

Избегайте отдельных расписаний обновления. DirectQuery подключается непосредственно к потоку данных, удаляя необходимость создания импортированной семантической модели. Таким образом, использование DirectQuery с потоками данных означает, что вам больше не нужны отдельные расписания обновления для потока данных и семантической модели, чтобы убедиться, что данные синхронизированы.
Фильтрация данных — DirectQuery полезна для работы с отфильтрованным представлением данных внутри потока данных. DirectQuery можно использовать с подсистемой вычислений для фильтрации данных потока данных и работы с отфильтрованным подмножеством. Фильтрация данных позволяет работать с меньшим и более управляемым подмножеством данных в потоке данных.

Использование DirectQuery для потоков данных

Использование DirectQuery с потоками данных доступно в Power BI Desktop.

Существуют необходимые условия для использования DirectQuery с потоками данных:

Поток данных должен находиться в рабочей области с поддержкой Power BI Premium.
Подсистема вычислений должна быть включена.

Дополнительные сведения о DirectQuery с потоками данных см. в статье Использование DirectQuery с потоками данных.

Включение DirectQuery для потоков данных

Чтобы обеспечить доступность потока данных для доступа DirectQuery, расширенный вычислительный модуль должен находиться в оптимизированном состоянии. Чтобы включить DirectQuery для потоков данных, задайте для нового параметра расширенных параметров подсистемы вычислений значение "Вкл.".

Снимок экрана расширенных параметров вычислительного движка с выбранным параметром 'включено'.

После применения этого параметра обновите поток данных, чтобы оптимизация вступила в силу.

Вычисляемые сущности

При использовании потока данных с подпиской Power BI Premium можно выполнять вычисления в хранилище. Эта функция позволяет выполнять вычисления существующих потоков данных и возвращать результаты, позволяющие сосредоточиться на создании отчетов и аналитике.

Снимок экрана: Редактор Power Query с выделением таблицы, редактируемой.

Для выполнения вычислений в хранилище сначала необходимо создать поток данных и перенести данные в хранилище потоков данных Power BI. После создания потока данных, содержащего данные, можно создать вычисляемые сущности, которые являются сущностями, выполняющими вычисления в хранилище.

Соображения и ограничения вычислительных сущностей

При работе с потоками данных, созданными в учетной записи Azure Data Lake Storage 2-го поколения организации, связанные сущности и вычислительные сущности работают правильно, если сущности находятся в той же учетной записи хранения.
Вычисляемые сущности поддерживаются только в одной рабочей области.

В качестве рекомендации при вычислении данных, присоединенных к локальным и облачным данным, создайте новый поток данных для каждого источника (один для локальной среды и один для облака), а затем создайте третий поток данных для слияния или вычисления по этим двум источникам данных.

Связанные сущности

Вы можете ссылаться на существующие потоки данных в одной рабочей области с помощью связанных сущностей с подпиской Power BI Premium, что позволяет выполнять вычисления для этих сущностей с помощью вычисляемых сущностей или создавать таблицу "один источник истины", которую можно повторно использовать в нескольких потоках данных.

Добавочное обновление

Потоки данных можно задать для обновления постепенно, чтобы избежать необходимости извлекать все данные при каждом обновлении. Для этого выберите поток данных, а затем щелкните значок добавочного обновления.

Снимок экрана: таблица в потоке данных Power BI с выделенным значком добавочного обновления.

Настройка добавочного обновления добавляет параметры в поток данных так, чтобы указать диапазон дат. Подробные сведения о настройке добавочного обновления см. в разделе"Использование добавочного обновления с потоками данных".

Соображения о том, когда не следует настраивать добавочное обновление

Не устанавливайте поток данных для добавочного обновления в следующих ситуациях:

Связанные сущности не должны использовать добавочное обновление, если они ссылаются на поток данных.

Дополнительные сведения о потоках данных и Power BI см. в следующих статьях.

Рекомендации по потокам данных

Настройка рабочих нагрузок потока данных Power BI Premium

Введение в потоки данных и самостоятельную подготовку данных

Создание потока данных

Настройка и использование потока данных

Настройка хранилища потока данных для использования Azure Data Lake 2-го поколения

Планирование реализации Power BI — интеграция с другими службами

Сценарии использования Power BI: самостоятельная подготовка данных

Сценарии использования Power BI: расширенная подготовка данных

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2026-04-28