Поделиться через


Настройка и использование потока данных

С помощью потоков данных можно объединить данные из нескольких источников и подготовить эти унифицированные данные для моделирования. При создании потока данных вам, возможно, будет предложено обновить данные для него. Обновление потока данных необходимо, прежде чем его можно будет использовать в семантической модели в Power BI Desktop, или ссылаться на нее как связанную или вычисляемую таблицу.

Замечание

Потоки данных могут быть недоступны в службе Power BI для всех клиентов Министерства обороны США. Дополнительные сведения о доступных функциях и которые не доступны, см. в статье о доступности функций Power BI для клиентов государственных организаций США.

Настройка потока данных

Чтобы настроить обновление потока данных, выберите "Дополнительные параметры " (многоточие) и выберите "Параметры".

Снимок экрана: раскрывающийся список параметров потока данных Power BI.

Настройки предоставляют множество параметров для потока данных, как описывается в следующих разделах.

Снимок экрана: страница

  • Взять на себя ответственность: Если вы не являетесь владельцем потока данных, многие из этих параметров отключены. Чтобы взять на себя управление потоком данных, выберите Взять на себя, чтобы получить контроль. Вам будет предложено предоставить учетные данные, чтобы обеспечить необходимый уровень доступа.

  • Подключение шлюза: В этом разделе можно выбрать, использует ли поток данных шлюз и выбрать используемый шлюз. Если вы указали шлюз в процессе редактирования потока данных, после принятия прав владения может потребоваться обновить учетные данные, используя параметр редактирования потока данных.

  • Учетные данные источника данных: В этом разделе описано, какие учетные данные используются, и вы можете изменить способ проверки подлинности в источнике данных.

  • Метка конфиденциальности: Здесь можно определить конфиденциальность данных в потоке данных. Дополнительные сведения о метках конфиденциальности см. в статье "Применение меток конфиденциальности" в Power BI.

  • Запланированное обновление: Здесь можно определить время обновления выбранного потока данных. Поток данных можно обновить с той же частотой, что и семантическая модель.

  • Расширенные параметры подсистемы вычислений: Здесь можно определить, хранится ли поток данных в подсистеме вычислений. Подсистема вычислений позволяет последующим потокам данных, ссылающихся на этот поток данных, выполнять слияния и соединения и другие преобразования быстрее, чем в противном случае. Он также позволяет выполнять DirectQuery по потоку данных. При выборе "Вкл." поток данных всегда поддерживается в режиме DirectQuery, а все ссылки получают преимущества от движка. Выбор оптимизированного означает, что обработчик используется только в том случае, если есть ссылка на этот поток данных. При нажатии кнопки "Отключить" подсистема вычислений и возможность DirectQuery для этого потока данных отключены.

  • Одобрение: Вы можете определить, сертифицирован ли поток данных или переведен в статус продвинутого.

Замечание

Пользователи с лицензией Pro или Premium Per User (PPU) могут создавать поток данных в рабочей области с премиум-доступом.

Caution

Если рабочая область удаляется, содержащая потоки данных, все потоки данных в этой рабочей области также удаляются. Даже если восстановление рабочей области возможно, вы не можете восстановить удаленные потоки данных напрямую или через поддержку корпорации Майкрософт.

Обновление потока данных

Потоки данных действуют как строительные блоки поверх друг друга. Предположим, что у вас есть поток данных с именем "Необработанные данные " и связанная таблица с именем "Преобразованные данные", которая содержит связанную таблицу с потоком необработанных данных . При обновлении расписания для потока данных Необработанные данные триггеры потоков данных будут активировать любой поток данных, который ссылается на него после завершения. Эта функция создает эффект цепочки обновлений, что позволяет избежать необходимости планировать потоки данных вручную. При работе с обновлением связанных таблиц следует учитывать несколько нюансов:

  • Связанная таблица будет активирована обновлением только в том случае, если она существует в той же рабочей области.

  • Связанная таблица будет заблокирована для редактирования при обновлении исходной таблицы или отмене обновления исходной таблицы. Если какой-либо из потоков данных в эталонной цепочке не удалось обновить, все потоки данных откатятся к старым данным (обновления потока данных являются транзакциями в рабочей области).

  • При завершении обновления источника обновляются только таблицы, на которые есть ссылки. Чтобы запланировать все таблицы, необходимо также задать расписание обновления связанной таблицы. Избегайте настройки расписания обновления для связанных потоков данных, чтобы избежать двойного обновления.

Отмена обновления Потоки данных поддерживают возможность отмены обновления, в отличие от семантических моделей. Если обновление выполняется в течение длительного времени, можно выбрать дополнительные параметры (многоточие рядом с потоком данных), а затем нажмите кнопку "Отмена обновления".

Добавочное обновление (только премиум) Потоки данных также можно задать для обновления постепенно. Для этого выберите поток данных, который вы хотите настроить для добавочного обновления, а затем щелкните значок добавочного обновления .

Снимок экрана, показывающий действие инкрементального обновления для таблицы.

Настройка инкрементного обновления добавляет параметры в поток данных для указания диапазона дат. Подробные сведения о настройке добавочного обновления см. в разделе "Использование добавочного обновления с потоками данных".

Существуют некоторые обстоятельства, при которых не следует устанавливать инкрементальное обновление:

  • Связанные таблицы не должны использовать добавочное обновление, если они ссылаются на поток данных. Потоки данных не поддерживают свертку запросов (даже если таблица включена DirectQuery).

  • Семантические модели, ссылающиеся на потоки данных, не должны использовать добавочное обновление. Обновления потоков данных обычно эффективны, следовательно, инкрементные обновления не должны быть обязательными. Если обновление занимает слишком много времени, рассмотрите возможность использования подсистемы вычислений или режима DirectQuery.

Использование потока данных

Поток данных можно использовать следующими способами:

  • Создайте связанную таблицу из потока данных, чтобы разрешить другому автору потока данных использовать данные.

  • Создайте семантическую модель из потока данных, чтобы пользователь мог использовать данные для создания отчетов.

  • Создайте подключение из внешних средств, которые могут считываться из формата CDM (Common Data Model).

Использование из Power BI Desktop Чтобы использовать поток данных, откройте Power BI Desktop и выберите потоки данных в раскрывающемся списке "Получить данные ".

Замечание

Соединитель потоков данных использует другой набор учетных данных, отличный от текущего пользователя, вошедшего в систему. Это сделано специально для поддержки многопользовательских арендаторов.

Снимок экрана Power BI Desktop, показывающий опцию потоков данных в раскрывающемся списке

Выберите поток данных и таблицы, к которым требуется подключиться.

Замечание

Вы можете подключиться к любому потоку данных или таблице, независимо от того, в какой рабочей области она находится, и была ли она определена в рабочей области "Премиум" или "не Премиум".

Снимок экрана Навигатора в Power BI Desktop, в котором выбираются потоки данных для подключения.

Если directQuery доступен, вам будет предложено выбрать, нужно ли подключаться к таблицам с помощью DirectQuery или Import.

В режиме DirectQuery можно быстро запрашивать большие семантические модели на локальной машине. Однако больше не удается выполнить преобразования.

Использование импорта приводит данные в Power BI и требует обновления семантической модели независимо от потока данных.

Дополнительные сведения о потоках данных и Power BI см. в следующих статьях.