Поделиться через


Рекомендации и ограничения, касающиеся потоков данных

Существует несколько ограничений потока данных для разработки, обновления и управления емкостью, которые следует учитывать пользователям, как описано в следующих разделах.

Общие ограничения

  • Потоки данных могут быть недоступны для всех клиентов Министерства обороны из правительства США. Четность функций в средах государственных организаций можно найти в статье о доступности функций Power BI для государственных организаций.
  • Удаленные источники данных не исчезают со страницы источников данных потока, что является нормальным поведением и не влияет на обновление или редактирование потоков данных. В Lineage View удаленные источники данных отображаются как линия данных для потока данных.
  • Удаленные источники данных все еще отображаются на странице "Настройка" в выпадающем списке шлюза.
  • Глубина соответствует потокам данных, связанным с другими потоками данных. Текущая максимальная глубина составляет 32.
  • Ширина соответствует сущностям в потоке данных.
    • Однако в общем потоке данных нет никаких рекомендаций или ограничений для оптимального количества сущностей, однако общие потоки данных имеют ограничение на обновление в два часа на сущность и три для каждого потока данных. Таким образом, если у вас есть две сущности, и каждый из них занимает два часа, их не следует помещать в один поток данных.
    • Для Power BI Premium рекомендации и ограничения основаны на отдельных вариантах использования, а не на конкретных требованиях. Единственным ограничением для Power BI Premium является 24-часовое обновление для каждого потока данных.
  • Для обновления более 10 потоков данных между рабочими областями требуется подписка Power BI Premium.
  • Ограничения PowerQuery приведены в статье об ограничениях Power Query Online .
  • Потоки данных Power BI не поддерживают использование глобальных переменных в аргументе URL-адреса.
  • В настоящее время Multi-Geo не поддерживается, если только не настраивается хранилище для использования вашей собственной учетной записи хранения Azure Data Lake 2-го поколения.
  • Поддержка виртуальной сети достигается с помощью шлюза.
  • При использовании вычисляемых сущностей с источниками данных шлюза прием данных должен выполняться в разных источниках данных, отличных от вычислений. Вычисляемые сущности должны создаваться на основе сущностей, которые используются только для приема, и не переработки данных в рамках собственных комбинированных шагов.
  • В потоках данных Power BI можно использовать параметры, но их нельзя изменить, если только вы не измените весь поток данных. В этом отношении параметры в потоках данных ведут себя аналогично объявленным константам.
  • Некоторые соединители, найденные в сценариях устранения неполадок обновления, не поддерживаются для пото́ков данных и хранилищ данных в рабочих областях Premium.
  • При использовании DirectQuery с потоком данных поиск с помощью визуального элемента среза учитывает регистр.
  • Следующие символы не допускаются в сущностях потока данных: \/

Создание потока данных

При создании потоков данных учитывайте следующие аспекты:

  • Разработка в потоках данных выполняется в среде Power Query Online (PQO); см. ограничения, описанные в ограничениях Power Query. Так как создание потоков данных выполняется с помощью Power Query Online (PQO), обновления, выполняемые в конфигурациях рабочих нагрузок потоков данных, влияют только на обновление данных и не влияют на процесс разработки.

  • Потоки данных могут изменяться только их владельцами.

  • Потоки данных недоступны в моей рабочей области.

  • Потоки данных, использующие источники данных шлюза, не поддерживают несколько учетных данных для одного источника данных.

  • Для использования соединителя Web.Page требуется шлюз.

  • В опыт редактирования потоков данных первого поколения пользователи могут быть не в состоянии удалить локальное подключение шлюза данных из потока данных с помощью Параметры > Проект > Загрузка данных > выбрать (нет) в раскрывающемся списке Шлюз данных. Следующие действия могут устранить проблему:

    1. Начните редактирование потока данных, в котором требуется удалить подключение к локальному шлюзу данных.
    2. Выберите "Параметры>Загрузку данных проекта>шлюз данных, выберите Нет и затем ОК.
    3. Если появится желтое предупреждение с кнопкой "Настройка подключения", выберите " Настроить подключение", выберите облачное подключение в раскрывающемся списке и вставьте учетные данные при необходимости для облачного подключения.
    4. Выберите "Управление подключениями> " и нажмите кнопку отмены связи подключения шлюза.
    5. Закройте диалоговое окно "Управление подключениями ", если требуется снова настроить подключение. Нажмите кнопку "Сохранить и закрыть" и дождитесь завершения операции сохранения.
    6. Если предупреждение "Настройка подключения" не отображается после применения предыдущих шагов, примените предыдущие шаги, сохраните и закройте поток данных, а затем измените его еще раз и убедитесь, что появится предупреждение "Настройка подключения" для принятия действий.

    Если подключение к шлюзу всё ещё остаётся в потоке данных, может потребоваться воссоздать новый поток данных с теми же запросами, не связанный с шлюзом.

Рекомендации по API

Дополнительную информацию о поддерживаемых REST API потоков данных можно найти в справочнике по REST API. Ниже приведены некоторые рекомендации, которые следует учитывать.

  • Экспорт и импорт потока данных присваивает ему новый идентификатор.
  • Импорт потоков данных, содержащих связанные таблицы, не обновляет существующие ссылки в потоке данных (эти запросы следует обновлять вручную перед импортом потока данных).
  • При развертывании потока данных можно использовать параметры обработчиков конфликтов GenerateUniqueName и Abort, чтобы прервать операцию, если она уже существует, или указать API автоматически создать уникальное имя. Потоки данных можно перезаписать с помощью параметра CreateOrOverwrite , если они изначально созданы с помощью API импорта.

Потоки данных в общих мощностях

Существуют ограничения для потоков данных в общих емкостях (не премиум):

  • При обновлении потока данных время ожидания в общей емкости составляет 2 часа на таблицу и 3 часа на поток данных.
  • Связанные таблицы нельзя создавать в общих потоках данных, хотя они могут существовать в потоке данных, пока свойство Load Enabled в запросе отключено.
  • Вычисляемая таблица не может быть создана в общих потоках данных.
  • Службы AutoML и Cognitive Services недоступны в общих потоках данных.
  • Добавочное обновление не работает в общих потоках данных.

Потоки данных в Premium

Потоки данных, существующие в Premium, имеют следующие рекомендации и ограничения.

Рекомендации по обновлению и данным:

  • При обновлении потоков данных время ожидания составляет 24 часа (нет различий для таблиц и /или потоков данных).
  • Изменение потока данных из политики добавочного обновления на обычное обновление или наоборот удаляет все данные.
  • Изменение схемы потока данных удаляет все данные.
  • При использовании лицензии Premium на пользователя (PPU) с потоками данных данные очищаются при перемещении данных из среды PPU.
  • При обновлении потока данных в контексте "Премиум для каждого пользователя" (PPU) данные не отображаются для пользователей, не являющихся PPU.
  • Инкрементное обновление работает с потоками данных только в том случае, если включен расширенный вычислительный механизм.

Связанные и вычисляемые таблицы:

  • Связанные таблицы могут достигать глубины до 32 ссылочных уровней.
  • Циклические зависимости связанных таблиц не допускаются.
  • Связанная таблица не может быть присоединена к обычной таблице, которая получает данные из локального источника данных.
  • Если запрос (например, запрос A) используется в вычислении другого запроса (запроса B) в потоках данных, запрос B становится вычисляемой таблицей. Вычисляемые таблицы не могут ссылаться на локальные источники.
  • Связанные таблицы, ссылающиеся на сущности в разных арендаторах, не поддерживаются.

Подсистема вычислений:

  • При использовании виртуальной машины Compute происходит увеличение времени на начальный прием данных примерно от 10% до 20%.
    • Это применяется только к первому потоку данных, который находится в подсистеме вычислений, и считывает данные из источника данных.
    • Последующие потоки данных, использующие исходный поток данных, не влекут за собой тот же штраф.
  • Только некоторые операции используют подсистему вычислений и используются только при использовании в связанной таблице или в качестве вычисляемой таблицы. Полный список операций доступен в этой записи блога.

Управление емкостью:

  • По проекту емкости Power BI Premium имеют внутренний управляющий ресурсами, который регулирует рабочие нагрузки разными способами, когда емкость работает с низким объемом памяти.
    • Для потоков данных это давление регулирования уменьшает количество доступных контейнеров M.
    • Память для потоков данных может быть установлена на 100%, с соответствующим размером контейнера в зависимости от размеров данных, а рабочая нагрузка соответствующе управляет количеством контейнеров.
  • Приблизительное количество контейнеров можно определить, разделив общую память, выделенную рабочей нагрузке, на объем памяти, выделенной контейнеру.

Использование потока данных в семантических моделях

  • При создании семантической модели в Power BI Desktop и публикации ее в службе Power BI убедитесь, что учетные данные, используемые в Power BI Desktop для источника данных потоков данных, являются теми же учетными данными, которые используются при публикации семантической модели в службе.
    • Отсутствие одинаковых учетных данных приводит к ошибке ключ не найден при обновлении семантической модели.

Замечание

Если структура потока данных изменена, например новый или переименованный столбец, семантическая модель не отображает изменения. Это изменение также может привести к сбою обновления данных в службе Power BI для семантической модели до обновления в Power BI Desktop и повторной публикации.

Потоки данных и именованные подключения

При использовании потоков данных с именованными подключениями применяются следующие ограничения:

  • Можно создать только одно облачное подключение определенного пути и типа, например, можно создать только одно подключение SQL плюс к серверу или базе данных. Вы можете создать несколько подключений шлюза.
  • Невозможно назвать или переименовать облачные источники данных; можно назвать или переименовать подключения шлюза.

Ограничения ADLS

  • ADLS недоступна в средах GCC, GCC High или DOD. Дополнительные сведения см. в разделе Power BI для клиентов государственных организаций США.
  • Вы должны быть назначены владельцем ресурса из-за изменений в API ADLS 2-го поколения.
  • Миграция подписок Azure не поддерживается, но для этого существует два варианта:
    • Первый подход: после миграции пользователь может отсоединить рабочие области и повторно подключить их. При использовании учетной записи уровня арендатора, необходимо отсоединить все рабочие пространства, затем отсоединить на уровне арендатора и снова подключить. Это может быть нежелательно для клиентов, которые не хотят удалять все их потоки данных или иметь множество рабочих областей.
    • Второй подход: если предыдущий подход не является возможным, отправьте запрос на поддержку, чтобы изменить идентификатор подписки в базе данных.
  • ADLS не поддерживает большинство элементов в списке в разделе "Каталоги и имена файлов " статьи об именовании рабочих областей и именовании потока данных из-за следующих ограничений:
    • Power BI либо возвращает бесполезную ошибку, либо позволяет процессу продолжиться, но обновление завершается сбоем.
  • Подписки ADLS между клиентами не поддерживаются. AdLS, подключенные к Power BI, должны быть частью того же клиента Azure, который Power BI использует для идентификатора Microsoft Entra.

Типы данных Dataflow

Типы данных, поддерживаемые в потоках данных, являются следующими:

Тип данных Mashup Тип данных потокового потока
Время Время
Дата Дата
дата и время дата и время
Часовой пояс даты и времени DateTimeOffset (смещение даты и времени)
Логичный Булевый
Текст Струна
Любое Струна
Валюта Десятичное число
Int8 Int64
Int16 Int64
Int32 Int64
Int64 Int64
Двойной Двойной
Процент Двойной
Один Двойной
Десятичное число Двойной
Номер Двойной
Продолжительность Не поддерживается
Бинарный Не поддерживается
Функция Не поддерживается
Таблица Не поддерживается
Список Не поддерживается
Запись Не поддерживается
Тип Не поддерживается
Действие Не поддерживается
Отсутствует Не поддерживается
Недействительный Не поддерживается

Дополнительные сведения о потоках данных и Power BI см. в следующих статьях.