Поделиться через


Подключение Power BI к Azure Databricks

Microsoft Power BI — это служба бизнес-аналитики, которая предлагает интерактивные визуализации с функциями самостоятельной бизнес-аналитики, позволяя конечным пользователям самостоятельно создавать отчеты и панели мониторинга, не обращаясь к специалистам по информационным технологиям или администраторам баз данных.

При использовании Azure Databricks в качестве источника данных в сочетании с Power BI преимущества производительности и технологических решений Azure Databricks становятся доступны не только специалистам по обработке и анализу данных, но и всем бизнес-пользователям.

Публикация в Power BI Online из Azure Databricks

При использовании Azure Databricks в качестве источника данных с Power BI Online можно создавать наборы данных Power BI из таблиц или схем непосредственно из пользовательского интерфейса Databricks.

Требования

  • Данные должны находиться в каталоге Unity, а вычислительные ресурсы (кластер) должны быть включены в каталог Unity. Хранилище метаданных Hive в настоящее время не поддерживается.

  • У вас должна быть лицензия Power BI уровня "Премиум" (емкость уровня "Премиум" или "Премиум") для каждого пользователя.

  • Для публикации из Databricks в Power BI необходимо предоставить следующие разрешения зарегистрированным приложению идентификатора записи:

    • Content.Create
    • Dataset.ReadWrite.All
    • Workspace.ReadWrite.All
    • Report.ReadWrite.All

    Дополнительные сведения см. в разделе "Разрешения Microsoft Entra".

    Примечание.

    Согласие администратора записи обычно требуется для этих разрешений, особенно для доступа на уровне рабочей области и набора данных в Power BI. Ознакомьтесь с запросами на согласие администратора.

  • В параметрах рабочей области Power BI необходимо включить, чтобы пользователи могли изменять модели данных в служба Power BI (предварительная версия) для изменения семантической модели после публикации. Вы также можете изменить семантику модели с помощью табличного редактора, выполнив подключение с помощью конечной точки XMLA.

  • Если необходимо включить запись XML в рабочей области Power BI, следуйте инструкциям по этой ссылке .

  • Если в рабочей области Power BI используется приватная ссылка, необходимо вручную обновить учетные данные источника данных набора данных в Power BI.

Публикация таблиц Azure Databricks в наборе данных Power BI

  1. Войдите в рабочую область Databricks и щелкните Значок каталога "Каталог " на боковой панели, чтобы открыть обозреватель каталогов.

  2. Выберите вычислительный ресурс в раскрывающемся списке в правом верхнем углу.

  3. Откройте каталог и выберите схему или таблицы для публикации. Не выбирайте из хранилища метаданных hive или каталога примеров.

  4. В правом верхнем углу щелкните "Использовать с инструментами бизнес-аналитики" для схемы или "Открыть на панели мониторинга " для таблицы.

  5. Выберите "Опубликовать в рабочей области Power BI".

  6. В диалоговом окне "Подключение к партнеру" нажмите кнопку "Подключиться к идентификатору Microsoft Entra", чтобы пройти проверку подлинности.

  7. В рабочих областях Power BI выберите рабочую область Power BI.

  8. В режиме набора данных выберите DirectQuery или Import.

  9. В методе проверки подлинности в Power BI выберите OAuth или PAT (личный маркер доступа).

    Databricks рекомендует использовать OAuth, так как он позволяет точно контролировать доступ и аудит на уровне пользователя. Учетные данные OAuth могут быть настроены на странице параметров набора данных Power BI в учетных данных источника данных. При выборе личного маркера доступа (PAT) от вашего имени создается PAT, чтобы разрешить Power BI получить доступ к семантической модели.

  10. В имени набора данных выберите "Опубликовать как новый набор данных" или "Использовать существующий набор данных".

  11. Нажмите кнопку "Опубликовать" в Power BI.

  12. В течение 10–20 секунд при публикации набора данных нажмите кнопку "Открыть Power BI", чтобы открыть набор данных Power BI на новой вкладке.

Функции и заметки

  • При публикации схемы, содержащей несколько таблиц, все таблицы со столбцами публикуются. Таблицы без столбцов не публикуются.
  • Комментарии к столбцам таблицы в Azure Databricks копируются в описания соответствующих столбцов в Power BI.
  • Связи внешнего ключа сохраняются в опубликованном наборе данных. Однако Power BI поддерживает только один активный путь связи между двумя таблицами. Если в схеме в Azure Databricks присутствует несколько путей, некоторые из соответствующих связей в Power BI неактивны. Позже можно изменить, какие связи активны или неактивны в представлении модели данных в Power BI.
  • При использовании OAuth или локального шлюза данных учетные данные могут быть настроены в разделе "Учетные данные источника данных" на странице параметров набора данных Power BI.

Устранение неполадок

Ошибка Примечания.
"Требуется утверждение" при первом запуске публикации в Power BI Если вы видите это сообщение, вам потребуется утверждение администратора Записи, прежде чем предоставить разрешения этой функции интеграции. Чтобы утвердить запрос, обратитесь к администратору записи. Следуйте этой ссылке для получения инструкций.
PowerBINotLicensedException Убедитесь, что у вас есть лицензия Power BI Premium.
Не удалось развернуть этот набор данных. Обратитесь к администратору емкости, чтобы убедиться, что поддержка чтения и записи XMLA включена в параметрах емкости Power BI Premium, а затем повторите попытку. Дополнительные сведения см. в разделе "Поддержка чтения и записи XMLA" в документации по продукту. Обратитесь к администратору емкости Power BI, чтобы включить возможности чтения и записи в конечной точке XMLA в параметрах емкости. Следуйте этой ссылке для получения инструкций.
Функция конечной точки XMLA отключена. Включите функцию анализа в Excel в PowerBI.com, чтобы включить эту функцию. Обратитесь к администратору емкости Power BI, чтобы включить возможности чтения и записи в конечной точке XMLA в параметрах емкости. Следуйте этой ссылке для получения инструкций.
CapacityNotActive Емкость может быть приостановлена. Чтобы проверить состояние емкости, обратитесь к администратору емкости.
База данных с именем '<ccon><ccon>***</ccon>' уже существует в рабочей области </ccon>***. Убедитесь, что у вас есть разрешения на создание семантической модели. Затем повторите публикацию в Power BI, чтобы опубликовать семантику модели с добавочным номером версии.
Режим Direct Lake нельзя использовать вместе с другими режимами хранения в той же модели. Составная модель не поддерживает режим Direct Lake. Удалите неподдерживаемые таблицы или переключите их в режим Direct Lake. Так как публикация в Power BI создает семантику модели с режимом импорта или DirectQuery, ее нельзя использовать для публикации в существующем наборе данных, использующем режим Direct Lake. Чтобы узнать больше, следуйте этой ссылке .
Пользователь '<euii>* </euii>' не имеет разрешения на вызов метода Discover. Убедитесь, что вы публикуете в рабочей области Power BI с режимом лицензии Premium. Невозможно опубликовать в рабочей области с режимом лицензии Pro.
Пользователь "<euii> </euii>" не имеет разрешения на создание нового объекта в "**", или объект не существует. У вас может быть роль средства просмотра в рабочей области Power BI. Проверьте, есть ли у вас разрешения на создание семантической модели. Дополнительные сведения см. по этой ссылке .
"Не удалось обновить учетные данные источника данных: [Майкрософт][ThriftExtension] (14) Непредвиденный ответ с сервера во время HTTP-подключения: возвращен неавторизованный или запрещенный ответ об ошибке, но не получено сообщение с истекшим сроком действия маркера". При редактировании учетных данных источника данных в Power BI Проверьте, доступна ли рабочая область Databricks. Если рабочая область использует списки Приватный канал или IP-доступа, может потребоваться настроить локальный шлюз Power BI.

Подключение Power BI Desktop к Azure Databricks

Вы можете подключить Power BI Desktop к кластерам Azure Databricks и хранилищам SQL Databricks. Вы также можете публиковать отчеты Power BI в служба Power BI и предоставить пользователям доступ к базовым данным Azure Databricks с помощью единого входа, передавая те же учетные данные идентификатора Microsoft Entra, которые они используют для доступа к отчету.

Требования

  • Power BI Desktop 2.85.681.0 или более поздняя версия. Чтобы использовать данные, управляемые каталогом Unity в Power BI, необходимо использовать Power BI Desktop версии 2.98.683.0 или более поздней (выпуск за октябрь 2021 г.).

    Примечание.

    Для работы Power BI Desktop необходима система Windows. В других операционных системах Power BI Desktop можно запускать на физическом узле или виртуальной машине на основе Windows, а затем подключаться к ней из операционной системы.

    Если вы используете версию Power BI Desktop ниже 2.85.681.0, необходимо также установить драйвер ODBC для Databricks в той же среде, что и Power BI Desktop.

  • Личный маркер доступа Azure Databricks или учетные данные учетной записи идентификатора Microsoft Entra.

    Примечание.

    В качестве рекомендации по обеспечению безопасности при проверке подлинности с помощью личных маркеров доступа Databricks рекомендует использовать личные маркеры доступа, принадлежащие субъектам-службам, а не пользователям рабочей области. Сведения о создании маркеров для субъектов-служб см. в разделе "Управление маркерами" для субъекта-службы.

  • Кластер Azure Databricks или хранилище Databricks SQL.

Подключение Power BI Desktop к Azure Databricks с помощью Partner Connect

Вы можете использовать Partner Connect для подключения к кластеру или хранилищу SQL из Power BI Desktop всего за несколько щелчков.

  1. Убедитесь, что учетная запись Azure Databricks, рабочая область и пользователь, выполнивший вход, соответствуют требованиям для Partner Connect.

  2. На боковой панели нажмите кнопку Кнопка Partner Connect.

  3. Щелкните плитку Power BI.

  4. В диалоговом окне Подключение к партнеру для параметра Вычислительная среда выберите имя вычислительного ресурса Azure Databricks, который требуется подключить.

  5. Выберите Скачать файл подключения.

  6. Откройте скачанный файл подключения, который запустит Power BI Desktop.

  7. В Power BI Desktop введите учетные данные для проверки подлинности:

    • Личный маркер доступа. Введите личный маркер доступа Azure Databricks.
    • Идентификатор Microsoft Entra: нажмите кнопку " Войти" , а затем следуйте инструкциям на экране.
    • Имя пользователя и пароль: неприменимо.
  8. Щелкните Подключить.

  9. Выберите данные Azure Databricks для запроса в навигаторе Power BI.

    Навигатор Power BI

Подключение Power BI Desktop к Azure Databricks вручную

Следуйте этим инструкциям в зависимости от выбранного метода проверки подлинности, чтобы подключиться к кластеру или хранилищу SQL с помощью Power BI Desktop. При использовании Power BI в режиме DirectQuery рекомендуется использовать хранилища SQL Databricks.

Примечание.

Чтобы ускорить подключение к Power BI Desktop, используйте Partner Connect.

  1. Получите имя узла сервера и путь HTTP.

  2. Запустите Power BI Desktop.

  3. Щелкните Получить данные или выберите Файл > Получить данные.

  4. Щелкните Получить данные, чтобы начать работу.

  5. Найдите Databricks, а затем щелкните соединитель:

    • Azure Databricks
  6. Щелкните Подключить.

  7. Введите имя узла сервера и путь HTTP.

  8. Выберите режим подключения к данным. Сведения о разнице между импортом и DirectQuery см. в разделе Использование DirectQuery в Power BI Desktop.

  9. Щелкните OK.

  10. Щелкните метод проверки подлинности:

    • Личный маркер доступа. Введите личный маркер доступа Azure Databricks.
    • Идентификатор Microsoft Entra: нажмите кнопку " Войти" , а затем следуйте инструкциям на экране.
    • Имя пользователя и пароль: неприменимо.
  11. Щелкните Подключить.

  12. Выберите данные Azure Databricks для запроса в навигаторе Power BI. Если для рабочей области включен каталог Unity, выберите каталог, прежде чем выбирать схему и таблицу.

    Навигатор Power BI

Выполнение пользовательского SQL-запроса

Соединитель Databricks предоставляет источник данных Databricks.Query, позволяющий выполнять пользовательский SQL-запрос.

  1. Выполните действия, описанные в разделе Подключение с помощью Power BI Desktop, чтобы создать подключение к данным в режиме импорта.

  2. В разделе Навигаторе щелкните правой кнопкой мыши верхний элемент, содержащий выбранное имя узла и путь HTTP, и нажмите Преобразовать данные, чтобы открыть Редактор Power Query.

    Щелчок

  3. На панели функций замените имя функции Databricks.Catalogs на Databricks.Query и примените это изменение. При этом создается функция Power Query, которая принимает SQL-запрос в качестве параметра.

  4. Введите SQL-запрос в поле параметра и нажмите кнопку "Вызвать". При этом выполняется запрос и создается таблица с его результатами.

Доступ к источнику данных Azure Databricks с помощью службы Power BI

При публикации отчета в служба Power BI вы подключаетесь к Azure Databricks с помощью личного маркера доступа. В служба Power BI можно также включить единый вход ( единый вход), чтобы пользователи могли получать доступ к отчетам, созданным с помощью режима хранения DirectQuery, передав учетные данные идентификатора Microsoft Entra в Azure Databricks.

  1. Опубликуйте свой отчет Power BI из Power BI Desktop в службе Power BI.

  2. Включите доступ с помощью единого входа (SSO) к отчету и базовому источнику данных.

    1. Перейдите к базовому набору данных Azure Databricks для отчета в службе Power BI, разверните узел Учетные данные источника данных и щелкните Изменить учетные данные.
    2. В диалоговом окне конфигурации выберите Средства просмотра отчетов могут получать доступ к этому источнику данных только с помощью собственных идентификаторов Power BI с использованием Direct Query и нажмите кнопку войти.

    Включение единого входа для доступа к данным Databricks

    При выборе этого параметра доступ к источнику данных обрабатывается с помощью DirectQuery и управляется с помощью удостоверения идентификатора Microsoft Entra пользователя, который обращается к отчету. Если этот параметр не выбран, то доступ к источнику данных Azure Databricks будет только у вас как у пользователя, опубликовавшего отчет.

Автоматическое обнаружение прокси-сервера HTTP

Power BI Desktop версии 2.104.941.0 и выше (выпуск за май 2022 г.) имеет встроенную поддержку для определения общесистемной конфигурации HTTP-прокси для Windows.

Power BI Desktop может автоматически обнаруживать и использовать общесистемную конфигурацию прокси-сервера HTTP для Windows.

Если прокси-сервер не предоставляет точку распространения CRL (CDP), Power BI может отобразить следующее сообщение об ошибке:

Details: "ODBC: ERROR [HY000] [Microsoft][DriverSupport] (1200)
-The revocation status of the certificate or one of the certificates in the certificate chain is unknown."

Чтобы устранить эту ошибку:

  1. Создайте файл C:\Program Files\Microsoft Power BI Desktop\bin\ODBC Drivers\Simba Spark ODBC Driver\microsoft.sparkodbc.ini, если он не существует.

  2. Добавьте в файл microsoft.sparkodbc.ini следующий код.

    [Driver]
    CheckCertRevocation=0
    

Соединитель разностного общего доступа Power BI

Соединитель Power BI Delta Sharing позволяет пользователям обнаруживать, анализировать и визуализировать наборы данных, к которым они используются с помощью открытого протокола Delta Sharing . Этот протокол обеспечивает безопасный обмен наборами данных между продуктами и платформами с использованием REST и облачного хранилища.

Инструкции по подключению см. в статье Power BI: чтение общих данных.

Ограничения

  • Соединитель Azure Databricks поддерживает веб-прокси. Однако автоматические параметры прокси-сервера, определенные в PAC-файлах, не поддерживаются.
  • В соединителе Azure Databricks источник данных Databricks.Query не поддерживается в сочетании с режимом DirectQuery.
  • Данные, которые загружает соединитель Delta Sharing, должны соответствовать памяти компьютера. Для этого соединитель ограничивает число импортируемых строк до установленного ранее максимального числа.

Дополнительные ресурсы

Поддержка