Подключение Power BI к Azure Databricks
Microsoft Power BI — это служба бизнес-аналитики, которая предлагает интерактивные визуализации с функциями самостоятельной бизнес-аналитики, позволяя конечным пользователям самостоятельно создавать отчеты и панели мониторинга, не обращаясь к специалистам по информационным технологиям или администраторам баз данных.
При использовании Azure Databricks в качестве источника данных в сочетании с Power BI преимущества производительности и технологических решений Azure Databricks становятся доступны не только специалистам по обработке и анализу данных, но и всем бизнес-пользователям.
Публикация в Power BI Online из Azure Databricks
При использовании Azure Databricks в качестве источника данных с Power BI Online можно создавать наборы данных Power BI из таблиц или схем непосредственно из пользовательского интерфейса Databricks.
Требования
Данные должны находиться в каталоге Unity, а вычислительные ресурсы (кластер) должны быть включены в каталог Unity. Хранилище метаданных Hive в настоящее время не поддерживается.
У вас должна быть лицензия Power BI уровня "Премиум" (емкость уровня "Премиум" или "Премиум") для каждого пользователя.
Для публикации из Databricks в Power BI необходимо предоставить следующие разрешения зарегистрированным приложению идентификатора записи:
- Content.Create
- Dataset.ReadWrite.All
- Workspace.ReadWrite.All
- Report.ReadWrite.All
Дополнительные сведения см. в разделе "Разрешения Microsoft Entra".
Примечание.
Согласие администратора записи обычно требуется для этих разрешений, особенно для доступа на уровне рабочей области и набора данных в Power BI. Ознакомьтесь с запросами на согласие администратора.
В параметрах рабочей области Power BI необходимо включить, чтобы пользователи могли изменять модели данных в служба Power BI (предварительная версия) для изменения семантической модели после публикации. Вы также можете изменить семантику модели с помощью табличного редактора, выполнив подключение с помощью конечной точки XMLA.
Если необходимо включить запись XML в рабочей области Power BI, следуйте инструкциям по этой ссылке .
Если в рабочей области Power BI используется приватная ссылка, необходимо вручную обновить учетные данные источника данных набора данных в Power BI.
Публикация таблиц Azure Databricks в наборе данных Power BI
Войдите в рабочую область Databricks и щелкните "Каталог " на боковой панели, чтобы открыть обозреватель каталогов.
Выберите вычислительный ресурс в раскрывающемся списке в правом верхнем углу.
Откройте каталог и выберите схему или таблицы для публикации. Не выбирайте из хранилища метаданных hive или каталога примеров.
В правом верхнем углу щелкните "Использовать с инструментами бизнес-аналитики" для схемы или "Открыть на панели мониторинга " для таблицы.
Выберите "Опубликовать в рабочей области Power BI".
В диалоговом окне "Подключение к партнеру" нажмите кнопку "Подключиться к идентификатору Microsoft Entra", чтобы пройти проверку подлинности.
В рабочих областях Power BI выберите рабочую область Power BI.
В режиме набора данных выберите DirectQuery или Import.
В методе проверки подлинности в Power BI выберите OAuth или PAT (личный маркер доступа).
Databricks рекомендует использовать OAuth, так как он позволяет точно контролировать доступ и аудит на уровне пользователя. Учетные данные OAuth могут быть настроены на странице параметров набора данных Power BI в учетных данных источника данных. При выборе личного маркера доступа (PAT) от вашего имени создается PAT, чтобы разрешить Power BI получить доступ к семантической модели.
В имени набора данных выберите "Опубликовать как новый набор данных" или "Использовать существующий набор данных".
Нажмите кнопку "Опубликовать" в Power BI.
В течение 10–20 секунд при публикации набора данных нажмите кнопку "Открыть Power BI", чтобы открыть набор данных Power BI на новой вкладке.
Функции и заметки
- При публикации схемы, содержащей несколько таблиц, все таблицы со столбцами публикуются. Таблицы без столбцов не публикуются.
- Комментарии к столбцам таблицы в Azure Databricks копируются в описания соответствующих столбцов в Power BI.
- Связи внешнего ключа сохраняются в опубликованном наборе данных. Однако Power BI поддерживает только один активный путь связи между двумя таблицами. Если в схеме в Azure Databricks присутствует несколько путей, некоторые из соответствующих связей в Power BI неактивны. Позже можно изменить, какие связи активны или неактивны в представлении модели данных в Power BI.
- При использовании OAuth или локального шлюза данных учетные данные могут быть настроены в разделе "Учетные данные источника данных" на странице параметров набора данных Power BI.
Устранение неполадок
Ошибка | Примечания. |
---|---|
"Требуется утверждение" при первом запуске публикации в Power BI | Если вы видите это сообщение, вам потребуется утверждение администратора Записи, прежде чем предоставить разрешения этой функции интеграции. Чтобы утвердить запрос, обратитесь к администратору записи. Следуйте этой ссылке для получения инструкций. |
PowerBINotLicensedException | Убедитесь, что у вас есть лицензия Power BI Premium. |
Не удалось развернуть этот набор данных. Обратитесь к администратору емкости, чтобы убедиться, что поддержка чтения и записи XMLA включена в параметрах емкости Power BI Premium, а затем повторите попытку. Дополнительные сведения см. в разделе "Поддержка чтения и записи XMLA" в документации по продукту. | Обратитесь к администратору емкости Power BI, чтобы включить возможности чтения и записи в конечной точке XMLA в параметрах емкости. Следуйте этой ссылке для получения инструкций. |
Функция конечной точки XMLA отключена. Включите функцию анализа в Excel в PowerBI.com, чтобы включить эту функцию. | Обратитесь к администратору емкости Power BI, чтобы включить возможности чтения и записи в конечной точке XMLA в параметрах емкости. Следуйте этой ссылке для получения инструкций. |
CapacityNotActive | Емкость может быть приостановлена. Чтобы проверить состояние емкости, обратитесь к администратору емкости. |
База данных с именем '<ccon> <ccon> ***</ccon> ' уже существует в рабочей области </ccon> ***. |
Убедитесь, что у вас есть разрешения на создание семантической модели. Затем повторите публикацию в Power BI, чтобы опубликовать семантику модели с добавочным номером версии. |
Режим Direct Lake нельзя использовать вместе с другими режимами хранения в той же модели. Составная модель не поддерживает режим Direct Lake. Удалите неподдерживаемые таблицы или переключите их в режим Direct Lake. | Так как публикация в Power BI создает семантику модели с режимом импорта или DirectQuery, ее нельзя использовать для публикации в существующем наборе данных, использующем режим Direct Lake. Чтобы узнать больше, следуйте этой ссылке . |
Пользователь '<euii> * </euii> ' не имеет разрешения на вызов метода Discover. |
Убедитесь, что вы публикуете в рабочей области Power BI с режимом лицензии Premium. Невозможно опубликовать в рабочей области с режимом лицензии Pro. |
Пользователь "<euii> </euii> " не имеет разрешения на создание нового объекта в "**", или объект не существует. |
У вас может быть роль средства просмотра в рабочей области Power BI. Проверьте, есть ли у вас разрешения на создание семантической модели. Дополнительные сведения см. по этой ссылке . |
"Не удалось обновить учетные данные источника данных: [Майкрософт][ThriftExtension] (14) Непредвиденный ответ с сервера во время HTTP-подключения: возвращен неавторизованный или запрещенный ответ об ошибке, но не получено сообщение с истекшим сроком действия маркера". При редактировании учетных данных источника данных в Power BI | Проверьте, доступна ли рабочая область Databricks. Если рабочая область использует списки Приватный канал или IP-доступа, может потребоваться настроить локальный шлюз Power BI. |
Подключение Power BI Desktop к Azure Databricks
Вы можете подключить Power BI Desktop к кластерам Azure Databricks и хранилищам SQL Databricks. Вы также можете публиковать отчеты Power BI в служба Power BI и предоставить пользователям доступ к базовым данным Azure Databricks с помощью единого входа, передавая те же учетные данные идентификатора Microsoft Entra, которые они используют для доступа к отчету.
Требования
Power BI Desktop 2.85.681.0 или более поздняя версия. Чтобы использовать данные, управляемые каталогом Unity в Power BI, необходимо использовать Power BI Desktop версии 2.98.683.0 или более поздней (выпуск за октябрь 2021 г.).
Примечание.
Для работы Power BI Desktop необходима система Windows. В других операционных системах Power BI Desktop можно запускать на физическом узле или виртуальной машине на основе Windows, а затем подключаться к ней из операционной системы.
Если вы используете версию Power BI Desktop ниже 2.85.681.0, необходимо также установить драйвер ODBC для Databricks в той же среде, что и Power BI Desktop.
Личный маркер доступа Azure Databricks или учетные данные учетной записи идентификатора Microsoft Entra.
Примечание.
В качестве рекомендации по обеспечению безопасности при проверке подлинности с помощью личных маркеров доступа Databricks рекомендует использовать личные маркеры доступа, принадлежащие субъектам-службам, а не пользователям рабочей области. Сведения о создании маркеров для субъектов-служб см. в разделе "Управление маркерами" для субъекта-службы.
Подключение Power BI Desktop к Azure Databricks с помощью Partner Connect
Вы можете использовать Partner Connect для подключения к кластеру или хранилищу SQL из Power BI Desktop всего за несколько щелчков.
Убедитесь, что учетная запись Azure Databricks, рабочая область и пользователь, выполнивший вход, соответствуют требованиям для Partner Connect.
На боковой панели нажмите кнопку Partner Connect.
Щелкните плитку Power BI.
В диалоговом окне Подключение к партнеру для параметра Вычислительная среда выберите имя вычислительного ресурса Azure Databricks, который требуется подключить.
Выберите Скачать файл подключения.
Откройте скачанный файл подключения, который запустит Power BI Desktop.
В Power BI Desktop введите учетные данные для проверки подлинности:
- Личный маркер доступа. Введите личный маркер доступа Azure Databricks.
- Идентификатор Microsoft Entra: нажмите кнопку " Войти" , а затем следуйте инструкциям на экране.
- Имя пользователя и пароль: неприменимо.
Щелкните Подключить.
Выберите данные Azure Databricks для запроса в навигаторе Power BI.
Подключение Power BI Desktop к Azure Databricks вручную
Следуйте этим инструкциям в зависимости от выбранного метода проверки подлинности, чтобы подключиться к кластеру или хранилищу SQL с помощью Power BI Desktop. При использовании Power BI в режиме DirectQuery рекомендуется использовать хранилища SQL Databricks.
Примечание.
Чтобы ускорить подключение к Power BI Desktop, используйте Partner Connect.
Получите имя узла сервера и путь HTTP.
Запустите Power BI Desktop.
Щелкните Получить данные или выберите Файл > Получить данные.
Щелкните Получить данные, чтобы начать работу.
Найдите Databricks, а затем щелкните соединитель:
- Azure Databricks
Щелкните Подключить.
Введите имя узла сервера и путь HTTP.
Выберите режим подключения к данным. Сведения о разнице между импортом и DirectQuery см. в разделе Использование DirectQuery в Power BI Desktop.
Щелкните OK.
Щелкните метод проверки подлинности:
- Личный маркер доступа. Введите личный маркер доступа Azure Databricks.
- Идентификатор Microsoft Entra: нажмите кнопку " Войти" , а затем следуйте инструкциям на экране.
- Имя пользователя и пароль: неприменимо.
Щелкните Подключить.
Выберите данные Azure Databricks для запроса в навигаторе Power BI. Если для рабочей области включен каталог Unity, выберите каталог, прежде чем выбирать схему и таблицу.
Выполнение пользовательского SQL-запроса
Соединитель Databricks предоставляет источник данных Databricks.Query
, позволяющий выполнять пользовательский SQL-запрос.
Выполните действия, описанные в разделе Подключение с помощью Power BI Desktop, чтобы создать подключение к данным в режиме импорта.
В разделе Навигаторе щелкните правой кнопкой мыши верхний элемент, содержащий выбранное имя узла и путь HTTP, и нажмите Преобразовать данные, чтобы открыть Редактор Power Query.
На панели функций замените имя функции
Databricks.Catalogs
наDatabricks.Query
и примените это изменение. При этом создается функция Power Query, которая принимает SQL-запрос в качестве параметра.Введите SQL-запрос в поле параметра и нажмите кнопку "Вызвать". При этом выполняется запрос и создается таблица с его результатами.
Доступ к источнику данных Azure Databricks с помощью службы Power BI
При публикации отчета в служба Power BI вы подключаетесь к Azure Databricks с помощью личного маркера доступа. В служба Power BI можно также включить единый вход ( единый вход), чтобы пользователи могли получать доступ к отчетам, созданным с помощью режима хранения DirectQuery, передав учетные данные идентификатора Microsoft Entra в Azure Databricks.
Опубликуйте свой отчет Power BI из Power BI Desktop в службе Power BI.
Включите доступ с помощью единого входа (SSO) к отчету и базовому источнику данных.
- Перейдите к базовому набору данных Azure Databricks для отчета в службе Power BI, разверните узел Учетные данные источника данных и щелкните Изменить учетные данные.
- В диалоговом окне конфигурации выберите Средства просмотра отчетов могут получать доступ к этому источнику данных только с помощью собственных идентификаторов Power BI с использованием Direct Query и нажмите кнопку войти.
При выборе этого параметра доступ к источнику данных обрабатывается с помощью DirectQuery и управляется с помощью удостоверения идентификатора Microsoft Entra пользователя, который обращается к отчету. Если этот параметр не выбран, то доступ к источнику данных Azure Databricks будет только у вас как у пользователя, опубликовавшего отчет.
Автоматическое обнаружение прокси-сервера HTTP
Power BI Desktop версии 2.104.941.0 и выше (выпуск за май 2022 г.) имеет встроенную поддержку для определения общесистемной конфигурации HTTP-прокси для Windows.
Power BI Desktop может автоматически обнаруживать и использовать общесистемную конфигурацию прокси-сервера HTTP для Windows.
Если прокси-сервер не предоставляет точку распространения CRL (CDP), Power BI может отобразить следующее сообщение об ошибке:
Details: "ODBC: ERROR [HY000] [Microsoft][DriverSupport] (1200)
-The revocation status of the certificate or one of the certificates in the certificate chain is unknown."
Чтобы устранить эту ошибку:
Создайте файл
C:\Program Files\Microsoft Power BI Desktop\bin\ODBC Drivers\Simba Spark ODBC Driver\microsoft.sparkodbc.ini
, если он не существует.Добавьте в файл
microsoft.sparkodbc.ini
следующий код.[Driver] CheckCertRevocation=0
Соединитель разностного общего доступа Power BI
Соединитель Power BI Delta Sharing позволяет пользователям обнаруживать, анализировать и визуализировать наборы данных, к которым они используются с помощью открытого протокола Delta Sharing . Этот протокол обеспечивает безопасный обмен наборами данных между продуктами и платформами с использованием REST и облачного хранилища.
Инструкции по подключению см. в статье Power BI: чтение общих данных.
Ограничения
- Соединитель Azure Databricks поддерживает веб-прокси. Однако автоматические параметры прокси-сервера, определенные в PAC-файлах, не поддерживаются.
- В соединителе Azure Databricks источник данных
Databricks.Query
не поддерживается в сочетании с режимом DirectQuery. - Данные, которые загружает соединитель Delta Sharing, должны соответствовать памяти компьютера. Для этого соединитель ограничивает число импортируемых строк до установленного ранее максимального числа.