События
31 мар., 23 - 2 апр., 23
Самое большое событие обучения Fabric, Power BI и SQL. 31 марта – 2 апреля. Используйте код FABINSIDER, чтобы сэкономить $400.
Зарегистрироваться сегодняЭтот браузер больше не поддерживается.
Выполните обновление до Microsoft Edge, чтобы воспользоваться новейшими функциями, обновлениями для системы безопасности и технической поддержкой.
В этом учебнике описывается, как развернуть решение для метрик приложений Apache Spark в кластере Службы Azure Kubernetes (AKS) и интегрировать панели мониторинга Grafana.
Это решение можно использовать для сбора данных метрик Apache Spark и выполнения запросов к ним в реальном времени. Интегрированные панели мониторинга Grafana позволяют диагностировать и отслеживать приложение Apache Spark. Исходный код и конфигурации предоставляются на портале GitHub в виде открытого кода.
Или используйте компонент Azure Cloud Shell, в котором уже есть Azure CLI, клиент Helm и kubectl.
az login
az account set --subscription "<subscription_id>"
Используйте команду Azure CLI, чтобы создать кластер Kubernetes в своей подписке.
az aks create --name <kubernetes_name> --resource-group <kubernetes_resource_group> --location <location> --node-vm-size Standard_D2s_v3
az aks get-credentials --name <kubernetes_name> --resource-group <kubernetes_resource_group>
Примечание. Этот шаг можно пропустить, если у вас уже есть кластер AKS.
az ad sp create-for-rbac --name <service_principal_name> --role Contributor --scopes /subscriptions/<subscription_id>
Результат должен выглядеть следующим образом.
{
"appId": "abcdef...",
"displayName": "<service_principal_name>",
"name": "http://<service_principal_name>",
"password": "abc....",
"tenant": "<tenant_id>"
}
Запишите идентификатор appId, пароль и идентификатор tenantID.
Войдите в свою рабочую область Azure Synapse Analytics в качестве администратора Synapse.
В Synapse Studio в области навигации слева выберите Управление > Управление доступом
Нажмите кнопку "Добавить" в левом верхнем углу, чтобы добавить назначение роли.
В качестве области выберите Рабочая область.
В качестве роли выберите Оператор вычислительной среды Synapse.
В поле "Выбор пользователя" введите <имя_субъекта-службы> и щелкните субъект-службу
Нажмите кнопку Применить (подождите 3 минуты, чтобы разрешение вступило в силу).
Примечание
Убедитесь, что у субъекта-службы есть по крайней мере роль "Читатель" в рабочей области Synapse. Перейдите на вкладку "Управление доступом (IAM)" на портале Azure и проверьте параметры разрешений.
helm repo add synapse-charts https://github.com/microsoft/azure-synapse-spark-metrics/releases/download/helm-chart
helm install spo synapse-charts/synapse-prometheus-operator --create-namespace --namespace spo \
--set synapse.workspaces[0].workspace_name="<workspace_name>" \
--set synapse.workspaces[0].tenant_id="<tenant_id>" \
--set synapse.workspaces[0].service_principal_name="<service_principal_app_id>" \
--set synapse.workspaces[0].service_principal_password="<service_principal_password>" \
--set synapse.workspaces[0].subscription_id="<subscription_id>" \
--set synapse.workspaces[0].resource_group="<workspace_resource_group_name>"
Получите пароль и адрес Grafana по умолчанию. Вы можете изменить этот пароль в параметрах Grafana.
kubectl get secret --namespace spo spo-grafana -o jsonpath="{.data.admin-password}" | base64 --decode ; echo
kubectl -n spo get svc spo-grafana
Получите IP-адрес службы, скопируйте и вставьте этот внешний IP-адрес в браузер, а затем войдите с именем admin и полученным паролем.
Найдите панель мониторинга Synapse в левом верхнем углу страницы Grafana (на домашней странице выберите «Рабочая область Synapse» или «Приложение Synapse»). Попробуйте выполнить пример кода в Synapse Studio и подождите несколько секунд, чтобы получить метрики.>
Кроме того, вы можете использовать панели мониторинга "Synapse Workspace / Workspace" (Рабочая область Synapse: рабочая область) или "Synapse Workspace / Apache Spark pools" (Рабочая область Synapse: пулы Apache Spark), чтобы получить общие сведения о своей рабочей области и пулах Apache Spark.
Удалите компоненты командой Helm, как показано ниже.
helm delete <release_name> -n <namespace>
Удалите кластер AKS.
az aks delete --name <kubernetes_cluster_name> --resource-group <kubernetes_cluster_rg>
Azure Synapse Analytics предоставляет диаграмму Helm на основе Prometheus Operator и соединителя Synapse для Prometheus. На этой диаграмме Helm показаны сервер Prometheus, сервер Grafana и панели мониторинга Grafana для метрик на уровне приложения Apache Spark. Вы можете использовать Prometheus, популярную систему мониторинга с открытым кодом, для сбора данных этих метрик практически в реальном времени, а для визуализации использовать Grafana.
Соединитель Synapse для Prometheus помогает подключить пул Apache Spark для Azure Synapse к серверу Prometheus. Он реализует следующие функции:
Соединитель Synapse для Prometheus выпускается в виде образа Docker, размещаемого в Microsoft Container Registry. Он предоставляется в виде открытого кода и находится в разделе метрик приложений Apache Spark для Azure Synapse.
Prometheus — это набор средств с открытым кодом для мониторинга и оповещения. Набор средств Prometheus был разработан компанией Cloud Native Computing Foundation (CNCF) и де-факто стал стандартом для облачного мониторинга. С помощью Prometheus можно осуществлять сбор, запрос и хранение больших объемов данных временных рядов. Кроме того, это решение легко интегрировать с Grafana. В данном решении мы развертываем компонент Prometheus на основе диаграммы Helm.
Grafana — это программное обеспечение с открытым кодом для визуализации и анализа. Оно позволяет запрашивать, визуализировать и исследовать метрики, а также получать оповещения о них. Azure Synapse Analytics предоставляет набор панелей мониторинга Grafana по умолчанию для визуализации метрик на уровне приложения Apache Spark.
Панель мониторинга "Synapse Workspace / Workspace" (Рабочая область Synapse: рабочая область) предоставляет представление на уровне рабочей области, в котором отображаются все пулы Apache Spark, количество приложений, ядер ЦП и т. д.
Панель мониторинга "Synapse Workspace / Apache Spark pools" (Рабочая область Synapse: пулы Apache Spark) содержит метрики приложений Apache Spark, выполняющихся в выбранном пуле Apache Spark, за определенный период времени.
Панель мониторинга "Synapse Workspace / Apache Spark Application" (Рабочая область Synapse: приложение Apache Spark) содержит выбранное приложение Apache Spark.
Указанные выше шаблоны панелей мониторинга доступны в разделе метрик приложений Apache Spark для Azure Synapse в виде открытого кода.
События
31 мар., 23 - 2 апр., 23
Самое большое событие обучения Fabric, Power BI и SQL. 31 марта – 2 апреля. Используйте код FABINSIDER, чтобы сэкономить $400.
Зарегистрироваться сегодня